×

在多智能体强化学习中扩展马尔可夫博弈学习多任务。 (英语) Zbl 1464.68315号

De Giacomo,Giuseppe(编辑)等人,《2020年ECAI》。第24届欧洲人工智能会议,2020年8月29日至9月8日,西班牙圣地亚哥·德孔波斯特拉。包括第十届人工智能应用大会,PAIS 2020。阿姆斯特丹:IOS出版社。前面。Artif公司。智力。申请。325, 139-146 (2020).
摘要:形式化方法与强化学习(RL)的结合最近引起了人们的兴趣,作为单代理RL学习多任务规范的一种方法。在本文中,我们将这种收敛性扩展到多智能体设置,并将扩展马尔可夫博弈正式定义为一个通用数学模型,该模型允许多个RL智能体同时学习各种非马尔可夫规范。为了引入这个新模型,我们提供了在这个框架上运行的RL算法的形式化定义和证明以及实证测试。具体来说,我们使用我们的模型训练了两种不同的基于逻辑的多代理RL算法,以解决非马尔可夫共同安全LTL规范的不同设置。
关于整个系列,请参见[Zbl 1456.68006号].

MSC公司:

68T05型 人工智能中的学习和自适应系统
第68季度第60季度 规范和验证(程序逻辑、模型检查等)
68T42型 Agent技术与人工智能
91A15型 随机对策,随机微分对策
PDF格式BibTeX公司 XML格式引用