Learning to Deceive in Multi-Agent Hidden Role Games

Aitchison, Matthew; Benke, Lyndon; Sweetser, Penny

doi:10.1007/978-3-030-91779-1_5

计算机科学>多智能体系统

arXiv:2209.01551（cs）

【2022年9月4日提交】

标题：在多代理隐藏角色游戏中学习欺骗

作者：马修·艾奇森,林登·本克,Penny Sweetser公司

查看PDF

摘要：欺骗在人类社会环境中普遍存在。然而，关于欺骗对强化学习算法的影响的研究仅限于简单的设置，限制了其对复杂现实问题的适用性。本文通过引入一种新的混合竞争合作多智能体强化学习（MARL）环境来解决这一问题，该环境受流行的基于角色的欺骗游戏（如狼人、阿瓦隆和我们之中）的启发。环境的独特挑战在于必须与其他代理人合作，尽管不知道他们是朋友还是敌人。此外，我们引入了一种欺骗模型，称之为贝叶斯信念操纵（BBM），并证明了它在这种环境下欺骗其他代理的有效性，同时也提高了欺骗代理的性能。

学科：	多代理系统（cs.MA）
引用为：	arXiv公司：2209.01551[cs.马萨诸塞州]
	（或 arXiv:2209.01551v1[cs.马萨诸塞州]对于此版本）
	https://doi.org/10.48550/arXiv.2209.01551
日志参考：	In:欺骗人工智能。DeceptECAI DeceptAI 2020 2021。《计算机与信息科学通信》，第1296卷。施普林格，商会（2021）
相关DOI:	https://doi.org/10.1007/978-3-030-91779-1_5

提交历史记录

发件人：Matthew Aitchison[查看电子邮件]
[第1版]2022年9月4日星期日07:35:23 UTC（1898 KB）

全文链接：

访问纸张：

查看许可证

当前浏览上下文：

反恐精英。妈妈

<上一版本 | 下一个>

新的 | 最近的 |2022-09

更改为浏览方式：

反恐精英

参考文献和引文

导出BibTeX引文

计算机科学>多智能体系统

标题：在多代理隐藏角色游戏中学习欺骗

提交历史记录

访问纸张：

参考文献和引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目

计算机科学>多智能体系统

标题：在多代理隐藏角色游戏中学习欺骗

提交历史记录

访问纸张：

参考文献和引文

BibTeX格式的引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目