计算机科学>多智能体系统
标题: 在多代理隐藏角色游戏中学习欺骗
摘要: 欺骗在人类社会环境中普遍存在。 然而,关于欺骗对强化学习算法的影响的研究仅限于简单的设置,限制了其对复杂现实问题的适用性。 本文通过引入一种新的混合竞争合作多智能体强化学习(MARL)环境来解决这一问题,该环境受流行的基于角色的欺骗游戏(如狼人、阿瓦隆和我们之中)的启发。 环境的独特挑战在于必须与其他代理人合作,尽管不知道他们是朋友还是敌人。 此外,我们引入了一种欺骗模型,称之为贝叶斯信念操纵(BBM),并证明了它在这种环境下欺骗其他代理的有效性,同时也提高了欺骗代理的性能。