令人惊叹的 swMATH ID: 40128 软件作者: 文森特·科尼策;托马斯·桑德霍姆 描述: AWESOME:一种通用的多智能体学习算法,在自我游戏中收敛,并在对抗静止对手时学习最佳响应。令人满意的多智能体学习算法的两个最低要求是它(1)。学会与静止的对手进行最佳对抗。在自我游戏中收敛到纳什均衡。之前最接近的算法WoLF-IGA已经被证明在2人2动作(重复)游戏中具有这两个属性——假设对手的混合策略是可观察的。另一种算法ReDVaLeR(在本文描述的算法之后引入)在具有任意数量动作和玩家的游戏中实现了这两个属性,但仍然要求对手的混合策略是可观察的。在本文中,我们提出了AWESOME,这是第一个在具有任意数量的动作和玩家的游戏中保证具有这两个属性的算法。它仍然是唯一一个这样做的算法,同时只依赖于观察其他玩家的实际行动(而不是他们的混合策略)。它还学习如何以最佳状态对抗最终变得静止不动的对手。AWESOME背后的基本思想(当每个人都静止时进行调整,否则达到平衡)是在其他人的策略看起来静止时尝试进行调整,但否则会退回到预先计算的平衡策略。我们提供的实验结果表明,AWESOME在实践中收敛速度很快。用于证明AWESOME属性的技术与以前的算法有着根本的不同,并且可能有助于分析未来的多智能体学习算法。 主页: https://link.springer.com/article/10.1007%2Fs10994-006-0143-1 关键词: 博弈论;在游戏中学习;纳什均衡 相关软件: R-最大;普里巴斯;阿尔法零;AlexNet公司;张紧器2传感器;DeepStack公司;ImageNet公司;黑斑羚;亚当;天秤座;CP网络;TEXPLORE公司;韦卡;阿达·布斯特。MH公司;GAMUT公司 引用于: 12文件 标准条款 1出版物描述软件,包括1出版物在zbMATH中 年份 AWESOME:一种通用的多智能体学习算法,在自我游戏中收敛,学习对静止对手的最佳响应。 Zbl 1471.91075号文森特·科尼策;托马斯·桑德霍姆 2007 全部的 前5名29位作者引用 2 斯特凡诺·阿尔布雷赫特(Stefano V.Albrecht)。 2 费利克斯·布兰特 2 雅各布·W·克兰德尔。 2 费利克斯·费舍尔 2 保罗·哈伦斯坦 2 托马斯·桑德霍姆。 1 约拉姆州巴克拉赫 1 塞缪尔·巴雷特 1 塔梅尔·巴沙尔 1 文森特·科尼策 1 Czarnecki、Wojciech Marian 1 理查德·埃弗雷特 1 迈克尔·A·古德里奇。 1 索尔·格雷佩尔 1 爱德华·休斯。 1 迈克尔·约翰逊 1 萨里特·克劳斯 1 马克·兰科特 1 安吉利基·拉扎里杜 1 Joel Z.雷波。 1 胡安·帕拉斯 1 鲍尔斯,罗伯 1 苏布拉曼尼亚拉马穆尔西 1 阿维·罗森菲尔德 1 约夫·肖姆 1 Vu,Thuc D.(星期四·D)。 1 杨卓然 1 圣地亚哥扎佐 1 张凯庆 4篇连载文章中引用 5 人工智能 三 机器学习 1 应用数学与计算 1 计算系统理论 在2个字段中引用 9 博弈论、经济学、金融和其他社会和行为科学(91-XX) 8 计算机科学(68-XX) 按年份列出的引文