×

令人惊叹的

swMATH ID: 40128
软件作者: 文森特·科尼策;托马斯·桑德霍姆
描述: AWESOME:一种通用的多智能体学习算法,在自我游戏中收敛,并在对抗静止对手时学习最佳响应。令人满意的多智能体学习算法的两个最低要求是它(1)。学会与静止的对手进行最佳对抗。在自我游戏中收敛到纳什均衡。之前最接近的算法WoLF-IGA已经被证明在2人2动作(重复)游戏中具有这两个属性——假设对手的混合策略是可观察的。另一种算法ReDVaLeR(在本文描述的算法之后引入)在具有任意数量动作和玩家的游戏中实现了这两个属性,但仍然要求对手的混合策略是可观察的。在本文中,我们提出了AWESOME,这是第一个在具有任意数量的动作和玩家的游戏中保证具有这两个属性的算法。它仍然是唯一一个这样做的算法,同时只依赖于观察其他玩家的实际行动(而不是他们的混合策略)。它还学习如何以最佳状态对抗最终变得静止不动的对手。AWESOME背后的基本思想(当每个人都静止时进行调整,否则达到平衡)是在其他人的策略看起来静止时尝试进行调整,但否则会退回到预先计算的平衡策略。我们提供的实验结果表明,AWESOME在实践中收敛速度很快。用于证明AWESOME属性的技术与以前的算法有着根本的不同,并且可能有助于分析未来的多智能体学习算法。
主页: https://link.springer.com/article/10.1007%2Fs10994-006-0143-1
关键词: 博弈论;在游戏中学习;纳什均衡
相关软件: R-最大;普里巴斯;阿尔法零;AlexNet公司;张紧器2传感器;DeepStack公司;ImageNet公司;黑斑羚;亚当;天秤座;CP网络;TEXPLORE公司;韦卡;阿达·布斯特。MH公司;GAMUT公司
引用于: 12文件

按年份列出的引文