文件Zbl 1165.91344-zbMATH Open

我·雷泽克。;莱斯利，D.S。;里斯，S。;罗伯茨，S.J。;A.罗杰斯。;Dash，R.K。;新泽西州詹宁斯。

博弈论推理与机器学习的相似性。（英语） Zbl 1165.91344号

J.阿蒂夫。智力。研究（JAIR） 33, 259-283 (2008).

小结：我们阐明了博弈论中的推理与机器学习之间的等价性。我们这样做的目的是在两个领域之间建立一个等价的词汇表，以促进两个领域交叉点的发展，并且为了证明这种方法的有用性，我们利用每个领域的最新发展来对另一个领域进行有益的改进。更具体地说，我们考虑了虚构游戏中平滑的最佳反应和贝叶斯推理方法之间的类比。最初，我们利用这些见解开发并演示了一种改进的基于概率调节的游戏学习算法。也就是说，通过整合对手策略的分布（机器学习中的贝叶斯方法），而不是采用简单的经验平均值（标准虚拟游戏中使用的方法）我们推导了一种新的慢化虚拟博弈算法，并证明了在简单协调博弈中，它比标准虚拟博弈更有可能收敛到以收益为主导但风险为主导的纳什均衡。此外，我们考虑了相反的情况，并展示了如何利用博弈论的见解来推导两种改进的平均场变分学习算法。我们首先证明平均场变分学习的标准更新规则类似于博弈论中的古诺调整。通过与虚拟游戏的类比，我们提出了一种改进的更新规则，并表明这将导致虚拟变分游戏，即改进的平均场变分学习算法，在高度或强连接的图形模型中表现出更好的收敛性。其次，我们利用虚拟游戏的最新进展，即动态虚拟游戏，推导出一种导数动作变分学习算法，该算法在典型机器学习问题（聚类混合分布）上表现出优越的收敛性。

引用于1文件

MSC公司：

91A80型	博弈论的应用
68T05型	人工智能中的学习和自适应系统

PDF格式 BibTeX公司 XML格式引用

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
！ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

博弈论推理与机器学习的相似性。（英语） Zbl 1165.91344号

MSC公司：

示例

领域

操作员

博弈论推理与机器学习的相似性。 （英语） Zbl 1165.91344号

MSC公司：

博弈论推理与机器学习的相似性。（英语） Zbl 1165.91344号