×

博弈论推理与机器学习的相似性。 (英语) Zbl 1165.91344号

小结:我们阐明了博弈论中的推理与机器学习之间的等价性。我们这样做的目的是在两个领域之间建立一个等价的词汇表,以促进两个领域交叉点的发展,并且为了证明这种方法的有用性,我们利用每个领域的最新发展来对另一个领域进行有益的改进。更具体地说,我们考虑了虚构游戏中平滑的最佳反应和贝叶斯推理方法之间的类比。最初,我们利用这些见解开发并演示了一种改进的基于概率调节的游戏学习算法。也就是说,通过整合对手策略的分布(机器学习中的贝叶斯方法),而不是采用简单的经验平均值(标准虚拟游戏中使用的方法)我们推导了一种新的慢化虚拟博弈算法,并证明了在简单协调博弈中,它比标准虚拟博弈更有可能收敛到以收益为主导但风险为主导的纳什均衡。此外,我们考虑了相反的情况,并展示了如何利用博弈论的见解来推导两种改进的平均场变分学习算法。我们首先证明平均场变分学习的标准更新规则类似于博弈论中的古诺调整。通过与虚拟游戏的类比,我们提出了一种改进的更新规则,并表明这将导致虚拟变分游戏,即改进的平均场变分学习算法,在高度或强连接的图形模型中表现出更好的收敛性。其次,我们利用虚拟游戏的最新进展,即动态虚拟游戏,推导出一种导数动作变分学习算法,该算法在典型机器学习问题(聚类混合分布)上表现出优越的收敛性。

MSC公司:

91A80型 博弈论的应用
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用