Foolproof Cooperative Learning

Alexis Jacq; Julien Perolat; Matthieu Geist; Olivier Pietquin

愚蠢的合作学习

亚历克西斯·雅克、朱利安·佩罗拉特、马蒂厄·盖斯特、奥利维尔·皮特金

第十二届亚洲机器学习会议记录，PMLR 129:401-4162020年。

摘要

本文将学习算法和学习均衡的概念从重复博弈理论扩展到随机博弈。我们引入了防愚合作学习（FCL）算法，该算法收敛到一种均衡策略，允许在自娱自乐的环境中使用合作策略，而不会被自私的学习者利用。通过构造，FCL是重复对称博弈的学习均衡。我们说明了FCL在对称矩阵和网格游戏中的行为，以及它对自私学习者的鲁棒性。

引用本文

BibTeX公司

@会议记录{pmlr-v129-jacq20a，title={愚蠢的合作学习}，author={雅克、亚历克西斯和佩罗拉特、朱利安和盖斯特、马蒂厄和皮埃琴、奥利维尔}，booktitle={第十二届亚洲机器学习会议论文集}，页数={401--416}，年份={2020年}，editor={Pan，Sinno Jialin和Sugiyama，Masashi}，体积={129}，series={机器学习研究论文集}，月={11月18日--20日}，publisher={PMLR}，pdf={http://proceedings.mlr.press/v129/jacq20a/jacq20 a.pdf},url={https://proceedings.mlr.press/v129/jacq20a.html},abstract={本文将学习算法和学习均衡的概念从重复博弈理论扩展到随机博弈这是一种收敛于平衡策略的算法，允许在自娱环境中使用合作策略，而不会被自私的学习者利用。通过构造，FCL是重复对称博弈的学习均衡。我们说明了FCL在对称矩阵和网格游戏中的行为，以及它对自私学习者的鲁棒性。}}

尾注

%0会议论文%T愚蠢的合作学习%亚历克西斯·雅克%朱利安·佩罗拉%马蒂厄·盖斯特%奥利维尔派琴%第十二届亚洲机器学习会议论文集%C机器学习研究进展%D 2020年%E Sinno Jialin Pan公司%E Masashi Sugiyama公司%传真pmlr-v129-jacq20a%我PMLR%电话401-416%U型https://proceedings.mlr.press/v129/jacq20a.html%V 129型%本文将学习算法和学习均衡的概念从重复博弈理论扩展到随机博弈。我们引入了防愚合作学习（FCL）算法，该算法收敛到一种均衡策略，允许在自娱自乐的环境中使用合作策略，而不会被自私的学习者利用。通过构造，FCL是重复对称博弈的学习均衡。我们说明了FCL在对称矩阵和网格游戏中的行为，以及它对自私学习者的鲁棒性。

亚太地区

Jacq，A.、Perolat，J.、Geist，M.和Pietquin，O.（2020年）。愚蠢的合作学习。第十二届亚洲机器学习会议记录，英寸机器学习研究进展129:401-416可从https://proceedings.mlr.press/v129/jacq20a.html。

愚蠢的合作学习

摘要

引用本文

相关材料