朱利安·佩罗拉
人员信息
优化列表
![笔记](https://dblp.org/img/note-mark.dark.12x12.png)
2020年–今天
2023 [公元36年] 马克·兰科特 , 约翰·舒尔茨 , 尼尔·伯奇 , 马克斯·奥兰·史密斯 , 丹尼尔·海恩斯 , 托马斯·安东尼 , 朱利安·佩罗拉 :
基于人群的重复岩画剪刀评价作为多智能体强化学习的基准。 CoRR公司 abs/2303.03196 ( 2023 ) 2022 [j6] 伊恩·杰普 , 托马斯·安东尼 , 约拉姆·巴赫拉赫 , 阿维什卡尔·博普昌德 , 卡莱沙·布拉德 , 杰罗姆·T·康纳 , 维巴瓦里·达萨吉 , 巴特·德·维尔德 , 埃德加·杜涅兹·古斯曼 , 罗穆尔·伊利 , 理查德·埃弗雷特 , 丹尼尔·海恩斯 , 爱德华·休斯 , 米纳·汗 , 马克·兰科特 , 凯特·拉森 , 拉线杆 , 刘思奇 , 卢克·马里斯 , 凯文·麦基 , 保罗·穆勒 , 朱利安·佩罗拉 , 弗洛里安·斯特鲁布 , 安德烈亚·塔切蒂 , 尤金·塔拉索夫 , 王哲(Zhe Wang) , 卡尔·图伊斯 :
在多智能体环境中开发、评估和缩放学习智能体。 AI社区。 35 ( 4 ) : 271-284 ( 2022 ) [公元30年] 莎拉·佩林 , 马修·劳里埃 , 朱利安·佩罗拉 , 罗穆阿德·埃利 , 马蒂厄·盖斯特 , 奥利维尔·皮特金 :
通过学习主策略在平均场游戏中进行推广。 AAAI公司 2022 : 9413-9421 [公元29年] 马蒂厄·盖斯特 , 朱利安·佩罗拉 , 马修·劳里埃 , 罗穆尔·伊利 , 莎拉·佩林 , 奥利维尔·巴瑟姆 , 雷米·穆诺斯 , 奥利维尔·皮特金 :
凹面效用强化学习:Mean-field游戏观点。 美国原子能机构 2022 : 489-497 [公元28年] 保罗·穆勒 , 马克·罗兰 , 罗穆尔·伊利 , 乔治·皮里奥拉斯 , 朱利安·佩罗拉 , 马修·劳里埃 , 拉斐尔·马里尼尔 , 奥利维尔·皮特金 , 卡尔·图尔斯 :
Mean-Field游戏中的学习均衡:介绍Mean-Feld PSRO。 美国原子能机构 2022 : 926-934 [公元27年] 朱利安·佩罗拉 , 莎拉·佩林 , 罗穆亚德·埃利 , 马修·劳里埃 , 乔治·皮里奥拉斯 , 马蒂厄·盖斯特 , 卡尔·图尔斯 , 奥利维尔·皮特金 :
通过在线镜像下降缩放平均场游戏。 美国原子能机构 2022 : 1028-1037 [公元26年] Theophile Cabannes公司 , 马修·劳里埃 , 朱利安·佩罗拉 , 拉斐尔·马里尼尔 , 谢尔坦·吉尔金 , 莎拉·佩林 , 奥利维尔·皮特金 , 亚历山大·巴彦 , 埃里克·古堡 , 罗穆尔·伊利 :
求解具有拥塞的N-Player动态路由博弈:一种平均场方法。 美国原子能机构 2022 : 1557-1559 [公元25年] 马修·劳里埃 , 莎拉·佩林 , 谢尔坦·吉尔金 , 保罗·穆勒 , 阿尤什·贾因 , Theophile Cabannes公司 , 乔治·皮里奥拉斯 , 朱利安·佩罗拉 , 罗穆尔·伊利 , 奥利维尔·皮特金 , 马蒂厄·盖斯特 :
平均场游戏的可扩展深度强化学习算法。 ICML公司 2022 : 12078-12095 [i35] 马修·劳里埃 , 莎拉·佩林 , 谢尔坦·吉尔金 , 保罗·穆勒 , 阿尤什·贾因 , Theophile Cabannes公司 , 乔治·皮里奥拉斯 , 朱利安·佩罗拉 , 罗穆阿德·埃利 , 奥利维尔·皮特金 , 马蒂厄·盖斯特 :
平均场游戏的可扩展深度强化学习算法。 CoRR公司 abs/2203.11973 ( 2022 ) [i34] 朱利安·佩罗拉 , 巴特·德·维尔德 , 丹尼尔·海恩斯 , 尤金·塔拉索夫 , 弗洛里安·斯特鲁布 , 文森特·德·波尔 , 保罗·穆勒 , 杰罗姆·康纳 , 尼尔·伯奇 , 托马斯·安东尼 , 斯蒂芬·麦卡勒 , 罗穆尔·伊利 , 莎拉·岑 , 王哲(Zhe Wang) , Audrunas Gruslys公司 , 亚历山大·马利舍娃 , 米纳·汗 , 谢尔吉尔·奥扎尔 , 芬巴尔木材 , 托比·波伦 , 汤姆·埃克尔斯 , 马克·罗兰 , 马克·兰科特 , 让-巴蒂斯特·莱斯皮奥 , 比拉尔·皮奥 , 沙耶根·奥米德沙维埃 , 爱德华·洛克哈特 , 劳伦特·西弗雷 , Nathalie Beauguerlange公司 , 雷米·穆诺斯 , 大卫·西尔弗 , 萨汀德·辛格 , 哈萨比斯 , 卡尔·图尔斯 :
通过无模型多智能体强化学习掌握Stratego游戏。 CoRR公司 abs/2206.15378 ( 2022 ) [i33] 保罗·穆勒 , 罗穆尔·伊利 , 马克·罗兰 , 马修·劳里埃 , 朱利安·佩罗拉 , 莎拉·佩林 , 马蒂厄·盖斯特 , 乔治·皮里奥拉斯 , 奥利维尔·皮特金 , 卡尔·图尔斯 :
在Mean-Field游戏中学习相关均衡。 CoRR公司 abs/2208.10138 ( 2022 ) [i32] 伊恩·杰普 , 托马斯·安东尼 , 约拉姆·巴赫拉赫 , 阿维什卡尔·博普昌德 , 卡莱沙·布拉德 , 杰罗姆·康纳 , 维巴瓦里·达萨吉 , 巴特·德·维尔德 , 埃德加·杜涅兹·古斯曼 , 罗穆尔·伊利 , 理查德·埃弗雷特 , 丹尼尔·海恩斯 , 爱德华·休斯 , 米纳·汗 , 马克·兰科特 , 凯特·拉森 , 拉线杆 , 刘思奇 , 卢克·马里斯 , 凯文·麦基 , 保罗·穆勒 , 朱利安·佩罗拉 , 弗洛里安·斯特鲁布 , 安德烈亚·塔切蒂 , 尤金·塔拉索夫 , 王哲(Zhe Wang) , 卡尔·图尔斯 :
在多智能体环境中开发、评估和缩放学习智能体。 CoRR公司 abs/2209.10958 ( 2022 ) 2021 [j5] 卡尔·图尔斯 , 沙耶根·奥米德沙维埃 , 保罗·穆勒 , 王哲(Zhe Wang) , 杰罗姆·康纳 , 丹尼尔·海恩斯 , 教授和伊安·格林汉姆 , 威廉·斯皮尔曼 , 蒂姆·沃斯科特 , 达夫迪德·斯蒂尔 , 波琳·吕克 , AdriàRecasens公司 , 亚历山大·加拉肖夫 , 格雷戈里·桑顿 , 罗穆尔·伊利 , 巴勃罗·斯普雷希曼 , 波尔·莫雷诺 , 克里斯·曹 , 玛尔塔·加内洛 , 普拉内特·杜塔 , 米查尔·瓦尔科 , 尼古拉斯·希斯 , 亚历克斯·布里奇兰 , 朱利安·佩罗拉 , 巴特·德·维尔德 , S.M.阿里·埃斯拉米 , 马克·罗兰 , 安德鲁·杰格尔 , 雷米·穆诺斯 , 特雷弗回来了 , 拉齐亚·阿哈默德 , 西蒙·布顿 , Nathalie Beauguerlange公司 , 杰克逊·布洛舍 , 格雷佩尔 , 哈萨比斯 :
游戏计划:人工智能可以为足球做什么,足球可以为人工智能做什么。 J.阿蒂夫。 智力。 物件。 71 : 41-88 ( 2021 ) 【j4】 贾斯汀·傅 , 安德烈亚·塔切蒂 , 朱利安·佩罗拉 , 约拉姆·巴赫拉赫 :
评估多智能体反向强化学习中的策略结构。 J.阿蒂夫。 智力。 物件。 71 : 925-951 ( 2021 ) [公元24年] 朱利安·佩罗拉 , 雷米·穆诺斯 , 让-巴蒂斯特·莱斯皮奥 , 沙耶根·奥米德沙维埃 , 马克·罗兰 , 佩德罗·奥尔特加 , 尼尔·伯奇 , 托马斯·安东尼 , 大卫·巴尔杜齐 , 巴特·德·维尔德 , 乔治奥斯·皮柳拉斯 , 马克·兰科特 , 卡尔·图尔斯 :
从Poincaré递归到不完全信息博弈中的收敛:通过正则化找到均衡。 ICML公司 2021 : 8525-8535 【c23】 莎拉·佩林 , 马修·劳里埃 , 朱利安·佩罗拉 , 马蒂厄·盖斯特 , 罗穆阿德·埃利 , 奥利维尔·皮特金 :
平均场比赛群! 强化学习方式。 国际JCAI 2021 : 356-362 [i31] 朱利安·佩罗拉 , 莎拉·佩林 , 罗穆尔·伊利 , 马修·劳里埃 , 乔治·皮里奥拉斯 , 马蒂厄·盖斯特 , 卡尔·图尔斯 , 奥利维尔·皮特金 :
通过在线镜像下降扩大平均场游戏。 CoRR公司 abs/2103.00623 ( 2021 ) [i30] 莎拉·佩林 , 马修·劳里埃 , 朱利安·佩罗拉 , 马蒂厄·盖斯特 , 罗穆阿德·埃利 , 奥利维尔·皮特金 :
平均场比赛群! 强化学习方式。 CoRR公司 abs/2105.07933 ( 2021 ) [i29] 马蒂厄·盖斯特 , 朱利安·佩罗拉 , 马修·劳里埃 , 罗穆尔·伊利 , 莎拉·佩林 , 奥利维尔·巴瑟姆 , 雷米·穆诺斯 , 奥利维尔·皮特金 :
凹面效用强化学习:Mean-field游戏观点。 CoRR公司 abs/2106.03787 ( 2021 ) [第28条] 莎拉·佩林 , 马修·劳里埃 , 朱利安·佩罗拉 , 罗穆阿德·埃利 , 马蒂厄·盖斯特 , 奥利维尔·皮特金 :
通过学习主策略在平均场游戏中进行推广。 CoRR公司 abs/2109.09717 ( 2021 ) [i27] 佩德罗·奥尔特加 , 马库斯·库内什 , 格雷戈伊尔·德雷唐(Grégoire Delétang) , 蒂姆·吉纳温 , 乔迪·格劳·莫亚 , 乔尔·维内斯 , 乔纳斯·布赫利 , 乔纳斯·迪格雷夫 , 比拉尔·皮奥 , 朱利安·佩罗拉 , 汤姆·艾唯瑞特 , 科伦蒂·塔莱克 , 埃米利奥·帕里索托 , 汤姆·埃雷兹 , 陈玉田 , 斯科特·里德 , 马库斯·赫特 , 南多·德·弗雷塔斯 , 谢恩·莱格 :
动摇基础:交互和控制序列模型中的错觉。 CoRR公司 abs/2110.10819 ( 2021 ) [i26] Theophile Cabannes公司 , 马修·劳里埃 , 朱利安·佩罗拉 , 拉斐尔·马里尼尔 , 谢尔坦·吉尔金 , 莎拉·佩林 , 奥利维尔·皮特金 , 亚历山大·巴彦 , 埃里克·古堡 , 罗穆尔·伊利 :
求解具有拥塞的N人动态路由博弈:平均场方法。 CoRR公司 abs/2110.11943 ( 2021 ) [i25] 保罗·穆勒 , 马克·罗兰 , 罗穆尔·伊利 , 乔治·皮里奥拉斯 , 朱利安·佩罗拉 , 马修·劳里埃 , 拉斐尔·马里尼尔 , 奥利维尔·皮特金 , 卡尔·图尔斯 :
Mean-Field游戏中的学习均衡:介绍Mean-Feld PSRO。 CoRR公司 abs/2111.08350 ( 2021 ) 2020 [j3] 卡尔·图尔斯 , 朱利安·佩罗拉 , 马克·兰科特 , 爱德华·休斯 , 理查德·埃弗雷特 , 乔尔·雷波 , Csaba Szepesvariá , 格雷佩尔 :
实证博弈分析的边界和动力学。 汽车。 Agent多Agent系统。 34 ( 1 ) : 7 ( 2020 ) [公元22年] 罗穆尔·伊利 , 朱利安·佩罗拉 , 马修·劳里埃 , 马蒂厄·盖斯特 , 奥利维尔·皮特金 :
关于平均场对策中无模型学习的收敛性。 AAAI公司 2020 : 7143-7150 【c21】 亚历克西斯·雅克 , 朱利安·佩罗拉 , 马蒂厄·盖斯特 , 奥利维尔·皮特金 :
愚蠢的合作学习。 ACML公司 2020 : 401-416 [公元20年] 丹尼尔·海恩斯 , 达斯汀·莫里尔 , 沙耶根·奥米德沙维埃 , 雷米·穆诺斯 , 朱利安·佩罗拉 , 马克·兰科特 , Audrunas Gruslys公司 , Jean-Baptiste Lespiau女士 , 帕沃·帕尔马斯 , 埃德加·杜涅兹·古斯曼 , 卡尔·图尔斯 :
神经复制动力学:通过套期保值策略梯度的多智能体学习。 美国原子能机构 2020 : 492-501 [第19条] 保罗·穆勒 , 沙耶根·奥米德沙维埃 , 马克·罗兰 , 卡尔·图尔斯 , 朱利安·佩罗拉 , 刘思奇 , 丹尼尔·海恩斯 , 卢克·马里斯 , 马克·兰科特 , 爱德华·休斯 , 王哲(Zhe Wang) , 拉线杆 , 尼古拉斯·海斯 , 格雷佩尔 , 雷米·穆诺斯 :
多智能体学习的广义训练方法。 ICLR公司 2020 [第18条] 雷米·穆诺斯 , 朱利安·佩罗拉 , Jean-Baptiste Lespiau女士 , 马克·罗兰 , 巴特·德·维尔德 , 马克·兰科特 , 芬巴尔木材 , 丹尼尔·海恩斯 , 沙耶根·奥米德沙维埃 , Audrunas Gruslys公司 , 穆罕默德·盖什拉希·阿扎尔 , 爱德华·洛克哈特 , 卡尔·图尔斯 :
不完全信息博弈中纳什均衡的快速计算。 ICML公司 2020 : 7119-7129 [第17条] 托马斯·安东尼 , 汤姆·埃克尔斯 , 安德里亚·塔切蒂 , 杰诺斯·克拉马尔 , 伊恩·杰普 , 托马斯·哈德森 , 尼古拉斯·波切 , 马克·兰科特 , 朱利安·佩罗拉 , 理查德·埃弗雷特 , 萨汀德·辛格 , 格雷佩尔 , 约拉姆·巴赫拉赫 :
学习通过最佳应对政策迭代来实施无压力外交。 NeurIPS公司 2020 [第16条] 莎拉·佩林 , 朱利安·佩罗拉 , 马修·劳里埃 , 马蒂厄·盖斯特 , 罗穆尔·伊利 , 奥利维尔·皮特金 :
平均场游戏的虚拟游戏:连续时间分析和应用。 NeurIPS公司 2020 【i24】 朱利安·佩罗拉 , 雷米·穆诺斯 , Jean-Baptiste Lespiau女士 , 沙耶根·奥米德沙维埃 , 马克·罗兰 , 佩德罗·奥尔特加 , 尼尔·伯奇 , 托马斯·安东尼 , 大卫·巴尔杜齐 , 巴特·德·维尔德 , 乔治·皮里奥拉斯 , 马克·兰科特 , 卡尔·图尔斯 :
从Poincaré递归到不完全信息博弈中的收敛:通过正则化找到均衡。 CoRR公司 abs/2002.08456 ( 2020 ) [第23条] 沙耶根·奥米德沙维埃 , 卡尔·图尔斯 , Wojciech M.Czarnecki公司 , 弗朗西斯科·桑托斯 , 马克·罗兰 , 杰罗姆·康纳 , 丹尼尔·海恩斯 , 保罗·穆勒 , 朱利安·佩罗拉 , 巴特·德·维尔德 , Audrunas Gruslys公司 , 雷米·穆诺斯 :
浏览奥运景观。 CoRR公司 abs/2005.01642 ( 2020 ) [i22] 托马斯·W·安东尼 , 汤姆·埃克尔斯 , 安德烈亚·塔切蒂 , 杰诺斯·克拉马尔 , 伊恩·杰普 , 托马斯·哈德森 , 尼古拉斯·波切 , 马克·兰科特 , 朱利安·佩罗拉 , 理查德·埃弗雷特 , 萨汀德·辛格 , 格雷佩尔 , 约拉姆·巴赫拉赫 :
学习通过最佳应对政策迭代来实施无压力外交。 CoRR公司 abs/2006.04635 ( 2020 ) 【i21】 莎拉·佩林 , 朱利安·佩罗拉 , 马修·劳里埃 , 马蒂厄·盖斯特 , 罗穆尔·伊利 , 奥利维尔·皮特金 :
平均场博弈的虚拟博弈:连续时间分析与应用。 CoRR公司 abs/2007.03458 ( 2020 ) [i20] Audrunas Gruslys公司 , 马克·兰科特 , 雷米·穆诺斯 , 芬巴尔木材 , 马丁·施密德 , 朱利安·佩罗拉 , 达斯汀·莫里尔 , 维尼希乌斯·弗洛雷斯·赞巴尔迪 , Jean-Baptiste Lespiau女士 , 约翰·舒尔茨 , 穆罕默德·盖什拉希·阿扎尔 , 迈克尔·鲍林 , 卡尔·图尔斯 :
优势后悔匹配演员-关键。 CoRR公司 abs/2008.12234 ( 2020 ) [i19] 卡尔·图尔斯 , 沙耶根·奥米德沙维埃 , 保罗·穆勒 , 王哲(Zhe Wang) , 杰罗姆·康纳 , 丹尼尔·海恩斯 , 教授和伊安·格林汉姆 , 威廉·斯皮尔曼 , 蒂姆·沃斯科特 , 达夫迪德·斯蒂尔 , 波琳·吕克 , 阿德里亚·雷卡森 , 亚历山大·加拉肖夫 , 格雷戈里·桑顿 , 罗穆尔·伊利 , 巴勃罗·斯普雷奇曼 , 波尔·莫雷诺 , 克里斯·曹 , 玛尔塔·加内洛 , 普拉内特·杜塔 , 米查尔·瓦尔科 , 尼古拉斯·希斯 , 亚历克斯·布里奇兰 , 朱利安·佩罗拉 , 巴特·德·维尔德 , S.M.Ali Eslami先生 , 马克·罗兰 , 安德鲁·杰格尔 , 雷米·穆诺斯 , 特雷弗回来了 , 拉齐亚·阿哈默德 , 西蒙·布顿 , Nathalie Beauguerlange公司 , 杰克逊·布洛舍 , 格雷佩尔 , 哈萨比斯 :
游戏计划:人工智能可以为足球做什么,足球可以为人工智能做什么。 CoRR公司 abs/2011.09192 ( 2020 )
2010 – 2019
2019 [注2] 盖伊·巴拉什 , 毛里西奥·卡斯蒂略-埃芬 , 尼亚蒂·查亚 , 彼得·克拉克 , 胡斯卡·埃斯皮诺萨 , 埃坦·法基 , 克里斯托弗·盖布 , 古怪的埃里克·冈德森 , Seán Ohéigeartaigh先生 , 何塞·埃尔南德斯·奥拉洛 , Chiori Hori公司 , 黄晓伟 , 科基尔·贾伊德卡 , 帕凡·卡帕尼帕蒂 , 莎拉·克伦 , Seokhwan Kim先生 , 马克·兰科特 , 丹尼·兰格 , 朱利安·麦考利 , 大卫·R·马丁内斯 , 马尔万·马塔尔 , 四季倾城 , 马丁·米哈洛夫斯基 , 鲁斯·米尔斯基 , 鲁兹贝·莫塔吉 , 约瑟夫·奥斯本 , 朱利安·佩罗拉 , 马丁·施密德 , 阿拉什·沙班·内贾德 , Onn Shehory公司 , 比普拉夫·斯利瓦斯塔瓦 , 威廉·斯特雷林 , 卡提克·塔拉马杜普拉 , 朱利安·托盖利斯 , 吉野小一郎 , 张全石 , 伊梅德·齐图尼 :
2019年AAAI人工智能会议研讨会报告。 AI磁。 40 ( 三 ) : 67-78 ( 2019 ) [c15] 乔尔·雷波 , 朱利安·佩罗拉 , 爱德华·休斯 , 史蒂文·惠莱特 , 亚当·H·大理石 , 埃德加·杜涅兹·古斯曼 , 彼得·苏尼哈格 , 伊恩·邓宁 , 格雷佩尔 :
马尔萨斯强化学习。 美国原子能机构 2019 : 1099-1107 [第14条] 大卫·巴尔杜齐 , 玛尔塔·加内洛 , 约拉姆·巴赫拉赫 , 沃伊切赫·沙内基(Wojciech Czarnecki) , 朱利安·佩罗拉 , 马克斯·贾德伯格 , 格雷佩尔 :
对称零和游戏中的开放式学习。 ICML公司 2019 : 434-443 [第13条] 爱德华·洛克哈特 , 马克·兰科特 , 朱利安·佩罗拉 , Jean-Baptiste Lespiau女士 , 达斯汀·莫里尔 , 芬巴尔木材 , 卡尔·图尔斯 :
利用可利用性下降计算序贯对抗博弈的近似均衡。 国际JCAI 2019 : 464-470 [第12条] 马克·罗兰 , 沙耶根·奥米德沙维埃 , 卡尔·图尔斯 , 朱利安·佩罗拉 , 米查尔·瓦尔科 , 乔治·皮里奥拉斯 , 雷米·穆诺斯 :
不完全信息下的多智能体评价。 NeurIPS公司 2019 : 12270-12282 [i18] 大卫·巴尔杜齐 , 玛尔塔·加内洛 , 约拉姆·巴赫拉赫 , Wojciech M.Czarnecki公司 , 朱利安·佩罗拉 , 马克斯·贾德伯格 , 格雷佩尔 :
对称零和游戏中的开放式学习。 CoRR公司 abs/1901.08106 ( 2019 ) [i17] 沙耶根·奥米德沙维埃 , 克里斯托斯·帕帕迪米特里奥 , 乔治奥斯·皮柳拉斯 , 卡尔·图尔斯 , 马克·罗兰 , Jean-Baptiste Lespiau女士 , Wojciech M.Czarnecki公司 , 马克·兰科特 , 朱利安·佩罗拉 , 雷米·穆诺斯 :
α-等级:通过进化进行多智能体评估。 CoRR公司 abs/1903.01373 ( 2019 ) [i16] 爱德华·洛克哈特 , 马克·兰科特 , 朱利安·佩罗拉 , Jean-Baptiste Lespiau女士 , 达斯汀·莫里尔 , 芬巴尔木材 , 卡尔·图伊斯 :
利用可利用性下降计算序贯对抗博弈的近似均衡。 CoRR公司 abs/1903.05614 ( 2019 ) 【i15】 沙耶根·奥米德沙维埃 , 丹尼尔·海恩斯 , 达斯汀·莫里尔 , 雷米·穆诺斯 , 朱利安·佩罗拉 , 马克·兰科特 , Audrunas Gruslys公司 , Jean-Baptiste Lespiau女士 , 卡尔·图尔斯 :
神经复制动力学。 CoRR公司 abs/1906.00190 ( 2019 ) [第14条] 亚历克西斯·雅克 , 朱利安·佩罗拉 , 马蒂厄·盖斯特 , 奥利维尔·皮特金 :
愚蠢的合作学习。 CoRR公司 abs/1906.09831 ( 2019 ) [i13] 罗穆尔·伊利 , 朱利安·佩罗拉 , 马修·劳里埃 , 马蒂厄·盖斯特 , 奥利维尔·皮特金 :
平均场游戏的近似虚拟游戏。 CoRR公司 abs/1907.02633 ( 2019 ) [i12] 马克·兰科特 , 爱德华·洛克哈特 , Jean-Baptiste Lespiau女士 , 维尼希乌斯·弗洛雷斯·赞巴尔迪 , Satyaki Upadhyay公司 , 朱利安·佩罗拉 , 斯里拉姆·斯里尼瓦桑 , 芬巴尔木材 , 卡尔·图尔斯 , 沙耶根·奥米德沙维埃 , 丹尼尔·海恩斯 , 达斯汀·莫里尔 , 保罗·穆勒 , 蒂莫·埃瓦兹 , 瑞恩·福克纳 , 杰诺斯·克拉马尔 , 巴特·德·维尔德 , 布伦南·塞塔 , 詹姆斯·布拉德伯里 , 大卫·丁 , 塞巴斯蒂安·博尔盖乌德 , 马修·赖 , 朱利安·施里特维瑟 , 托马斯·安东尼 , 爱德华·休斯 , 伊沃·达尼赫尔卡 , 乔纳·瑞安·达维斯 :
OpenSpiel:游戏强化学习框架。 CoRR公司 abs/1908.09453 ( 2019 ) [i11] 马克·罗兰 , 沙耶根·奥米德沙维埃 , 卡尔·图尔斯 , 朱利安·佩罗拉 , 米查尔·瓦尔科 , 乔治·皮里奥拉斯 , 雷米·穆诺斯 :
不完全信息下的多智能体评价。 CoRR公司 abs/1909.09849 ( 2019 ) [i10] 保罗·穆勒 , 沙耶根·奥米德沙维埃 , 马克·罗兰 , 卡尔·图尔斯 , 朱利安·佩罗拉 , 刘思奇 , 丹尼尔·海恩斯 , 卢克·马里斯 , 马克·兰科特 , 爱德华·休斯 , 王哲(Zhe Wang) , 拉线杆 , 尼古拉斯·希斯 , 格雷佩尔 , 雷米·穆诺斯 :
多智能体学习的广义训练方法。 CoRR公司 abs/1909.12823 ( 2019 ) 2018 [第11条] 朱利安·佩罗拉 , 比拉尔·皮奥 , 奥利维尔·皮特金 :
同时移动多阶段游戏中的演员评论虚拟游戏。 AISTATS公司 2018 : 919-928 [第10条] 卡尔·图尔斯 , 朱利安·佩罗拉 , 马克·兰科特 , 乔尔·雷波 , 格雷佩尔 :
经验博弈分析的一般方法。 美国原子能机构 2018 : 77-85 【c9】 大卫·巴尔杜齐 , 卡尔·图伊斯 , 朱利安·佩罗拉 , 格雷佩尔 :
重新评估评估。 NeurIPS公司 2018 : 3272-3283 【c8】 斯里拉姆·斯里尼瓦桑 , 马克·兰科特 , 维尼希乌斯·弗洛雷斯·赞巴尔迪 , 朱利安·佩罗拉 , 卡尔·图尔斯 , 雷米·穆诺斯 , 迈克尔·鲍林 :
部分可观测多智能体环境中的参与者关键策略优化。 NeurIPS公司 2018 : 3426-3439 [第九章] 卡尔·图尔斯 , 朱利安·佩罗拉 , 马克·兰科特 , 乔尔·雷波 , 格雷佩尔 :
经验博弈分析的一般方法。 CoRR公司 腹肌/1803.06376 ( 2018 ) [i8] 大卫·巴尔杜齐 , 卡尔·图尔斯 , 朱利安·佩罗拉 , 格雷佩尔 :
重新评估评估。 CoRR公司 腹肌/1806.02643 ( 2018 ) [i7] 朱利安·佩罗拉 , 马特乌斯·马利诺夫斯基 , 比拉尔·皮奥 , 奥利维尔·皮特金 :
玩普遍对抗干扰游戏。 CoRR公司 abs/1809.07802 ( 2018 ) [i6] 斯里拉姆·斯里尼瓦桑 , 马克·兰科特 , 维尼希乌斯·弗洛雷斯·赞巴尔迪 , 朱利安·佩罗拉 , 卡尔·图尔斯 , 雷米·穆诺斯 , 迈克尔·鲍林 :
部分可观测多智能体环境中的参与者关键策略优化。 CoRR公司 abs/1810.09026 ( 2018 ) [i5] 乔尔·雷波 , 朱利安·佩罗拉 , 爱德华·休斯 , 史蒂文·惠莱特 , 亚当·H·大理石 , 埃德加·杜涅兹·古斯曼 , 彼得·苏尼哈格 , 伊恩·邓宁 , 格雷佩尔 :
马尔萨斯强化学习。 CoRR公司 abs/1812.07019 ( 2018 ) 2017 【b1】 朱利安·佩罗拉 :
强化学习:多层案例。 (认证标准重新实施:Le Cas Multijoueur)。 法国里尔科技大学, 2017 【c7】 朱利安·佩罗拉 , 弗洛里安·斯特鲁布 , 比拉尔·皮奥 , 奥利维尔·皮特金 :
从批量数据中学习广义和马尔可夫博弈的纳什均衡。 AISTATS公司 2017 : 232-241 【c6】 朱利安·佩罗拉 , 乔尔·雷波 , 维尼希乌斯·弗洛雷斯·赞巴尔迪 , 查尔斯·比蒂 , 卡尔·图尔斯 , 格雷佩尔 :
公共工具资源分配的多智能体强化学习模型。 NIPS公司 2017 : 3643-3652 【c5】 马克·兰科特 , 维尼希乌斯·弗洛雷斯·赞巴尔迪 , Audrunas Gruslys公司 , 安吉利基·拉扎里杜 , 卡尔·图尔斯 , 朱利安·佩罗拉 , 大卫·西尔弗 , 格雷佩尔 :
多智能体强化学习的统一博弈论方法。 NIPS公司 2017 : 4190-4203 [i4] 朱利安·佩罗拉 , 乔尔·雷波 , 维尼希乌斯·弗洛雷斯·赞巴尔迪 , 查尔斯·比蒂 , 卡尔·图尔斯 , 格雷佩尔 :
公共工具资源分配的多智能体强化学习模型。 CoRR公司 abs/1707.06600 ( 2017 ) [i3] 马克·兰科特 , 维尼希乌斯·弗洛雷斯·赞巴尔迪 , Audrunas Gruslys公司 , 安吉利基·拉扎里杜 , 卡尔·图尔斯 , 朱利安·佩罗拉 , 大卫·西尔弗 , 格雷佩尔 :
多智能体强化学习的统一博弈论方法。 CoRR公司 腹肌/1711.00832 ( 2017 ) [i2] 卡尔·图尔斯 , 朱利安·佩罗拉 , 马克·兰科特 , 乔治·奥斯特罗夫斯基 , 拉胡尔·萨瓦尼 , 乔尔·雷波 , 托比·奥德 , 格雷佩尔 , 谢恩·莱格 :
非对称博弈的对称分解。 CoRR公司 abs/1711.05074 ( 2017 ) 2016 【c4】 朱利安·佩罗拉 , 比拉尔·皮奥 , 布鲁诺·谢勒 , 奥利维尔·皮特金 :
非平稳策略在求解二人零和马尔可夫博弈中的应用。 AISTATS公司 2016 : 893-901 【c3】 朱利安·佩罗拉 , 比拉尔·皮奥 , 马蒂厄·盖斯特 , 布鲁诺·谢勒 , 奥利维尔·皮特金 :
马尔可夫对策的软化近似策略迭代。 ICML公司 2016 : 1860-1868 [i1] 朱利安·佩罗拉 , 弗洛里安·斯特鲁布 , 比拉尔·皮奥 , 奥利维尔·皮特金 :
从批量数据中学习广义和马尔可夫博弈的纳什均衡。 CoRR公司 abs/1606.08718 ( 2016 ) 2015 [j1] 朱利安·佩罗拉 , 伊内斯·库索 , 凯文·洛金 , 奥利维尔·施特劳斯 :
推广区间数据的Wilcoxon秩和检验。 国际期刊近似原因。 56 : 108-121 ( 2015 ) 【c2】 朱利安·佩罗拉 , 布鲁诺·谢勒 , 比拉尔·皮奥 , 奥利维尔·皮特金 :
二人零和马尔可夫对策的近似动态规划。 ICML公司 2015 : 1321-1329 【c1】 Merwan Barlier公司 , 朱利安·佩罗拉 , 罗曼·拉罗什 , 奥利维尔·皮特金 :
作为随机游戏的人机对话。 SIGDIAL会议 2015 : 2-11
合著者索引
![](https://dblp.org/img/cog.dark.24x24.png)