2019年第1天:中国北京
《第一届分布式人工智能国际会议论文集》,DAI 2019,中国北京,2019年10月13日至15日。 ACM公司 2019 ,国际标准图书编号 978-1-4503-7656-3 冯武 , 什洛莫·齐尔伯斯坦 , 尼古拉斯·R·詹宁斯 :
具有部分状态模型的随机多智能体规划。 1:1-1:8 蓬·皮安帕克 , Tran Cao儿子 , 菲比·O·图普斯·杜加斯 , 杨致远(William Yeoh) :
多智能体路径查找问题的分布式求解器。 2:1-2:7 Suryanarayana的Sharadhi Alape , 大卫·萨恩 , 萨里特·克劳斯 :
关联营销中的信息披露和合作伙伴管理。 3:1-3:8 马蒂厄·齐默尔 , 保罗·翁 :
一种有效的强化学习算法,用于学习连续域中的确定性策略。 4:1-4:7 迈克尔·格什坦 , 大卫·萨恩 , 约纳坦·奥曼 :
通过昂贵的信息进行批准投票。 5:1-5:8 魏俊红(Weijun Hong) , 朱梦慧 , 刘明桓 , 张伟南 , 明州 , Yong Yu(永余) , 孙鹏(音译) :
强化学习的生成性对抗性探索。 6:1-6:10 明州 , 陈勇 , 英文 , 杨耀东 , 苏玉凤 , 张伟南 , 戴尔·张 , 王军(Jun Wang) :
大规模多智能体系统的因子化Q学习。 7:1-7:7 徐俊平 , 新河 , 赵登吉 :
网络上的双重拍卖设计。 8:1-8:6 刘玉仁 , 胡一齐 , 洪谦(音) , 杨瑜 :
基于异步分类的优化。 9:1-9:8 萨姆·甘兹弗里德 :
游戏中的错误。 10:1-10:6 王伟勋 , 郝建业 , 王一喜 , 马修·泰勒 :
在连续囚犯困境中通过深度多智能体强化学习实现合作。 11:1-11:7 孙景昌 , 曾玉龙 :
矿工游戏中的道德风险。 12:1-12:2
![](https://dblp.uni-trier.de/img/cog.dark.24x24.png)