梅胡尔·达马尼
人员信息
优化列表
2020年–今天
2023 【c3】 哈什·戈尔 , 张一峰 , 梅胡尔·达马尼 , 纪尧姆·萨托雷蒂 :
SocialLight:面向网络交通信号控制的分布式协作学习。 美国原子能机构 2023 : 1551-1559 [i5] 哈什·戈尔 , 张一峰 , 梅胡尔·达马尼 , 纪尧姆·萨托雷蒂 :
SocialLight:面向全网交通信号控制的分布式合作学习。 CoRR公司 abs/2305.16145 ( 2023 ) [i4] 斯蒂芬·卡斯珀 , 桑德·戴维斯 , 克劳迪娅·施 , 托马斯·克伦德·吉尔伯特 , 杰雷米·舍勒 , 哈维尔·兰多 , 雷切尔·弗里德曼 , 托马斯·科巴克 , 大卫·林德纳 , 佩德罗·弗雷尔 , 王伟康 , 萨缪尔·马克斯 , 夏贝尔·拉法·塞格里 , 迈卡·卡罗尔 , 彭安迪(Andi Peng) , 菲利普·J·K·克里斯托弗森 , 梅胡尔·达马尼 , 斯图尔特·斯洛克姆 , 安瓦尔 , 阿南德·西塔哈兰詹(Anand Sittharanjan) , 马克斯·纳多 , 埃里克·米绍德 , 雅各布·普法 , 德米特里·克拉申尼科夫 , 陈欣 , 劳罗·兰戈斯科 , 彼得·哈斯 , 埃尔登·比伊克 , 安卡·D·德拉甘 , 大卫·克鲁格 , 多尔萨·萨迪格 , 迪伦·哈德菲尔德-梅内尔 :
从人类反馈中强化学习的公开问题和基本局限性。 CoRR公司 abs/2307.15217 ( 2023 ) 2022 【c2】 张一峰 , 梅胡尔·达马尼 , 纪尧姆·萨托雷蒂 :
基于分布式RL和时空特征提取的多智能体交通信号控制。 AAMAS研讨会 2022 : 106-113 [i3] 王宇通 , 梅胡尔·达马尼 , 帕梅拉·王 , 曹玉红 , 纪尧姆·萨托雷蒂 :
机器人团队的分布式强化学习:综述。 CoRR公司 abs/2204.03516 ( 2022 ) 2021 [j1] 梅胡尔·达马尼 , 罗志耀 , 艾默森·温泽尔 , 纪尧姆·萨托雷蒂 :
PRIMAL$_2$:通过强化和模仿多智能体学习寻找路径-终身。 IEEE机器人自动化。 莱特。 6 ( 2 ) : 2666-2673 ( 2021 ) [i2] 弗洛里安·洛朗 , 曼纽尔·施耐德 , 克里斯蒂安·谢勒 , 杰里米·沃森 , 李娇阳 , 哲晨 , 一正 , 邵洪灿 , 康斯坦丁·马赫涅夫 , 奥列格·斯维德琴科 , 弗拉基米尔·埃戈罗夫 , 德米特里·伊万诺夫 , 阿列克谢·谢尔曼 , 叶甫根尼娅·斯皮洛夫斯卡 , 奥利弗·塔内夫斯基 , 阿列克桑达尔·尼科夫 , 拉蒙·格兰德 , 大卫·加列夫斯基 , 雅科夫·米特罗夫斯基 , 纪尧姆·萨托雷蒂 , 罗志耀 , 梅胡尔·达马尼 , 尼拉巴巴塔查里亚 , 希瓦姆·阿加瓦尔 , 阿德里安·埃格利 , 埃里克·尼格伦 , 莎拉达·莫汉蒂 :
2020年平地竞赛:MAPF和MARL在电网世界中实现高效列车协调。 CoRR公司 abs/2103.16511 ( 2021 ) 2020 【c1】 弗洛里安·劳伦特 , 曼纽尔·施耐德 , 克里斯蒂安·谢勒 , 杰里米·沃森 , 李娇阳 , 哲晨 , 一正 , 邵洪灿 , 康斯坦丁·马赫涅夫 , 奥列格·斯维琴科 , 弗拉基米尔·埃戈罗夫 , 德米特里·伊万诺夫 , 阿列克谢·谢尔曼 , 叶甫根尼娅·斯皮罗夫斯卡 , 奥利弗·塔内夫斯基 , 阿列克桑达尔·尼科夫 , 拉蒙·格兰德 , 大卫·加列夫斯基 , 雅科夫·米特罗夫斯基 , 纪尧姆·萨托雷蒂 , 罗志耀 , 梅胡尔·达马尼 , 尼拉巴巴塔查里亚 , 希瓦姆·阿加瓦尔 , 阿德里安·埃格利 , 埃里克·尼格伦 , 莎拉达·莫汉蒂 :
2020年平地竞赛:MAPF和MARL在电网世界中实现高效列车协调。 NeurIPS(竞争和演示) 2020 : 275-301 [i1] 梅胡尔·达马尼 , 罗志耀 , 艾默森·温泽尔 , 纪尧姆·萨托雷蒂 :
PRIMAL2:通过强化和模仿多智能体学习寻找路径——终身学习。 CoRR公司 abs/2010.08184 ( 2020 )