斯蒂芬妮·米拉尼
人员信息
SPARQL查询
优化列表
2020年–今天
2024 [j1] 斯蒂芬妮·米拉尼 , 尼古拉·托宾 , 曼勒·维罗索 , 费芳 :
可解释强化学习:调查与比较综述。 ACM计算。 Surv公司。 56 ( 7 ) : 168:1-168:36 ( 2024 ) [第16条] 阿拉文德·维努戈尔(Aravind Venugopal) , 斯蒂芬妮·米拉尼 , 费芳 , 巴拉拉曼·拉文德兰 :
MABL:用于样本高效多智能体强化学习的双层潜在变量世界模型。 美国原子能机构 2024 : 1865-1873 [第15条] 我的Phan , 基安特·布兰特利 , 斯蒂芬妮·米拉尼 , 索鲁什·梅赫里 , Gokul Swamy公司 , 杰弗里·戈登 :
何时可以进行转移学习? ICML公司 2024 [i22] 王瑞仪(Ruiyi Wang) , 斯蒂芬妮·米拉尼 , 杰米·邱 , 肖恩·伊克 , 特拉维斯·拉布卢姆 , 塞缪尔·墨菲 , 内夫·琼斯 , 凯特·哈迪 , 洪深 , 费芳 , Zhiyu Zoey Chen先生 :
患者-Ψ:使用大型语言模型模拟患者以培训心理健康专业人员。 CoRR公司 abs/2405.19660 ( 2024 ) 【i21】 拉贾·法鲁克·阿里 , 斯蒂芬妮·米拉尼 , 约翰·伍兹 , 埃马纽埃尔·阿德尼 , 阿伊莎·法鲁克 , 克莱顿曼塞尔 , 杰弗里·伯恩斯 , 威廉·Hsu :
统一阿尔茨海默病进展预测的可解释性和可解释性。 CoRR公司 abs/2406.07777 ( 2024 ) [i20] 卡罗利斯果汁 , 乔治·阿达莫普洛斯 , 梅赫拉布·哈米迪 , 斯蒂芬妮·米拉尼 , 穆罕默德·礼萨·萨萨米 , 阿特姆·兹霍卢斯 , 索尼娅·约瑟夫 , 布莱克·A·理查兹 , 伊琳娜·里什 , 奥祖尔·西姆塞克 :
行动中的可解释性:对采矿代理人VPT的探索性分析。 CoRR公司 abs/2407.12161 ( 2024 ) [i19] 卓瑞叶 , 斯蒂芬妮·米拉尼 , 杰弗里·戈登 , 费芳 :
基于概念的可解释强化学习,仅限于无人类标签。 CoRR公司 腹肌/240715786 ( 2024 ) 2023 [第14条] 斯蒂芬妮·米拉尼 , 亚瑟·朱利安尼 , 艾达·莫门内贾德 , 罗卢卡·乔治斯库 , 雅罗斯瓦·雷佩基 , 艾莉森·肖 , 加文·科斯特洛 , 费芳 , 萨姆·德夫林 , 卡贾·霍夫曼 :
像我一样导航:了解人们如何在视频游戏中评估人性化人工智能。 芝加哥 2023 : 572:1-572:18 [第13条] 斯蒂芬妮·米拉尼 , 安西·卡内维斯托 , 卡洛里斯·拉马诺斯卡斯 , 桑德·舒尔霍夫 , 布兰登·霍顿 , 罗欣·沙阿 :
BEDD:用于解决模糊任务的培训和基准代理的MineRL玄武岩评估和演示数据集。 NeurIPS公司 2023 [i18] 斯蒂芬妮·米拉尼 , 亚瑟·朱利安尼 , 艾达·莫门内贾德 , 罗卢卡·乔治斯库 , 雅罗斯瓦·雷佩基 , 艾莉森·肖 , 加文·科斯特洛 , 费芳 , 萨姆·德夫林 , 卡贾·霍夫曼 :
像我一样导航:了解人们如何在视频游戏中评估人性化人工智能。 CoRR公司 abs/2303.02160 ( 2023 ) [i17] 斯蒂芬妮·米拉尼 , 安西·卡内维斯托 , 卡洛里斯·拉马诺斯卡斯 , 桑德·舒尔霍夫 , 布兰登·霍顿 , 莎拉达·莫汉蒂 , 拜伦·加尔布雷斯 , 柯晨 , 严嵩 , 周天泽 , 余炳泉 , 何刘 , Kai Guan公司 , 胡玉晶 , 吕唐杰 , 费德里科·马拉托 , 弗洛里安·利奥波德 , 阿莫·劳特 , Hautamäki村 , 安德鲁·梅尔尼克 , 石田树 , 乔·恩里克 , 罗伯特·克拉瑟特 , 沃尔特·劳里托 , 埃伦·诺沃塞勒 , 多汁的G.Goecks , 尼古拉斯·韦托维奇(Nicholas R.Waytowich) , 戴维·沃特金斯 , 乔什米勒 , 罗欣·沙阿 :
用人的反馈解决模糊任务:MineRL BASALT 2022竞赛回顾。 CoRR公司 abs/2303.13512 ( 2023 ) [i16] 阿拉文德·维努戈尔(Aravind Venugopal) , 斯蒂芬妮·米拉尼 , 费芳 , 巴拉拉曼·拉文德兰 :
用于高效样本多智能体强化学习的双层隐变量模型。 CoRR公司 abs/2304.06011 ( 2023 ) 【i15】 斯蒂芬妮·米拉尼 , 安西·卡内维斯托 , 卡洛里斯·拉马诺斯卡斯 , 桑德·舒尔霍夫 , 布兰登·霍顿 , 罗欣·沙阿 :
BEDD:用于解决模糊任务的培训和基准代理的MineRL玄武岩评估和演示数据集。 CoRR公司 腹肌/2312.02405 ( 2023 ) 2022 [第12条] 伊芙琳·祖尼加 , 斯蒂芬妮·米拉尼 , 盖·勒罗伊 , 雅罗斯瓦·雷佩基 , 罗卢卡·乔治斯库 , 艾达·莫门内贾德 , 大卫·比格内尔 , 孙明飞 , 艾莉森·肖 , 加文·科斯特洛 , 米哈伊尔·雅各布 , 萨姆·德夫林 , 卡贾·霍夫曼 :
人类如何在电子游戏导航中感知类人行为。 CHI扩展摘要 2022 : 391:1-391:11 [第11条] 米卡·卡罗尔 , 奥尔天堂 , 杰西·林 , 罗卢卡·乔治斯库 , 孙明飞 , 大卫·比格内尔 , 斯蒂芬妮·米拉尼 , 卡贾·霍夫曼 , 马修·霍斯克内克 , 安卡·D·德拉甘 , 萨姆·德夫林 :
Uni[MASK]:序列决策问题中的统一推理。 NeurIPS公司 2022 [c10] 斯蒂芬妮·米拉尼 , 张志成 , 尼古拉·托宾 , 浙远瑞安石 , 查尔斯·A·坎胡亚 , Evangelos E.Papalexakis公司 , 费芳 :
MAVIPER:用于可解释多智能体强化学习的学习决策树策略。 ECML/PKDD(4) 2022 : 251-266 [第14条] 斯蒂芬妮·米拉尼 , Nicholay托宾 , 曼勒·维罗索 , 费芳 :
可解释强化学习的调查。 CoRR公司 abs/2202.08434 ( 2022 ) [i13] 安西·卡内维斯托 , 斯蒂芬妮·米拉尼 , 卡洛里斯·拉马诺斯卡斯 , Nicholay托宾 , 林子川 , 李军友 , 石嘉宁 , 德恒叶 , 强夫 , 魏阳 , 魏俊红(Weijun Hong) , 黄忠岳 , 陈海诚 , 曾广军 , 岳琳 , 文森特·米凯利 , 埃洛伊·阿隆索 , 弗朗索瓦·弗莱特 , 亚历山大·尼库林 , 尤里·贝卢索夫 , 奥列格·斯维琴科 , 阿列克谢·谢尔曼 :
MineRL Diamond 2021竞赛:概述、结果和经验教训。 CoRR公司 abs/2202.10583 ( 2022 ) [i12] 罗欣·沙阿 , 史蒂芬·H·王 , 科迪·威尔德 , 斯蒂芬妮·米拉尼 , 安西·卡内维斯托 , 多汁的G.Goecks , 尼古拉斯·韦托维奇(Nicholas R.Waytowich) , 大卫·沃特金斯·沃尔斯 , 巴拉特·普拉卡什 , 埃德蒙·米尔斯 , 迪维安什·加格 , 亚历山大·弗里斯 , 亚历山大·索利 , 陈俊勋 , 丹尼尔·德尔·卡斯蒂略 , 汤姆·利伯鲁姆 :
回顾2021年玄武岩从人类反馈中学习竞赛。 CoRR公司 abs/2204.07123 ( 2022 ) [i11] 米卡·卡罗尔 , 杰西·林 , 奥尔天堂 , 罗卢卡·乔治斯库 , 孙明飞 , 大卫·比格内尔 , 斯蒂芬妮·米拉尼 , 卡贾·霍夫曼 , 马修·豪斯克内赫特 , 安卡·D·德拉甘 , 萨姆·德夫林 :
通过双向变换实现序列决策问题的灵活推理。 CoRR公司 腹肌/2204.13326 ( 2022 ) [i10] 斯蒂芬妮·米拉尼 , 张志成 , 尼古拉·托宾 , 浙远瑞安石 , 查尔斯·A·坎胡亚 , Evangelos E.Papalexakis公司 , 费芳 :
MAVIPER:可解释多智能体强化学习的学习决策树策略。 CoRR公司 abs/2205.12449 ( 2022 ) [第九章] 米卡·卡罗尔 , 奥尔天堂 , 杰西·林 , 罗卢卡·乔治斯库 , 孙明飞 , 大卫·比格内尔 , 斯蒂芬妮·米拉尼 , 卡贾·霍夫曼 , 马修·霍斯克内克 , 安卡·D·德拉甘 , 萨姆·德夫林 :
UniMASK:序列决策问题中的统一推理。 CoRR公司 腹肌/2211.10869 ( 2022 ) 2021 【c9】 尼古拉·托宾 , 斯蒂芬妮·米拉尼 , 费芳 , 曼勒·维罗索 :
迭代边界MDP:通过不可解释的方法学习可解释的策略。 AAAI公司 2021 : 9923-9931 【c8】 安西·卡内维斯托 , 斯蒂芬妮·米拉尼 , 卡洛里斯·拉马诺斯卡斯 , 尼古拉·托宾 , 林子川 , 李军友 , 石嘉宁 , 德恒叶 , 强夫 , 魏阳 , 魏俊红(Weijun Hong) , 黄忠岳 , 陈海诚 , 曾广军 , 岳琳 , 文森特·米凯利 , 埃洛伊·阿隆索 , 弗朗索瓦·弗莱特 , 亚历山大·尼库林 , 尤里·贝卢索夫 , 奥列格·斯维琴科 , 阿列克谢·谢尔曼 :
MineRL Diamond 2021竞赛:概述、结果和经验教训。 NeurIPS(竞争和演示) 2021 : 13-28 【c7】 斯蒂芬妮·米拉尼 , 安西·卡内维斯托 , 卡洛里斯·拉马诺斯卡斯 , 桑德·舒尔霍夫 , 布兰登·霍顿 , 莎拉达·莫汉蒂 , 拜伦·加尔布雷斯 , 柯晨 , 严嵩 , 周天泽 , 余炳泉 , 何刘 , Kai Guan公司 , 胡玉晶 , 吕唐杰 , 费德里科·马拉托 , 弗洛里安·利奥波德 , 阿莫·劳特 , Hautamäki镇 , 安德鲁·梅尔尼克 , 石田淑 , 乔·恩里克 , 罗伯特·克拉瑟特 , 沃尔特·劳里托 , 卢卡斯·卡佐内利 , 塞德里克·库尔巴赫 , 尼古拉斯·波波维奇 , 马文·施韦泽 , Ellen R.诺沃塞尔 , 多汁的G.Goecks , 尼古拉斯·韦托维奇(Nicholas R.Waytowich) , 戴维·沃特金斯 , 乔什米勒 , 罗欣·沙阿 :
用人的反馈解决模糊任务:MineRL BASALT 2022竞赛回顾。 NeurIPS(竞争和演示) 2021 : 171-188 【c6】 罗欣·沙阿 , 史蒂芬·H·王 , 科迪·威尔德 , 斯蒂芬妮·米拉尼 , 安西·卡内维斯托 , 多汁的G.Goecks , 尼古拉斯·韦托维奇(Nicholas R.Waytowich) , 大卫·沃特金斯·沃尔斯 , 巴拉特·普拉卡什 , 埃德蒙·米尔斯 , 迪维安什·加格 , 亚历山大·弗里斯 , 亚历山大·索利 , 陈俊勋 , 丹尼尔·德尔·卡斯蒂略 , 汤姆·利伯鲁姆 :
回顾2021年MineRL玄武岩竞赛“从人类反馈中学习”。 NeurIPS(竞争和演示) 2021 : 259-272 [i8] 威廉·H·格斯 , 马里奥·伊诺森特·卡斯特罗 , 萨姆·德夫林 , 布兰登·霍顿 , Noboru肖恩·库诺 , 克里斯曼·卢米斯 , 斯蒂芬妮·米拉尼 , 莎拉达·莫汉蒂 , 中田圭介 , 鲁斯兰·萨拉库丁诺夫 , 约翰·舒尔曼 , Shinya Shiroshita先生 , 尼古拉·托宾 , 阿维纳什·乌马迪辛古 , Oriol葡萄酒 :
MineRL 2020使用人类先验的样本高效强化学习竞赛。 CoRR公司 abs/2101.11071 ( 2021 ) [i7] 尼古拉·托宾 , 斯蒂芬妮·米拉尼 , 费芳 , 曼勒·维罗索 :
迭代边界MDP:通过不可解释的方法学习可解释的策略。 CoRR公司 abs/2102.13045 ( 2021 ) [i6] 威廉·赫布根·格斯 , 斯蒂芬妮·米拉尼 , 尼古拉·托宾 , 布兰登·霍顿 , 莎拉达·莫汉蒂 , 安德鲁·梅尔尼克 , 奥古斯汀·哈特 , Benoit Buschmas公司 , 比亚恩·贾斯特 , 克里斯托夫·贝甘斯基 , 丹尼斯·海特坎普 , 马克·亨宁 , 海尔格·J·里特 , 吴成杰 , 郝晓天 , 陆一鸣 , 航宇毛 , 毛一欢 , 王超(Chao Wang) , 米查尔·奥帕诺维奇 , 安西·卡内维斯托 , 亚尼克·施拉纳 , 克里斯蒂安·谢勒 , 周锡仁 , 刘璐 , Daichi Nishio公司 , Toi Tsuneda公司 , 卡洛里斯·拉马诺斯卡斯 , 加比亚·朱塞维尤特 :
面向强大且不受领域限制的强化学习竞赛。 CoRR公司 abs/2106.03748 ( 2021 ) [i5] 罗欣·沙阿 , 科迪·威尔德 , 史蒂芬·H·王 , 内尔·亚历克斯 , 布兰登·霍顿 , 威廉·H·格斯 , 莎拉达·莫汉蒂 , 安西·卡内维斯托 , 斯蒂芬妮·米拉尼 , 尼古拉·托宾 , 彼得·阿比尔 , 斯图尔特·罗素 , 安卡·D·德拉甘 :
MineRL BASALT从人类反馈中学习竞赛。 CoRR公司 abs/2107.01969 ( 2021 ) 2020 【c5】 约翰·温德 , 斯蒂芬妮·米拉尼 , 马修·兰登 , 埃里布斯噢 , 谢恩·帕尔 , 肖恩·斯奎尔 , 玛丽·德斯贾丁斯 , 辛西娅·马图塞克 :
学习可转移子任务时,使用抽象学习模型进行规划。 AAAI公司 2020 : 9992-10000 【c4】 斯蒂芬妮·米拉尼 , 沈伟然 , Kevin S.Chan(凯文·S·陈) , 斯里达尔·文卡泰桑 , 南迪·O·莱斯利 , 查尔斯·A·坎胡亚 , 费芳 :
在基于攻击图的安全游戏中利用欺骗的力量。 游戏安全 2020 : 147-167 【c3】 威廉·赫布根·格斯 , 斯蒂芬妮·米拉尼 , 尼古拉·托宾 , 布兰登·霍顿 , 莎拉达·莫汉蒂 , 安德鲁·梅尔尼克 , 奥古斯汀·哈特 , Benoit Buschmas公司 , 比亚恩·贾斯特 , 克里斯托弗·贝甘斯基 , 丹尼斯·海特坎普 , 马克·亨宁 , 海尔格·J·里特 , 吴成杰 , 郝晓天 , 陆一鸣 , 毛航宇 , 毛一欢 , 王超(Chao Wang) , 米查尔·奥帕诺维奇 , 安西·卡内维斯托 , 亚尼克·施拉纳 , 克里斯蒂安·谢勒 , 周锡仁 , 刘璐 , Daichi Nishio公司 , Toi Tsuneda公司 , 卡洛里斯·拉马诺斯卡斯 , 加比亚·朱塞维尤特 :
走向稳健和领域无关的强化学习竞赛:MineRL 2020。 NeurIPS(竞争和演示) 2020 : 233-252 [i4] 斯蒂芬妮·米拉尼 , 尼古拉·托宾 , 布兰登·霍顿 , 威廉·H·格斯 , 莎拉达·莫汉蒂 , 中田圭介 , Oriol葡萄酒 , Noboru肖恩·库诺 :
2019年MineRL样本高效强化学习竞赛回顾性分析。 CoRR公司 abs/2003.05012 ( 2020 ) [i3] 布兰登·霍顿 , 斯蒂芬妮·米拉尼 , 尼古拉·托宾 , 威廉·H·格斯 , 卡贾·霍夫曼 , 迭戈·佩雷斯·利巴纳 , 曼勒·维罗索 , 鲁斯兰·萨拉库丁诺夫 :
保证深度学习竞赛的再现性。 CoRR公司 abs/2005.06041 ( 2020 )
2010 – 2019
2019 【c2】 华奥·李 , 斯蒂芬妮·米拉尼 , 维涅什拉姆·克里希那穆尔蒂 , 迈克尔·刘易斯 , 卡蒂亚·赛卡拉 :
国内机器人跨文化规范行为认知。 AIES公司 2019 : 345-351 【c1】 斯蒂芬妮·米拉尼 , 尼古拉·托宾 , 布兰登·霍顿 , 威廉·H·格斯 , 莎拉达·莫汉蒂 , 中田圭介 , Oriol葡萄酒 , Noboru肖恩·库诺 :
2019年MineRL样本高效强化学习竞赛回顾性分析。 NeurIPS(竞争和演示) 2019 : 203-214 [i2] 威廉·H·格斯 , 凯登·卡德尔 , 卡贾·霍夫曼 , 布兰登·霍顿 , 诺布鲁·库诺 , 斯蒂芬妮·米拉尼 , 莎拉达·莫汉蒂 , 迭戈·佩雷斯·利巴纳 , 鲁斯兰·萨拉库丁诺夫 , 尼古拉·托宾 , 曼勒·维罗索 , 菲利普·王 :
利用人类先验知识进行样本高效强化学习的MineRL竞赛。 CoRR公司 abs/1904.10079 ( 2019 ) [i1] 约翰·温德 , 斯蒂芬妮·米拉尼 , 马修·兰登 , 埃里布斯噢 , 谢恩·帕尔 , 肖恩·斯奎尔 , 玛丽·德斯贾丁斯 , 辛西娅·马图塞克 :
学习可转移子任务时,使用抽象学习模型进行规划。 CoRR公司 abs/1912.07544 ( 2019 )