[编辑]
第100卷:机器人学习会议,2019年11月30日至1日,
[编辑]
编辑:Leslie Pack Kaelbling、Danica Kragic、Komei Sugiura
[围兜][城市规划署]
有腿机器人的数据高效强化学习
杨玉祥(Yuxiang Yang)、肯·卡鲁瓦茨(Ken Caluwaerts)、艾蒂尔·伊斯肯(Atil Iscen)、张廷南(Tingnan Zhang)、谭洁(Jie Tan)、维卡斯·辛德瓦尼(Vikas Sindhwani);机器人学习会议记录,PMLR 100:1-10
[防抱死制动系统][下载PDF][补充邮政编码][补充视频]
遵循或不遵循:从观察中选择性模仿学习
Youngwoon Lee、Edward S.Hu、Zhengyu Yang、Joseph J.Lim;机器人学习会议记录,PMLR 100:11-23
[防抱死制动系统][下载PDF][网站]
关于策略机器人从聚合主管那里学习
Ashwin Balakrishna、Brijen Thananjeyan、Jonathan Lee、Felix Li、Arsh Zahed、Joseph E.Gonzalez、Ken Goldberg;机器人学习会议记录,PMLR 100:24-41
[防抱死制动系统][下载PDF]
基于级联变分推理的多步操作动力学学习
宽芳、朱玉科、阿尼梅斯·加格、西尔维奥·萨瓦雷斯、李飞飞;机器人学习会议记录,PMLR 100:42-52
[防抱死制动系统][下载PDF]
S4G:Amodal Single-view Single-Shot SE(3)杂波场景中的抓取检测
秦宇哲、陈瑞、郝朱、孟松、徐静、郝苏;机器人学习会议记录,PMLR 100:53-65
[防抱死制动系统][下载PDF]
通过作弊学习
Dian Chen、Brady Zhou、Vladlen Koltun、Philipp Krähenbühl;机器人学习会议记录,PMLR 100:66-75
[防抱死制动系统][下载PDF][补充邮政编码][源代码]
面向无视角句子生成的多模注意分支网络
Aly Magassouba、Komei Sugiura、Hisashi Kawai;机器人学习会议记录,PMLR 100:76-85
[防抱死制动系统][下载PDF][补充PDF]
多路径:用于行为预测的多概率锚定轨迹假设
Yuning Chai、Benjamin Sapp、Mayank Bansal、Dragomir Angelov;机器人学习会议记录,百万分之一百:86-99
[防抱死制动系统][下载PDF]
模型预测控制的以对象为中心的正向建模
叶玉飞、迪拉杰·甘地、阿比纳夫·古普塔、Shubham Tulsiani;机器人学习会议记录,PMLR 100:100-109
[防抱死制动系统][下载PDF][补充PDF][网站]
基于层次Sim2Real的移动多智能体操作
Ofir Nachum、Michael Ahn、Hugo Ponte、Gu Shixiang(Shane)、Vikash Kumar;机器人学习会议记录,PMLR 100:110-121
[防抱死制动系统][下载PDF][网站]
深度学习与验证相结合的精确对象实例检测
Siddharth Ancha、Junyu Nan、David Held;机器人学习会议记录,PMLR 100:122-141
[防抱死制动系统][下载PDF][源代码]
MAT:通过深度强化学习实现多指自适应触觉抓取
Bohan Wu、Iretiayo Akinola、Jacob Varley、Peter K.Allen;机器人学习会议记录,PMLR 100:142-161
[防抱死制动系统][下载PDF][补充邮政编码][网站]
好奇的iLQR:解决基于模型的RL中的不确定性
Sarah Bechtle、Yixin Lin、Akshara Rai、Ludovic Righetti、Franziska Meier;机器人学习会议记录,PMLR 100:162-171
[防抱死制动系统][下载PDF][补充邮政编码]
基于开关密度网络的混合系统辨识
迈克尔·伯克(Michael Burke)、尤丹·赫里斯托夫(Yordan Hristov)、苏布拉曼尼亚·拉马莫西(Subramanian Ramamoorthy);机器人学习会议记录,PMLR 100:172-181
[防抱死制动系统][下载PDF]
用基于能量的模型规范基于模型的规划
里努·博尼、朱霍·坎纳拉、亚历山大·伊林;机器人学习会议记录,PMLR 100:182-191
[防抱死制动系统][下载PDF]
人机协作决策模型的半监督学习
Vaibhav V.Unhelkar、Shen Li、Julie A.Shah;机器人学习会议记录,PMLR 100:192-203
[防抱死制动系统][下载PDF][补充邮政编码]
基于可学习Lyapunov函数重构的黎曼运动策略融合
穆斯塔法·穆卡丹(Mustafa Mukadam)、程庆安(Ching-An Cheng)、迪特尔·福克斯(Dieter Fox)、拜伦·布茨(Byron Boots)、内森·拉特利夫(Nathan Ratliff);机器人学习会议记录,PMLR 100:204-219
[防抱死制动系统][下载PDF][补充邮政编码]
基于感知注意的预测控制
Keuntaek Lee、Gabriel Nakajima An、Viacheslav Zakharov、Evangelos A.Theodorou;机器人学习会议记录下午100:220-232
[防抱死制动系统][下载PDF][补充邮政编码][补充视频]
贝叶斯优化在机器人学习中满足黎曼流形
Noémie Jaquier、Leonel Rozo、Sylvain Calinon、Mathias Bürger;机器人学习会议记录,PMLR 100:233-246
[防抱死制动系统][下载PDF][补充邮政编码][网站]
通过基于模型的高斯过程进行演示学习
Noémie Jaquier、David Ginsbourger、Sylvain Calinon;机器人学习会议记录,PMLR 100:247-257
[防抱死制动系统][下载PDF][补充邮政编码][网站]
基于贝叶斯模型强化学习的变分推理MPC
冈田正史(Masashi Okada)、田口达弘(Tadahiro Taniguchi);机器人学习会议记录,下午:100:258-272
[防抱死制动系统][下载PDF][源代码]
从演示中学习概率操作技能的序列优化
Lukas Schwenkel、Meng Guo、Mathias Bürger;机器人学习会议记录,PMLR 100:273-282
[防抱死制动系统][下载PDF][补充邮政编码]
资源约束多智能体系统的预测安全网络
Mathias Bürger,Meng Guo;机器人学习会议记录,PMLR 100:283-292
[防抱死制动系统][下载PDF][补充邮政编码]
笛卡尔空间机器人控制中方向动态运动基元的正确公式
列奥尼达斯·库特拉斯(Leonidas Koutras)、佐伊·杜尔盖里(Zoe Doulgeri);机器人学习会议记录,PMLR 100:293-302
[防抱死制动系统][下载PDF][补充邮政编码][补充视频]
通过移动进行掩蔽:从姿势信息中学习无干扰雷达里程表
丹·巴恩斯、罗布·韦斯顿、英格玛·波斯纳;机器人学习会议记录下午100:303-316
[防抱死制动系统][下载PDF][补充视频]
学习Cassie的运动技能:迭代设计和模拟现实
谢昭明、帕特里克·克莱里、杰里米·道、佩德罗·莫利斯、乔南森·赫斯特、米歇尔·潘恩;机器人学习会议记录,PMLR 100:317-329
[防抱死制动系统][下载PDF][补充邮政编码]
通过自动标记演示实现更好的演示模拟学习
Daniel S.Brown、Wonjoon Goo、Scott Niekum;机器人学习会议记录,PMLR 100:330-359
[防抱死制动系统][下载PDF][补充邮政编码][网站]
马尔可夫决策过程中的互信息正则化与行为批判性学习
费利克斯·雷布弗里德(Felix Leibfried)、乔迪·格拉乌·莫亚(Jordi Grau-Moya);机器人学习会议记录,PMLR 100:360-373
[防抱死制动系统][下载PDF]
基于模型的规划与基于能量的模型
杜一伦、林托鲁、伊戈尔·莫达奇;机器人学习会议记录,PMLR 100:374-383
[防抱死制动系统][下载PDF]
识别自动驾驶的未知实例
Kelvin Wong、Shenlong Wang、Mengye Ren、Ming Liang、Raquel Urtasun;机器人学习会议记录,下午:100:384-393
[防抱死制动系统][下载PDF]
视觉和对话框导航
杰西·托马森(Jesse Thomason)、迈克尔·默里(Michael Murray)、玛亚·卡克马克(Maya Cakmak)、卢克·泽特莫耶(Luke Zettlemoyer);机器人学习会议记录,PMLR 100:394-406
[防抱死制动系统][下载PDF][补充邮政编码][补充视频]
离散剩余流用于行人行为概率预测
Ajay Jain、Sergio Casas、Renjie Liao、Yuwen Xiong、Song Feng、Sean Segal、Raquel Urtasun;机器人学习会议记录,PMLR 100:407-419
[防抱死制动系统][下载PDF][补充邮政编码]
新环境下视觉导航的最优控制与学习相结合
Somil Bansal、Varun Tolani、Saurabh Gupta、Jitendra Malik、Claire Tomlin;机器人学习会议记录,PMLR 100:420-429
[防抱死制动系统][下载PDF][网站]
通过规范化流利用非策略算法中的探索
Bogdan Mazoure、Thang Doan、Audrey Durand、Joelle Pineau、R Devon Hjelm;机器人学习会议记录,PMLR 100:430-444
[防抱死制动系统][下载PDF][源代码][源代码][源代码]
TuneNet:用于系统识别和模拟现实机器人任务传输的一次剩余调整
Adam Allevato、Elaine Schaertl Short、Mitch Pryor、Andrea Thomaz;机器人学习会议记录,PMLR 100:445-455
[防抱死制动系统][下载PDF][补充邮政编码][源代码][源代码][源代码][网站]
基于动态压缩的变分潜在空间贝叶斯优化
Rika Antonova、Akshara Rai、Tianyu Li、Danica Kragic;机器人学习会议记录下午100:456-465
[防抱死制动系统][下载PDF][源代码]
通过评估现实世界机器人的深度强化学习算法对再现性的研究
Nicolai A.Lynnerup、Laura Nolling、Rasmus Hasle、John Hallam;机器人学习会议记录,下午:100:466-489
[防抱死制动系统][下载PDF][补充邮政编码][源代码][源代码]
学习使用固定状态表示来操作对象集合
塔克·赫尔曼斯·马修·威尔逊;机器人学习会议记录,PMLR 100:490-502
[防抱死制动系统][下载PDF]
具有重投影距离的鲁棒半监督单目深度估计
维托·吉齐里尼(Vitor Guizilini)、洁丽(Jie Li)、瑞斯·安布罗斯(Rares Ambrus)、苏迪普·皮莱(Sudeep Pillai)、阿德里安·盖登(Adrien Gaidon);机器人学习会议记录,PMLR 100:503-512
[防抱死制动系统][下载PDF][补充PDF]
自主式情境强化学习
Pascal Klink、Hany Abdulsamad、Boris Belousov、Jan Peters;机器人学习会议记录,PMLR 100:513-529
[防抱死制动系统][下载PDF][补充邮政编码][源代码]
自我监督机器人学习的上下文想象目标
Ashvin Nair、Shikhar Bahl、Alexander Khazatsky、Vitchyr Pong、Glen Berseth、Sergey Levine;机器人学习会议记录,PMLR 100:530-539
[防抱死制动系统][下载PDF][网站]
自然语言教学中的条件驱动
Junha Roh、Chris Paxton、Andrzej Pronobis、Ali Farhadi、Dieter Fox;机器人学习会议记录,PMLR 100:540-551
[防抱死制动系统][下载PDF][补充邮政编码][网站]
反向动力学模型学习的对抗性主动探索
张伟红、徐菊福、孙云珊、李春怡;机器人学习会议记录,PMLR 100:552-565
[防抱死制动系统][下载PDF]
想象价值梯度:基于模型的策略优化与可传递潜在动力学模型
阿伦库马尔·拜拉文(Arunkumar Byravan)、约斯特·托比亚斯·斯普林伯格(Jost Tobias Springenberg)、阿巴斯·阿卜杜勒马利基(Abbas Abdolmaleki)、罗兰·哈夫纳(Roland Hafner)、迈克尔·纽内特(Michael Neunert)、托马斯·兰佩(Thomas Lampe);机器人学习会议记录,PMLR 100:566-589
[防抱死制动系统][下载PDF][网站]
PIC:多智能体深度强化学习的置换不变量批判
Iou-Jen Liu、Raymond A.Yeh、Alexander G.Schwing;机器人学习会议记录,PMLR 100:590-602
[防抱死制动系统][下载PDF][网站]
HRL4IN:移动机械手交互式导航的分层强化学习
李成树、夏飞、罗伯托·马丁·马丁、西尔维奥·萨瓦雷斯;机器人学习会议记录,PMLR 100:603-616
[防抱死制动系统][下载PDF][网站]
从自我中心视频学习导航子例程
Ashish Kumar、Saurabh Gupta、Jitendra Malik;机器人学习会议记录,PMLR 100:617-626
[防抱死制动系统][下载PDF][补充PDF][网站]
可学习的安全措施
Steve Heim、Alexander von Rohr、Sebastian Trimpe、Alexander Badri-Spröwitz;机器人学习会议记录,电话:100:627-639
[防抱死制动系统][下载PDF][补充邮政编码]
具有深微分函数和动作约束的HJB最优反馈控制
Michael Lutter、Boris Belousov、Kim Listmann、Debora Clever、Jan Peters;机器人学习会议记录,PMLR 100:640-650
[防抱死制动系统][下载PDF]
多帧GAN:微光立体视觉里程表的图像增强
Eunah Jung、Nan Yang、Daniel Cremers;机器人学习会议记录,PMLR 100:651-660
[防抱死制动系统][下载PDF][补充邮政编码]
基于图神经网络的机器人群分散控制器学习
叶卡捷琳娜·托尔斯塔亚、费尔南多·伽马、詹姆斯·保洛斯、乔治·帕帕斯、维杰伊·库马尔、亚历杭德罗·里贝罗;机器人学习会议记录,PMLR 100:671-682
[防抱死制动系统][下载PDF][补充邮政编码]
用于强化学习的可证明鲁棒黑箱优化
Krzysztof Choromanski、Aldo Pacchiano、Jack Parker-Holder、Yunhao Tang、Deepali Jain、Yuxiang Yang、Atil Ischen、Jasmine Hsu、Vikas Sindhwani;机器人学习会议记录,PMLR 100:683-696型
[防抱死制动系统][下载PDF]
作为近似输入推断的随机最优控制
Joe Watson、Hany Abdulsamad、Jan Peters;机器人学习会议记录,PMLR 100:697-716
[防抱死制动系统][下载PDF][源代码]
AC-Teach:一种贝叶斯行为批评方法,用于次优教师集合的政策学习
安德烈·库伦科夫(Andrey Kurenkov)、阿杰伊·曼德莱卡(Ajay Mandlekar)、罗伯托·马丁·马汀(Roberto Martin-Martin)、西尔维奥·萨瓦雷斯(Silvio Savarese)、阿尼梅斯·加格;机器人学习会议记录,电话:100:717-734
[防抱死制动系统][下载PDF][网站]
机器人混合控制的连续离散强化学习
迈克尔·纽内特(Michael Neunert)、阿巴斯·阿卜杜勒马利基(Abbas Abdolmaleki)、马库斯·沃尔夫迈尔(Markus Wulfmeier)、托马斯·兰佩(Thomas Lampe)、托比亚斯·斯普林伯格(Tobias Springenberg)、罗兰·哈夫纳(Roland Hafner)、弗朗西斯科·罗曼诺(Fra;机器人学习会议记录,百万分之一百:735-751
[防抱死制动系统][下载PDF][补充邮政编码]
从伙伴的行动中学习:分散机器人团队中的角色
Dylan P.Losey、Mengxi Li、Jeannette Bohg、Dorsa Sadigh;机器人学习会议记录,PMLR 100:752-765
[防抱死制动系统][下载PDF][补充邮政编码]
基于多步骤生成模型的多Agent强化学习
Orr Krupnik、Igor Mordatch、Aviv Tamar;机器人学习会议记录,PMLR 100:776-790
[防抱死制动系统][下载PDF][补充邮政编码]
学习使用中级视觉优先级进行导航
亚历山大·萨克斯(Alexander Sax)、杰弗里·张(Jeffrey O.Zhang)、布拉德利·埃米(Bradley Emi)、阿米尔·扎米尔(Amir Zamir)、西尔维奥·萨瓦雷斯(Silvio Savarese)、列奥尼达斯·吉巴斯(Leonidas Guib;机器人学习会议记录,PMLR 100:791-812
[防抱死制动系统][下载PDF][补充PDF][网站]
学习外部过程规划的紧凑模型
罗汉·奇蒂尼斯(Rohan Chitnis)、托马斯·洛扎诺·佩雷斯(Tomás Lozano-Pérez);机器人学习会议记录,PMLR 100:813-822
[防抱死制动系统][下载PDF][补充邮政编码][补充视频]
大型机器人控制的图形策略梯度
阿尔巴兹·汗、叶卡捷琳娜·托尔斯塔亚、亚历杭德罗·里贝罗、维杰伊·库马尔;机器人学习会议记录,PMLR 100:823-834
[防抱死制动系统][下载PDF]
连续参数化环境下Deep RL课程学习的教师算法
雷米·波特拉斯(Rémy Portelas)、塞德里克·科拉斯(Cédric Colas)、卡贾·霍夫曼(Katja Hofmann)、皮埃尔·伊夫斯·奥德耶(Pierre-Yves Oudeyer);机器人学习会议记录,PMLR 100:835-853
[防抱死制动系统][下载PDF][源代码][网站][网站]
形态和行为的数据高效协同适应与深度强化学习
Kevin Sebastian Luck、Heni Ben Amor、Roberto Calandra;机器人学习会议记录,PMLR 100:854-869
[防抱死制动系统][下载PDF][网站]
用于解释和从演示中学习的纠缠关系表示
Yordan Hristov、Daniel Angelov、Michael Burke、Alex Lascarides、Subramanian Ramamoorthy;机器人学习会议记录,PMLR 100:870-884
[防抱死制动系统][下载PDF][网站]
RoboNet:大规模多机器人学习
Sudeep Dasari、Frederik Ebert、Stephen Tian、Suraj Nair、Bernadette Bucher、Karl Schmeckpeper、Siddharth Singh、Sergey Levine、Chelsea Finn;机器人学习会议记录,PMLR 100:885-897
[防抱死制动系统][下载PDF][网站]
环境行为界限的反例引导学习
陈宇晓、萨曼特·达塔赫里、董文明、理查德·默里;机器人学习会议记录,PMLR 100:898-909
[防抱死制动系统][下载PDF][源代码]
MAME:模型预测Meta-Exploration
Swaminathan Gurumurthy、Sumit Kumar、Katia Sycara;机器人学习会议记录,PMLR 100:910-922
[防抱死制动系统][下载PDF][网站]
用于激光雷达点云三维目标检测的端到端多视图融合
Yin Zhou、Pei Sun、Yu Zhang、Dragomir Angelov、Jiyang Gao、Tom Ouyang、James Guo、Jiquan Ngiam、Vijay Vasudevan;机器人学习会议记录,PMLR 100:923-932
[防抱死制动系统][下载PDF]
学习动作原语的任务条件变分自动编码器
Michael Noseworthy、Rohan Paul、Subhro Roy、Daehyung Park、Nicholas Roy;机器人学习会议记录,PMLR 100:933-944型
[防抱死制动系统][下载PDF]
准纽顿信赖域策略优化
Devesh K.Jha、Arvind U.Raghunathan、Diego Romeres;机器人学习会议记录,PMLR 100:945-954型
[防抱死制动系统][下载PDF][补充PDF]
用于指导任务和动作规划的具有关系状态表示的学习值函数
Beomjoon Kim、Luke Shimanuki;机器人学习会议记录,PMLR 100:955-968
[防抱死制动系统][下载PDF]
自适应模型预测控制的局部加权回归伪随机
Grady R.Williams、Brian Goldfain、Keuntaek Lee、Jason Gibson、James M.Rehg、Evangelos A.Theodorou;机器人学习会议记录,PMLR 100:969-978
[防抱死制动系统][下载PDF][补充邮政编码]
图形结构视觉模拟
马克西米利安·西布(Maximilian Sieb)、周贤(Zhou Xian)、黄奥黛丽(Audrey Huang)、奥利弗·克罗默(Oliver Kroemer)、卡特琳娜·弗拉基亚达基(Katerina Fraggiadaki);机器人学习会议记录,百万分之一百:979-989
[防抱死制动系统][下载PDF][网站]
深度值模型预测控制
David Hoeller、Farbod Farshidian、Marco Hutter;机器人学习会议记录,PMLR 100:990-1004
[防抱死制动系统][下载PDF][补充邮政编码][补充视频]
利用贝叶斯非参数逆强化学习推断任务目标和约束
大英公园、迈克尔·诺塞沃西、罗汉·保罗、苏布罗·罗伊、尼古拉斯·罗伊;机器人学习会议记录,下午:100:1005-1014
[防抱死制动系统][下载PDF][补充邮政编码]
体验式视觉预见
Lin Yen-Chen、Maria Bauza、Phillip Isola;机器人学习会议记录,PMLR 100:1015-1024
[防抱死制动系统][下载PDF][补充视频]
接力策略学习:通过模仿和强化学习解决长期任务
阿比谢克·古普塔(Abhishek Gupta)、维卡什·库马尔(Vikash Kumar)、科里·林奇(Corey Lynch)、谢尔盖·莱文(Sergey Levine)、卡罗尔·豪斯曼(Karol Hausman);机器人学习会议记录,PMLR 100:1025-1037
[防抱死制动系统][下载PDF][网站]
面向人类教师的机器人非语言反馈
桑迪·H·黄、伊莎贝拉·黄、拉维·潘迪亚、安卡·D·德拉甘;机器人学习会议记录,PMLR 100:1038-1051
[防抱死制动系统][下载PDF]
用于自我监督自我运动估计的双流网络
Rares Ambrus、Vitor Guizilini、Jie Li、Sudeep Pillai Adrien Gaidon;机器人学习会议记录,PMLR 100:1052-1061
[防抱死制动系统][下载PDF][补充PDF]
基于模型的行为克隆与未来图像相似性学习
Alan Wu、AJ Piergiovanni、Michael S.Ryoo;机器人学习会议记录,PMLR 100:1062-1077
[防抱死制动系统][下载PDF]
最坏情况策略渐变
伊川Charlie Tang、Jian Zhang、Ruslan Salakhutdinov;机器人学习会议记录,PMLR 100:1078-1093
[防抱死制动系统][下载PDF][补充邮政编码]
元世界:多任务和元强化学习的基准和评估
余天河、迪尔德丽·奎伦、何展鹏、瑞安·朱利安、卡洛尔·豪斯曼、切尔西·芬恩、谢尔盖·莱文;机器人学习会议记录,PMLR 100:1094-1100
[防抱死制动系统][下载PDF][网站][源代码]
学习灵巧操作的深层动力学模型
Anusha Nagabandi、Kurt Konolige、Sergey Levine、Vikash Kumar;机器人学习会议记录,PMLR 100:1101-1112
[防抱死制动系统][下载PDF][网站]
从游戏中学习潜在计划
科里·林奇、莫希·坎萨里、特德·肖、维卡什·库马尔、乔纳森·汤普森、谢尔盖·莱文、皮埃尔·塞尔马内特;机器人学习会议记录,PMLR 100:1113-1132
[防抱死制动系统][下载PDF][网站]
密集目标多实例的场景级姿态估计
Chaitanya Mitash、Bowen Wen、Kostas Bekris、Abdeslam Boularias;机器人学习会议记录下午100:1133-1145
[防抱死制动系统][下载PDF]
基于宏操作的深度多智能体强化学习
Yuchen Xiao、Joshua Hoffman、Christopher Amato;机器人学习会议记录,PMLR 100:1146-1161
[防抱死制动系统][下载PDF][补充邮政编码]
主动域随机化
Bhairav Mehta、Manfred Diaz、Florian Golemo、Christopher J.Pal、Liam Paull;机器人学习会议记录,PMLR 100:1162-1176
[防抱死制动系统][下载PDF]
提出简单问题:一种面向用户的主动奖励学习方法
Erdem B\iy\ik、马来亚人Palan、Nicholas C.Landolfi、Dylan P.Losey、Dorsa Sadigh;机器人学习会议记录,PMLR 100:1177-1190
[防抱死制动系统][下载PDF][补充邮政编码][源代码][补充视频]
部分可观测环境中的语言引导语义映射和移动操作
Siddharth Patki、Ethan Fahnestock、Thomas M.Howard、Matthew R.Walter;机器人学习会议记录,PMLR 100:1201-1210
[防抱死制动系统][下载PDF][补充邮政编码]
从演示中学习高维参数约束
Glen Chou、Necmiye Ozay、Dmitry Berenson;机器人学习会议记录,PMLR 100:1211-1230
[防抱死制动系统][下载PDF][补充邮政编码]
基于变分优化的无限维随机系统强化学习
伊桑·N·埃文斯(Ethan N.Evans)、马库斯·佩里拉(Marcus A.Periera)、乔治·布泽利斯(George I.Boutselis)、埃文格洛斯·塞奥多罗(Evangelos A.Theodorou);机器人学习会议记录,PMLR 100:1231-1246
[防抱死制动系统][下载PDF][补充邮政编码][补充视频][源代码]
了解机器人学习中的教师注视模式
Akanksha Saran、Elaine Schaertl Short、Andrea Thomaz、Scott Niekum;机器人学习会议记录,PMLR 100:1247-1258
[防抱死制动系统][下载PDF][补充邮政编码]
模仿学习方法的发散最小化观点
Seyed Kamyar Seyed Ghasemipour、Richard Zemel、Shixiang Gu;机器人学习会议记录,PMLR 100:1259-1277
[防抱死制动系统][下载PDF][源代码][网站]
衰退的地平线好奇心
Matthias Schultheis、Boris Belousov、Hany Abdulsamad、Jan Peters;机器人学习会议记录,PMLR 100:1278-1288
[防抱死制动系统][下载PDF][源代码]
学习将运动模型推广到新对象
Ben Abbatemateo、Stefanie Tellex、George Konidaris;机器人学习会议记录,PMLR 100:1289-1299
[防抱死制动系统][下载PDF][补充邮政编码]
ROBEL:低成本机器人学习的机器人基准
Michael Ahn、Henry Zhu、Kristian Hartikainen、Hugo Ponte、Abhishek Gupta、Sergey Levine、Vikash Kumar;机器人学习会议记录,PMLR 100:1300-1313
[防抱死制动系统][下载PDF][补充PDF]
视觉障碍者导航代理:人行道模拟器及实验
马丁·韦斯、西蒙·查莫罗、罗杰·吉尔吉斯、马戈·勒克、萨米拉·卡胡、约瑟夫·科恩、德里克·诺鲁泽扎莱、多伊娜·普雷库普、弗洛里安·戈列莫、克里斯·帕尔;机器人学习会议记录,PMLR 100:1314-1327
[防抱死制动系统][下载PDF][源代码][源代码][源代码]
用于深度强化学习的认证对抗鲁棒性
Björn Lütjens、Michael Everett、Jonathan P.How;机器人学习会议记录,PMLR 100:1328-1337
[防抱死制动系统][下载PDF]
基于模型的强化学习的异步方法
Yunzhi Zhang、Ignasi Clavera、Boren Tsai、Pieter Abbeel;机器人学习会议记录,下午:100:1338-1347
[防抱死制动系统][下载PDF][网站]
PyRoboLearn:面向机器人学习从业者的Python框架
Brian Delhaisse、Leonel Rozo、Darwin G.Caldwell;机器人学习会议记录下午100:1348-1358
[防抱死制动系统][下载PDF][网站]
无转矩测量反馈线性化控制的在线学习方法
M.Capotondi和G。C·特里西。Gaz,V。莫杜格诺,G。A.奥里奥洛。德卢卡;机器人学习会议记录,下午:100:1359-1368
[防抱死制动系统][下载PDF][补充邮政编码]
两种模式的最佳选择:分别利用RGB和深度分割未显示对象实例
克里斯托弗·谢(Christopher Xie)、于翔(Yu Xiang)、阿萨兰·穆萨维安(Arsalan Mousavian)、迪特尔·福克斯(Dieter Fox);机器人学习会议记录,PMLR 100:1369-1378
[防抱死制动系统][下载PDF][补充邮政编码][网站]
策略梯度方法中方差减少的轨迹控制变量
程庆安、严新燕、拜伦·布茨;机器人学习会议记录,PMLR 100:1379-1394
[防抱死制动系统][下载PDF][补充PDF]
多模态概率运动预测的核轨迹图
魏明志、莱昂内尔·奥特、法比奥·拉莫斯;机器人学习会议记录,PMLR 100:1405-1414
[防抱死制动系统][下载PDF][源代码]
学习使用模拟飞行将自然语言指令映射到物理四旋翼机控制
Valts Blukis、Yannick Terme、Eyvind Niklasson、Ross A.Knepper、Yoav Artzi;机器人学习会议记录,PMLR 100:1415-1438
[防抱死制动系统][下载PDF][补充邮政编码][补充视频][补充视频][源代码]
基于视觉模型的强化学习中的实体抽象
Rishi Veerapaneni、John D.Co-Reyes、Michael Chang、Michael Janner、Chelsea Finn、Jiajun Wu、Joshua Tenenbaum、Sergey Levine;机器人学习会议记录,PMLR 100:1439-1456
[防抱死制动系统][下载PDF]
从人体演示中学习多任务空间中的反应性运动策略
M.Asif Rana、Anqi Li、Harish Ravichandar、Mustafa Mukadam、Sonia Chernova、Dieter Fox、Byron Boots、Nathan Ratliff;机器人学习会议记录,PMLR 100:1457-1468
[防抱死制动系统][下载PDF][补充邮政编码][补充视频]