机器学习研究论文集| 2019年10月30日至11月1日机器人学习会议论文集，由机器学习研究文献集于2020年5月12日出版为第100卷。卷编辑：Leslie Pack Kaelbling Danica Kragic Komei Sugiura系列编辑：Neil D.Lawrence Mark Reid

第100卷：机器人学习会议，2019年11月30日至1日，

编辑：Leslie Pack Kaelbling、Danica Kragic、Komei Sugiura

筛选作者：过滤器标题：

有腿机器人的数据高效强化学习

杨玉祥（Yuxiang Yang）、肯·卡鲁瓦茨（Ken Caluwaerts）、艾蒂尔·伊斯肯（Atil Iscen）、张廷南（Tingnan Zhang）、谭洁（Jie Tan）、维卡斯·辛德瓦尼（Vikas Sindhwani）;机器人学习会议记录，PMLR 100:1-10

[防抱死制动系统][下载PDF][补充邮政编码][补充视频]

遵循或不遵循：从观察中选择性模仿学习

Youngwoon Lee、Edward S.Hu、Zhengyu Yang、Joseph J.Lim;机器人学习会议记录，PMLR 100:11-23

[防抱死制动系统][下载PDF][网站]

关于策略机器人从聚合主管那里学习

Ashwin Balakrishna、Brijen Thananjeyan、Jonathan Lee、Felix Li、Arsh Zahed、Joseph E.Gonzalez、Ken Goldberg;机器人学习会议记录，PMLR 100:24-41

[防抱死制动系统][下载PDF]

基于级联变分推理的多步操作动力学学习

宽芳、朱玉科、阿尼梅斯·加格、西尔维奥·萨瓦雷斯、李飞飞;机器人学习会议记录，PMLR 100:42-52

[防抱死制动系统][下载PDF]

S4G：Amodal Single-view Single-Shot SE（3）杂波场景中的抓取检测

秦宇哲、陈瑞、郝朱、孟松、徐静、郝苏;机器人学习会议记录，PMLR 100:53-65

[防抱死制动系统][下载PDF]

通过作弊学习

Dian Chen、Brady Zhou、Vladlen Koltun、Philipp Krähenbühl;机器人学习会议记录，PMLR 100:66-75

[防抱死制动系统][下载PDF][补充邮政编码][源代码]

面向无视角句子生成的多模注意分支网络

Aly Magassouba、Komei Sugiura、Hisashi Kawai;机器人学习会议记录，PMLR 100:76-85

[防抱死制动系统][下载PDF][补充PDF]

多路径：用于行为预测的多概率锚定轨迹假设

Yuning Chai、Benjamin Sapp、Mayank Bansal、Dragomir Angelov;机器人学习会议记录，百万分之一百：86-99

[防抱死制动系统][下载PDF]

模型预测控制的以对象为中心的正向建模

叶玉飞、迪拉杰·甘地、阿比纳夫·古普塔、Shubham Tulsiani;机器人学习会议记录，PMLR 100:100-109

[防抱死制动系统][下载PDF][补充PDF][网站]

基于层次Sim2Real的移动多智能体操作

Ofir Nachum、Michael Ahn、Hugo Ponte、Gu Shixiang（Shane）、Vikash Kumar;机器人学习会议记录，PMLR 100:110-121

[防抱死制动系统][下载PDF][网站]

深度学习与验证相结合的精确对象实例检测

Siddharth Ancha、Junyu Nan、David Held;机器人学习会议记录，PMLR 100:122-141

[防抱死制动系统][下载PDF][源代码]

MAT：通过深度强化学习实现多指自适应触觉抓取

Bohan Wu、Iretiayo Akinola、Jacob Varley、Peter K.Allen;机器人学习会议记录，PMLR 100:142-161

[防抱死制动系统][下载PDF][补充邮政编码][网站]

好奇的iLQR：解决基于模型的RL中的不确定性

Sarah Bechtle、Yixin Lin、Akshara Rai、Ludovic Righetti、Franziska Meier;机器人学习会议记录，PMLR 100:162-171

[防抱死制动系统][下载PDF][补充邮政编码]

基于开关密度网络的混合系统辨识

迈克尔·伯克（Michael Burke）、尤丹·赫里斯托夫（Yordan Hristov）、苏布拉曼尼亚·拉马莫西（Subramanian Ramamoorthy）;机器人学习会议记录，PMLR 100:172-181

[防抱死制动系统][下载PDF]

用基于能量的模型规范基于模型的规划

里努·博尼、朱霍·坎纳拉、亚历山大·伊林;机器人学习会议记录，PMLR 100:182-191

[防抱死制动系统][下载PDF]

人机协作决策模型的半监督学习

Vaibhav V.Unhelkar、Shen Li、Julie A.Shah;机器人学习会议记录，PMLR 100:192-203

[防抱死制动系统][下载PDF][补充邮政编码]

基于可学习Lyapunov函数重构的黎曼运动策略融合

穆斯塔法·穆卡丹（Mustafa Mukadam）、程庆安（Ching-An Cheng）、迪特尔·福克斯（Dieter Fox）、拜伦·布茨（Byron Boots）、内森·拉特利夫（Nathan Ratliff）;机器人学习会议记录，PMLR 100:204-219

[防抱死制动系统][下载PDF][补充邮政编码]

基于感知注意的预测控制

Keuntaek Lee、Gabriel Nakajima An、Viacheslav Zakharov、Evangelos A.Theodorou;机器人学习会议记录下午100:220-232

[防抱死制动系统][下载PDF][补充邮政编码][补充视频]

贝叶斯优化在机器人学习中满足黎曼流形

Noémie Jaquier、Leonel Rozo、Sylvain Calinon、Mathias Bürger;机器人学习会议记录，PMLR 100:233-246

[防抱死制动系统][下载PDF][补充邮政编码][网站]

通过基于模型的高斯过程进行演示学习

Noémie Jaquier、David Ginsbourger、Sylvain Calinon;机器人学习会议记录，PMLR 100:247-257

[防抱死制动系统][下载PDF][补充邮政编码][网站]

基于贝叶斯模型强化学习的变分推理MPC

冈田正史（Masashi Okada）、田口达弘（Tadahiro Taniguchi）;机器人学习会议记录，下午：100:258-272

[防抱死制动系统][下载PDF][源代码]

从演示中学习概率操作技能的序列优化

Lukas Schwenkel、Meng Guo、Mathias Bürger;机器人学习会议记录，PMLR 100:273-282

[防抱死制动系统][下载PDF][补充邮政编码]

资源约束多智能体系统的预测安全网络

Mathias Bürger，Meng Guo;机器人学习会议记录，PMLR 100:283-292

[防抱死制动系统][下载PDF][补充邮政编码]

笛卡尔空间机器人控制中方向动态运动基元的正确公式

列奥尼达斯·库特拉斯（Leonidas Koutras）、佐伊·杜尔盖里（Zoe Doulgeri）;机器人学习会议记录，PMLR 100:293-302

[防抱死制动系统][下载PDF][补充邮政编码][补充视频]

通过移动进行掩蔽：从姿势信息中学习无干扰雷达里程表

丹·巴恩斯、罗布·韦斯顿、英格玛·波斯纳;机器人学习会议记录下午100:303-316

[防抱死制动系统][下载PDF][补充视频]

学习Cassie的运动技能：迭代设计和模拟现实

谢昭明、帕特里克·克莱里、杰里米·道、佩德罗·莫利斯、乔南森·赫斯特、米歇尔·潘恩;机器人学习会议记录，PMLR 100:317-329

[防抱死制动系统][下载PDF][补充邮政编码]

通过自动标记演示实现更好的演示模拟学习

Daniel S.Brown、Wonjoon Goo、Scott Niekum;机器人学习会议记录，PMLR 100:330-359

[防抱死制动系统][下载PDF][补充邮政编码][网站]

马尔可夫决策过程中的互信息正则化与行为批判性学习

费利克斯·雷布弗里德（Felix Leibfried）、乔迪·格拉乌·莫亚（Jordi Grau-Moya）;机器人学习会议记录，PMLR 100:360-373

[防抱死制动系统][下载PDF]

基于模型的规划与基于能量的模型

杜一伦、林托鲁、伊戈尔·莫达奇;机器人学习会议记录，PMLR 100:374-383

[防抱死制动系统][下载PDF]

识别自动驾驶的未知实例

Kelvin Wong、Shenlong Wang、Mengye Ren、Ming Liang、Raquel Urtasun;机器人学习会议记录，下午：100:384-393

[防抱死制动系统][下载PDF]

视觉和对话框导航

杰西·托马森（Jesse Thomason）、迈克尔·默里（Michael Murray）、玛亚·卡克马克（Maya Cakmak）、卢克·泽特莫耶（Luke Zettlemoyer）;机器人学习会议记录，PMLR 100:394-406

[防抱死制动系统][下载PDF][补充邮政编码][补充视频]

离散剩余流用于行人行为概率预测

Ajay Jain、Sergio Casas、Renjie Liao、Yuwen Xiong、Song Feng、Sean Segal、Raquel Urtasun;机器人学习会议记录，PMLR 100:407-419

[防抱死制动系统][下载PDF][补充邮政编码]

新环境下视觉导航的最优控制与学习相结合

Somil Bansal、Varun Tolani、Saurabh Gupta、Jitendra Malik、Claire Tomlin;机器人学习会议记录，PMLR 100:420-429

[防抱死制动系统][下载PDF][网站]

通过规范化流利用非策略算法中的探索

Bogdan Mazoure、Thang Doan、Audrey Durand、Joelle Pineau、R Devon Hjelm;机器人学习会议记录，PMLR 100:430-444

[防抱死制动系统][下载PDF][源代码][源代码][源代码]

TuneNet：用于系统识别和模拟现实机器人任务传输的一次剩余调整

Adam Allevato、Elaine Schaertl Short、Mitch Pryor、Andrea Thomaz;机器人学习会议记录，PMLR 100:445-455

[防抱死制动系统][下载PDF][补充邮政编码][源代码][源代码][源代码][网站]

基于动态压缩的变分潜在空间贝叶斯优化

Rika Antonova、Akshara Rai、Tianyu Li、Danica Kragic;机器人学习会议记录下午100:456-465

[防抱死制动系统][下载PDF][源代码]

通过评估现实世界机器人的深度强化学习算法对再现性的研究

Nicolai A.Lynnerup、Laura Nolling、Rasmus Hasle、John Hallam;机器人学习会议记录，下午：100:466-489

[防抱死制动系统][下载PDF][补充邮政编码][源代码][源代码]

学习使用固定状态表示来操作对象集合

塔克·赫尔曼斯·马修·威尔逊;机器人学习会议记录，PMLR 100:490-502

[防抱死制动系统][下载PDF]

具有重投影距离的鲁棒半监督单目深度估计

维托·吉齐里尼（Vitor Guizilini）、洁丽（Jie Li）、瑞斯·安布罗斯（Rares Ambrus）、苏迪普·皮莱（Sudeep Pillai）、阿德里安·盖登（Adrien Gaidon）;机器人学习会议记录，PMLR 100:503-512

[防抱死制动系统][下载PDF][补充PDF]

自主式情境强化学习

Pascal Klink、Hany Abdulsamad、Boris Belousov、Jan Peters;机器人学习会议记录，PMLR 100:513-529

[防抱死制动系统][下载PDF][补充邮政编码][源代码]

自我监督机器人学习的上下文想象目标

Ashvin Nair、Shikhar Bahl、Alexander Khazatsky、Vitchyr Pong、Glen Berseth、Sergey Levine;机器人学习会议记录，PMLR 100:530-539

[防抱死制动系统][下载PDF][网站]

自然语言教学中的条件驱动

Junha Roh、Chris Paxton、Andrzej Pronobis、Ali Farhadi、Dieter Fox;机器人学习会议记录，PMLR 100:540-551

[防抱死制动系统][下载PDF][补充邮政编码][网站]

反向动力学模型学习的对抗性主动探索

张伟红、徐菊福、孙云珊、李春怡;机器人学习会议记录，PMLR 100:552-565

[防抱死制动系统][下载PDF]

想象价值梯度：基于模型的策略优化与可传递潜在动力学模型

阿伦库马尔·拜拉文（Arunkumar Byravan）、约斯特·托比亚斯·斯普林伯格（Jost Tobias Springenberg）、阿巴斯·阿卜杜勒马利基（Abbas Abdolmaleki）、罗兰·哈夫纳（Roland Hafner）、迈克尔·纽内特（Michael Neunert）、托马斯·兰佩（Thomas Lampe）;机器人学习会议记录，PMLR 100:566-589

[防抱死制动系统][下载PDF][网站]

PIC：多智能体深度强化学习的置换不变量批判

Iou-Jen Liu、Raymond A.Yeh、Alexander G.Schwing;机器人学习会议记录，PMLR 100:590-602

[防抱死制动系统][下载PDF][网站]

HRL4IN：移动机械手交互式导航的分层强化学习

李成树、夏飞、罗伯托·马丁·马丁、西尔维奥·萨瓦雷斯;机器人学习会议记录，PMLR 100:603-616

[防抱死制动系统][下载PDF][网站]

从自我中心视频学习导航子例程

Ashish Kumar、Saurabh Gupta、Jitendra Malik;机器人学习会议记录，PMLR 100:617-626

[防抱死制动系统][下载PDF][补充PDF][网站]

可学习的安全措施

Steve Heim、Alexander von Rohr、Sebastian Trimpe、Alexander Badri-Spröwitz;机器人学习会议记录，电话：100:627-639

[防抱死制动系统][下载PDF][补充邮政编码]

具有深微分函数和动作约束的HJB最优反馈控制

Michael Lutter、Boris Belousov、Kim Listmann、Debora Clever、Jan Peters;机器人学习会议记录，PMLR 100:640-650

[防抱死制动系统][下载PDF]

多帧GAN：微光立体视觉里程表的图像增强

Eunah Jung、Nan Yang、Daniel Cremers;机器人学习会议记录，PMLR 100:651-660

[防抱死制动系统][下载PDF][补充邮政编码]

通过深度强化学习保证连接性的多机器人导航

林俊通、杨旭云、郑培伟、惠成;机器人学习会议记录，PMLR 100:661-670

[防抱死制动系统][下载PDF][补充邮政编码]

基于图神经网络的机器人群分散控制器学习

叶卡捷琳娜·托尔斯塔亚、费尔南多·伽马、詹姆斯·保洛斯、乔治·帕帕斯、维杰伊·库马尔、亚历杭德罗·里贝罗;机器人学习会议记录，PMLR 100:671-682

[防抱死制动系统][下载PDF][补充邮政编码]

用于强化学习的可证明鲁棒黑箱优化

Krzysztof Choromanski、Aldo Pacchiano、Jack Parker-Holder、Yunhao Tang、Deepali Jain、Yuxiang Yang、Atil Ischen、Jasmine Hsu、Vikas Sindhwani;机器人学习会议记录，PMLR 100:683-696型

[防抱死制动系统][下载PDF]

作为近似输入推断的随机最优控制

Joe Watson、Hany Abdulsamad、Jan Peters;机器人学习会议记录，PMLR 100:697-716

[防抱死制动系统][下载PDF][源代码]

AC-Teach：一种贝叶斯行为批评方法，用于次优教师集合的政策学习

安德烈·库伦科夫（Andrey Kurenkov）、阿杰伊·曼德莱卡（Ajay Mandlekar）、罗伯托·马丁·马汀（Roberto Martin-Martin）、西尔维奥·萨瓦雷斯（Silvio Savarese）、阿尼梅斯·加格;机器人学习会议记录，电话：100:717-734

[防抱死制动系统][下载PDF][网站]

机器人混合控制的连续离散强化学习

迈克尔·纽内特（Michael Neunert）、阿巴斯·阿卜杜勒马利基（Abbas Abdolmaleki）、马库斯·沃尔夫迈尔（Markus Wulfmeier）、托马斯·兰佩（Thomas Lampe）、托比亚斯·斯普林伯格（Tobias Springenberg）、罗兰·哈夫纳（Roland Hafner）、弗朗西斯科·罗曼诺（Fra;机器人学习会议记录，百万分之一百：735-751

[防抱死制动系统][下载PDF][补充邮政编码]

从伙伴的行动中学习：分散机器人团队中的角色

Dylan P.Losey、Mengxi Li、Jeannette Bohg、Dorsa Sadigh;机器人学习会议记录，PMLR 100:752-765

[防抱死制动系统][下载PDF][补充邮政编码]

基于空中和地面测量的地面机器人节能路径规划

沃尔坎岛明汉卫;机器人学习会议记录，PMLR 100:766-775

[防抱死制动系统][下载PDF][补充邮政编码]

基于多步骤生成模型的多Agent强化学习

Orr Krupnik、Igor Mordatch、Aviv Tamar;机器人学习会议记录，PMLR 100:776-790

[防抱死制动系统][下载PDF][补充邮政编码]

学习使用中级视觉优先级进行导航

亚历山大·萨克斯（Alexander Sax）、杰弗里·张（Jeffrey O.Zhang）、布拉德利·埃米（Bradley Emi）、阿米尔·扎米尔（Amir Zamir）、西尔维奥·萨瓦雷斯（Silvio Savarese）、列奥尼达斯·吉巴斯（Leonidas Guib;机器人学习会议记录，PMLR 100:791-812

[防抱死制动系统][下载PDF][补充PDF][网站]

学习外部过程规划的紧凑模型

罗汉·奇蒂尼斯（Rohan Chitnis）、托马斯·洛扎诺·佩雷斯（Tomás Lozano-Pérez）;机器人学习会议记录，PMLR 100:813-822

[防抱死制动系统][下载PDF][补充邮政编码][补充视频]

大型机器人控制的图形策略梯度

阿尔巴兹·汗、叶卡捷琳娜·托尔斯塔亚、亚历杭德罗·里贝罗、维杰伊·库马尔;机器人学习会议记录，PMLR 100:823-834

[防抱死制动系统][下载PDF]

连续参数化环境下Deep RL课程学习的教师算法

雷米·波特拉斯（Rémy Portelas）、塞德里克·科拉斯（Cédric Colas）、卡贾·霍夫曼（Katja Hofmann）、皮埃尔·伊夫斯·奥德耶（Pierre-Yves Oudeyer）;机器人学习会议记录，PMLR 100:835-853

[防抱死制动系统][下载PDF][源代码][网站][网站]

形态和行为的数据高效协同适应与深度强化学习

Kevin Sebastian Luck、Heni Ben Amor、Roberto Calandra;机器人学习会议记录，PMLR 100:854-869

[防抱死制动系统][下载PDF][网站]

用于解释和从演示中学习的纠缠关系表示

Yordan Hristov、Daniel Angelov、Michael Burke、Alex Lascarides、Subramanian Ramamoorthy;机器人学习会议记录，PMLR 100:870-884

[防抱死制动系统][下载PDF][网站]

RoboNet：大规模多机器人学习

Sudeep Dasari、Frederik Ebert、Stephen Tian、Suraj Nair、Bernadette Bucher、Karl Schmeckpeper、Siddharth Singh、Sergey Levine、Chelsea Finn;机器人学习会议记录，PMLR 100:885-897

[防抱死制动系统][下载PDF][网站]

环境行为界限的反例引导学习

陈宇晓、萨曼特·达塔赫里、董文明、理查德·默里;机器人学习会议记录，PMLR 100:898-909

[防抱死制动系统][下载PDF][源代码]

MAME：模型预测Meta-Exploration

Swaminathan Gurumurthy、Sumit Kumar、Katia Sycara;机器人学习会议记录，PMLR 100:910-922

[防抱死制动系统][下载PDF][网站]

用于激光雷达点云三维目标检测的端到端多视图融合

Yin Zhou、Pei Sun、Yu Zhang、Dragomir Angelov、Jiyang Gao、Tom Ouyang、James Guo、Jiquan Ngiam、Vijay Vasudevan;机器人学习会议记录，PMLR 100:923-932

[防抱死制动系统][下载PDF]

学习动作原语的任务条件变分自动编码器

Michael Noseworthy、Rohan Paul、Subhro Roy、Daehyung Park、Nicholas Roy;机器人学习会议记录，PMLR 100:933-944型

[防抱死制动系统][下载PDF]

准纽顿信赖域策略优化

Devesh K.Jha、Arvind U.Raghunathan、Diego Romeres;机器人学习会议记录，PMLR 100:945-954型

[防抱死制动系统][下载PDF][补充PDF]

用于指导任务和动作规划的具有关系状态表示的学习值函数

Beomjoon Kim、Luke Shimanuki;机器人学习会议记录，PMLR 100:955-968

[防抱死制动系统][下载PDF]

自适应模型预测控制的局部加权回归伪随机

Grady R.Williams、Brian Goldfain、Keuntaek Lee、Jason Gibson、James M.Rehg、Evangelos A.Theodorou;机器人学习会议记录，PMLR 100:969-978

[防抱死制动系统][下载PDF][补充邮政编码]

图形结构视觉模拟

马克西米利安·西布（Maximilian Sieb）、周贤（Zhou Xian）、黄奥黛丽（Audrey Huang）、奥利弗·克罗默（Oliver Kroemer）、卡特琳娜·弗拉基亚达基（Katerina Fraggiadaki）;机器人学习会议记录，百万分之一百：979-989

[防抱死制动系统][下载PDF][网站]

深度值模型预测控制

David Hoeller、Farbod Farshidian、Marco Hutter;机器人学习会议记录，PMLR 100:990-1004

[防抱死制动系统][下载PDF][补充邮政编码][补充视频]

利用贝叶斯非参数逆强化学习推断任务目标和约束

大英公园、迈克尔·诺塞沃西、罗汉·保罗、苏布罗·罗伊、尼古拉斯·罗伊;机器人学习会议记录，下午：100:1005-1014

[防抱死制动系统][下载PDF][补充邮政编码]

体验式视觉预见

Lin Yen-Chen、Maria Bauza、Phillip Isola;机器人学习会议记录，PMLR 100:1015-1024

[防抱死制动系统][下载PDF][补充视频]

接力策略学习：通过模仿和强化学习解决长期任务

阿比谢克·古普塔（Abhishek Gupta）、维卡什·库马尔（Vikash Kumar）、科里·林奇（Corey Lynch）、谢尔盖·莱文（Sergey Levine）、卡罗尔·豪斯曼（Karol Hausman）;机器人学习会议记录，PMLR 100:1025-1037

[防抱死制动系统][下载PDF][网站]

面向人类教师的机器人非语言反馈

桑迪·H·黄、伊莎贝拉·黄、拉维·潘迪亚、安卡·D·德拉甘;机器人学习会议记录，PMLR 100:1038-1051

[防抱死制动系统][下载PDF]

用于自我监督自我运动估计的双流网络

Rares Ambrus、Vitor Guizilini、Jie Li、Sudeep Pillai Adrien Gaidon;机器人学习会议记录，PMLR 100:1052-1061

[防抱死制动系统][下载PDF][补充PDF]

基于模型的行为克隆与未来图像相似性学习

Alan Wu、AJ Piergiovanni、Michael S.Ryoo;机器人学习会议记录，PMLR 100:1062-1077

[防抱死制动系统][下载PDF]

最坏情况策略渐变

伊川Charlie Tang、Jian Zhang、Ruslan Salakhutdinov;机器人学习会议记录，PMLR 100:1078-1093

[防抱死制动系统][下载PDF][补充邮政编码]

元世界：多任务和元强化学习的基准和评估

余天河、迪尔德丽·奎伦、何展鹏、瑞安·朱利安、卡洛尔·豪斯曼、切尔西·芬恩、谢尔盖·莱文;机器人学习会议记录，PMLR 100:1094-1100

[防抱死制动系统][下载PDF][网站][源代码]

学习灵巧操作的深层动力学模型

Anusha Nagabandi、Kurt Konolige、Sergey Levine、Vikash Kumar;机器人学习会议记录，PMLR 100:1101-1112

[防抱死制动系统][下载PDF][网站]

从游戏中学习潜在计划

科里·林奇、莫希·坎萨里、特德·肖、维卡什·库马尔、乔纳森·汤普森、谢尔盖·莱文、皮埃尔·塞尔马内特;机器人学习会议记录，PMLR 100:1113-1132

[防抱死制动系统][下载PDF][网站]

密集目标多实例的场景级姿态估计

Chaitanya Mitash、Bowen Wen、Kostas Bekris、Abdeslam Boularias;机器人学习会议记录下午100:1133-1145

[防抱死制动系统][下载PDF]

基于宏操作的深度多智能体强化学习

Yuchen Xiao、Joshua Hoffman、Christopher Amato;机器人学习会议记录，PMLR 100:1146-1161

[防抱死制动系统][下载PDF][补充邮政编码]

主动域随机化

Bhairav Mehta、Manfred Diaz、Florian Golemo、Christopher J.Pal、Liam Paull;机器人学习会议记录，PMLR 100:1162-1176

[防抱死制动系统][下载PDF]

提出简单问题：一种面向用户的主动奖励学习方法

Erdem B\iy\ik、马来亚人Palan、Nicholas C.Landolfi、Dylan P.Losey、Dorsa Sadigh;机器人学习会议记录，PMLR 100:1177-1190

[防抱死制动系统][下载PDF][补充邮政编码][源代码][补充视频]

动态体验重播

罗洁良、李慧;机器人学习会议记录，PMLR 100:1191-1200

[防抱死制动系统][下载PDF][补充视频]

部分可观测环境中的语言引导语义映射和移动操作

Siddharth Patki、Ethan Fahnestock、Thomas M.Howard、Matthew R.Walter;机器人学习会议记录，PMLR 100:1201-1210

[防抱死制动系统][下载PDF][补充邮政编码]

从演示中学习高维参数约束

Glen Chou、Necmiye Ozay、Dmitry Berenson;机器人学习会议记录，PMLR 100:1211-1230

[防抱死制动系统][下载PDF][补充邮政编码]

基于变分优化的无限维随机系统强化学习

伊桑·N·埃文斯（Ethan N.Evans）、马库斯·佩里拉（Marcus A.Periera）、乔治·布泽利斯（George I.Boutselis）、埃文格洛斯·塞奥多罗（Evangelos A.Theodorou）;机器人学习会议记录，PMLR 100:1231-1246

[防抱死制动系统][下载PDF][补充邮政编码][补充视频][源代码]

了解机器人学习中的教师注视模式

Akanksha Saran、Elaine Schaertl Short、Andrea Thomaz、Scott Niekum;机器人学习会议记录，PMLR 100:1247-1258

[防抱死制动系统][下载PDF][补充邮政编码]

模仿学习方法的发散最小化观点

Seyed Kamyar Seyed Ghasemipour、Richard Zemel、Shixiang Gu;机器人学习会议记录，PMLR 100:1259-1277

[防抱死制动系统][下载PDF][源代码][网站]

衰退的地平线好奇心

Matthias Schultheis、Boris Belousov、Hany Abdulsamad、Jan Peters;机器人学习会议记录，PMLR 100:1278-1288

[防抱死制动系统][下载PDF][源代码]

学习将运动模型推广到新对象

Ben Abbatemateo、Stefanie Tellex、George Konidaris;机器人学习会议记录，PMLR 100:1289-1299

[防抱死制动系统][下载PDF][补充邮政编码]

ROBEL：低成本机器人学习的机器人基准

Michael Ahn、Henry Zhu、Kristian Hartikainen、Hugo Ponte、Abhishek Gupta、Sergey Levine、Vikash Kumar;机器人学习会议记录，PMLR 100:1300-1313

[防抱死制动系统][下载PDF][补充PDF]

视觉障碍者导航代理：人行道模拟器及实验

马丁·韦斯、西蒙·查莫罗、罗杰·吉尔吉斯、马戈·勒克、萨米拉·卡胡、约瑟夫·科恩、德里克·诺鲁泽扎莱、多伊娜·普雷库普、弗洛里安·戈列莫、克里斯·帕尔;机器人学习会议记录，PMLR 100:1314-1327

[防抱死制动系统][下载PDF][源代码][源代码][源代码]

用于深度强化学习的认证对抗鲁棒性

Björn Lütjens、Michael Everett、Jonathan P.How;机器人学习会议记录，PMLR 100:1328-1337

[防抱死制动系统][下载PDF]

基于模型的强化学习的异步方法

Yunzhi Zhang、Ignasi Clavera、Boren Tsai、Pieter Abbeel;机器人学习会议记录，下午：100:1338-1347

[防抱死制动系统][下载PDF][网站]

PyRoboLearn:面向机器人学习从业者的Python框架

Brian Delhaisse、Leonel Rozo、Darwin G.Caldwell;机器人学习会议记录下午100:1348-1358

[防抱死制动系统][下载PDF][网站]

无转矩测量反馈线性化控制的在线学习方法

M.Capotondi和G。C·特里西。Gaz，V。莫杜格诺，G。A.奥里奥洛。德卢卡;机器人学习会议记录，下午：100:1359-1368

[防抱死制动系统][下载PDF][补充邮政编码]

两种模式的最佳选择：分别利用RGB和深度分割未显示对象实例

克里斯托弗·谢（Christopher Xie）、于翔（Yu Xiang）、阿萨兰·穆萨维安（Arsalan Mousavian）、迪特尔·福克斯（Dieter Fox）;机器人学习会议记录，PMLR 100:1369-1378

[防抱死制动系统][下载PDF][补充邮政编码][网站]

策略梯度方法中方差减少的轨迹控制变量

程庆安、严新燕、拜伦·布茨;机器人学习会议记录，PMLR 100:1379-1394

[防抱死制动系统][下载PDF][补充PDF]

学习用视觉触觉传感器检测和预测接触事件

张亚战、袁伟豪、菅子成、王宇;机器人学习会议记录，PMLR 100:1395-1404

[防抱死制动系统][下载PDF][补充邮政编码][网站]

多模态概率运动预测的核轨迹图

魏明志、莱昂内尔·奥特、法比奥·拉莫斯;机器人学习会议记录，PMLR 100:1405-1414

[防抱死制动系统][下载PDF][源代码]

学习使用模拟飞行将自然语言指令映射到物理四旋翼机控制

Valts Blukis、Yannick Terme、Eyvind Niklasson、Ross A.Knepper、Yoav Artzi;机器人学习会议记录，PMLR 100:1415-1438

[防抱死制动系统][下载PDF][补充邮政编码][补充视频][补充视频][源代码]

基于视觉模型的强化学习中的实体抽象

Rishi Veerapaneni、John D.Co-Reyes、Michael Chang、Michael Janner、Chelsea Finn、Jiajun Wu、Joshua Tenenbaum、Sergey Levine;机器人学习会议记录，PMLR 100:1439-1456

[防抱死制动系统][下载PDF]

从人体演示中学习多任务空间中的反应性运动策略

M.Asif Rana、Anqi Li、Harish Ravichandar、Mustafa Mukadam、Sonia Chernova、Dieter Fox、Byron Boots、Nathan Ratliff;机器人学习会议记录，PMLR 100:1457-1468

[防抱死制动系统][下载PDF][补充邮政编码][补充视频]