[编辑]

第100卷:机器人学习会议,2019年11月30日至1日,

[编辑]

编辑:Leslie Pack Kaelbling、Danica Kragic、Komei Sugiura

[围兜][城市规划署]

有腿机器人的数据高效强化学习

杨玉祥(Yuxiang Yang)、肯·卡鲁瓦茨(Ken Caluwaerts)、艾蒂尔·伊斯肯(Atil Iscen)、张廷南(Tingnan Zhang)、谭洁(Jie Tan)、维卡斯·辛德瓦尼(Vikas Sindhwani);机器人学习会议记录,PMLR 100:1-10

遵循或不遵循:从观察中选择性模仿学习

Youngwoon Lee、Edward S.Hu、Zhengyu Yang、Joseph J.Lim;机器人学习会议记录,PMLR 100:11-23

关于策略机器人从聚合主管那里学习

Ashwin Balakrishna、Brijen Thananjeyan、Jonathan Lee、Felix Li、Arsh Zahed、Joseph E.Gonzalez、Ken Goldberg;机器人学习会议记录,PMLR 100:24-41

基于级联变分推理的多步操作动力学学习

宽芳、朱玉科、阿尼梅斯·加格、西尔维奥·萨瓦雷斯、李飞飞;机器人学习会议记录,PMLR 100:42-52

S4G:Amodal Single-view Single-Shot SE(3)杂波场景中的抓取检测

秦宇哲、陈瑞、郝朱、孟松、徐静、郝苏;机器人学习会议记录,PMLR 100:53-65

通过作弊学习

Dian Chen、Brady Zhou、Vladlen Koltun、Philipp Krähenbühl;机器人学习会议记录,PMLR 100:66-75

面向无视角句子生成的多模注意分支网络

Aly Magassouba、Komei Sugiura、Hisashi Kawai;机器人学习会议记录,PMLR 100:76-85

多路径:用于行为预测的多概率锚定轨迹假设

Yuning Chai、Benjamin Sapp、Mayank Bansal、Dragomir Angelov;机器人学习会议记录,百万分之一百:86-99

模型预测控制的以对象为中心的正向建模

叶玉飞、迪拉杰·甘地、阿比纳夫·古普塔、Shubham Tulsiani;机器人学习会议记录,PMLR 100:100-109

基于层次Sim2Real的移动多智能体操作

Ofir Nachum、Michael Ahn、Hugo Ponte、Gu Shixiang(Shane)、Vikash Kumar;机器人学习会议记录,PMLR 100:110-121

深度学习与验证相结合的精确对象实例检测

Siddharth Ancha、Junyu Nan、David Held;机器人学习会议记录,PMLR 100:122-141

MAT:通过深度强化学习实现多指自适应触觉抓取

Bohan Wu、Iretiayo Akinola、Jacob Varley、Peter K.Allen;机器人学习会议记录,PMLR 100:142-161

好奇的iLQR:解决基于模型的RL中的不确定性

Sarah Bechtle、Yixin Lin、Akshara Rai、Ludovic Righetti、Franziska Meier;机器人学习会议记录,PMLR 100:162-171

基于开关密度网络的混合系统辨识

迈克尔·伯克(Michael Burke)、尤丹·赫里斯托夫(Yordan Hristov)、苏布拉曼尼亚·拉马莫西(Subramanian Ramamoorthy);机器人学习会议记录,PMLR 100:172-181

用基于能量的模型规范基于模型的规划

里努·博尼、朱霍·坎纳拉、亚历山大·伊林;机器人学习会议记录,PMLR 100:182-191

人机协作决策模型的半监督学习

Vaibhav V.Unhelkar、Shen Li、Julie A.Shah;机器人学习会议记录,PMLR 100:192-203

基于可学习Lyapunov函数重构的黎曼运动策略融合

穆斯塔法·穆卡丹(Mustafa Mukadam)、程庆安(Ching-An Cheng)、迪特尔·福克斯(Dieter Fox)、拜伦·布茨(Byron Boots)、内森·拉特利夫(Nathan Ratliff);机器人学习会议记录,PMLR 100:204-219

基于感知注意的预测控制

Keuntaek Lee、Gabriel Nakajima An、Viacheslav Zakharov、Evangelos A.Theodorou;机器人学习会议记录下午100:220-232

贝叶斯优化在机器人学习中满足黎曼流形

Noémie Jaquier、Leonel Rozo、Sylvain Calinon、Mathias Bürger;机器人学习会议记录,PMLR 100:233-246

通过基于模型的高斯过程进行演示学习

Noémie Jaquier、David Ginsbourger、Sylvain Calinon;机器人学习会议记录,PMLR 100:247-257

基于贝叶斯模型强化学习的变分推理MPC

冈田正史(Masashi Okada)、田口达弘(Tadahiro Taniguchi);机器人学习会议记录,下午:100:258-272

从演示中学习概率操作技能的序列优化

Lukas Schwenkel、Meng Guo、Mathias Bürger;机器人学习会议记录,PMLR 100:273-282

资源约束多智能体系统的预测安全网络

Mathias Bürger,Meng Guo;机器人学习会议记录,PMLR 100:283-292

笛卡尔空间机器人控制中方向动态运动基元的正确公式

列奥尼达斯·库特拉斯(Leonidas Koutras)、佐伊·杜尔盖里(Zoe Doulgeri);机器人学习会议记录,PMLR 100:293-302

通过移动进行掩蔽:从姿势信息中学习无干扰雷达里程表

丹·巴恩斯、罗布·韦斯顿、英格玛·波斯纳;机器人学习会议记录下午100:303-316

学习Cassie的运动技能:迭代设计和模拟现实

谢昭明、帕特里克·克莱里、杰里米·道、佩德罗·莫利斯、乔南森·赫斯特、米歇尔·潘恩;机器人学习会议记录,PMLR 100:317-329

通过自动标记演示实现更好的演示模拟学习

Daniel S.Brown、Wonjoon Goo、Scott Niekum;机器人学习会议记录,PMLR 100:330-359

马尔可夫决策过程中的互信息正则化与行为批判性学习

费利克斯·雷布弗里德(Felix Leibfried)、乔迪·格拉乌·莫亚(Jordi Grau-Moya);机器人学习会议记录,PMLR 100:360-373

基于模型的规划与基于能量的模型

杜一伦、林托鲁、伊戈尔·莫达奇;机器人学习会议记录,PMLR 100:374-383

识别自动驾驶的未知实例

Kelvin Wong、Shenlong Wang、Mengye Ren、Ming Liang、Raquel Urtasun;机器人学习会议记录,下午:100:384-393

视觉和对话框导航

杰西·托马森(Jesse Thomason)、迈克尔·默里(Michael Murray)、玛亚·卡克马克(Maya Cakmak)、卢克·泽特莫耶(Luke Zettlemoyer);机器人学习会议记录,PMLR 100:394-406

离散剩余流用于行人行为概率预测

Ajay Jain、Sergio Casas、Renjie Liao、Yuwen Xiong、Song Feng、Sean Segal、Raquel Urtasun;机器人学习会议记录,PMLR 100:407-419

新环境下视觉导航的最优控制与学习相结合

Somil Bansal、Varun Tolani、Saurabh Gupta、Jitendra Malik、Claire Tomlin;机器人学习会议记录,PMLR 100:420-429

通过规范化流利用非策略算法中的探索

Bogdan Mazoure、Thang Doan、Audrey Durand、Joelle Pineau、R Devon Hjelm;机器人学习会议记录,PMLR 100:430-444

TuneNet:用于系统识别和模拟现实机器人任务传输的一次剩余调整

Adam Allevato、Elaine Schaertl Short、Mitch Pryor、Andrea Thomaz;机器人学习会议记录,PMLR 100:445-455

基于动态压缩的变分潜在空间贝叶斯优化

Rika Antonova、Akshara Rai、Tianyu Li、Danica Kragic;机器人学习会议记录下午100:456-465

通过评估现实世界机器人的深度强化学习算法对再现性的研究

Nicolai A.Lynnerup、Laura Nolling、Rasmus Hasle、John Hallam;机器人学习会议记录,下午:100:466-489

学习使用固定状态表示来操作对象集合

塔克·赫尔曼斯·马修·威尔逊;机器人学习会议记录,PMLR 100:490-502

具有重投影距离的鲁棒半监督单目深度估计

维托·吉齐里尼(Vitor Guizilini)、洁丽(Jie Li)、瑞斯·安布罗斯(Rares Ambrus)、苏迪普·皮莱(Sudeep Pillai)、阿德里安·盖登(Adrien Gaidon);机器人学习会议记录,PMLR 100:503-512

自主式情境强化学习

Pascal Klink、Hany Abdulsamad、Boris Belousov、Jan Peters;机器人学习会议记录,PMLR 100:513-529

自我监督机器人学习的上下文想象目标

Ashvin Nair、Shikhar Bahl、Alexander Khazatsky、Vitchyr Pong、Glen Berseth、Sergey Levine;机器人学习会议记录,PMLR 100:530-539

自然语言教学中的条件驱动

Junha Roh、Chris Paxton、Andrzej Pronobis、Ali Farhadi、Dieter Fox;机器人学习会议记录,PMLR 100:540-551

反向动力学模型学习的对抗性主动探索

张伟红、徐菊福、孙云珊、李春怡;机器人学习会议记录,PMLR 100:552-565

想象价值梯度:基于模型的策略优化与可传递潜在动力学模型

阿伦库马尔·拜拉文(Arunkumar Byravan)、约斯特·托比亚斯·斯普林伯格(Jost Tobias Springenberg)、阿巴斯·阿卜杜勒马利基(Abbas Abdolmaleki)、罗兰·哈夫纳(Roland Hafner)、迈克尔·纽内特(Michael Neunert)、托马斯·兰佩(Thomas Lampe);机器人学习会议记录,PMLR 100:566-589

PIC:多智能体深度强化学习的置换不变量批判

Iou-Jen Liu、Raymond A.Yeh、Alexander G.Schwing;机器人学习会议记录,PMLR 100:590-602

HRL4IN:移动机械手交互式导航的分层强化学习

李成树、夏飞、罗伯托·马丁·马丁、西尔维奥·萨瓦雷斯;机器人学习会议记录,PMLR 100:603-616

从自我中心视频学习导航子例程

Ashish Kumar、Saurabh Gupta、Jitendra Malik;机器人学习会议记录,PMLR 100:617-626

可学习的安全措施

Steve Heim、Alexander von Rohr、Sebastian Trimpe、Alexander Badri-Spröwitz;机器人学习会议记录,电话:100:627-639

具有深微分函数和动作约束的HJB最优反馈控制

Michael Lutter、Boris Belousov、Kim Listmann、Debora Clever、Jan Peters;机器人学习会议记录,PMLR 100:640-650

多帧GAN:微光立体视觉里程表的图像增强

Eunah Jung、Nan Yang、Daniel Cremers;机器人学习会议记录,PMLR 100:651-660

通过深度强化学习保证连接性的多机器人导航

林俊通、杨旭云、郑培伟、惠成;机器人学习会议记录,PMLR 100:661-670

基于图神经网络的机器人群分散控制器学习

叶卡捷琳娜·托尔斯塔亚、费尔南多·伽马、詹姆斯·保洛斯、乔治·帕帕斯、维杰伊·库马尔、亚历杭德罗·里贝罗;机器人学习会议记录,PMLR 100:671-682

用于强化学习的可证明鲁棒黑箱优化

Krzysztof Choromanski、Aldo Pacchiano、Jack Parker-Holder、Yunhao Tang、Deepali Jain、Yuxiang Yang、Atil Ischen、Jasmine Hsu、Vikas Sindhwani;机器人学习会议记录,PMLR 100:683-696型

作为近似输入推断的随机最优控制

Joe Watson、Hany Abdulsamad、Jan Peters;机器人学习会议记录,PMLR 100:697-716

AC-Teach:一种贝叶斯行为批评方法,用于次优教师集合的政策学习

安德烈·库伦科夫(Andrey Kurenkov)、阿杰伊·曼德莱卡(Ajay Mandlekar)、罗伯托·马丁·马汀(Roberto Martin-Martin)、西尔维奥·萨瓦雷斯(Silvio Savarese)、阿尼梅斯·加格;机器人学习会议记录,电话:100:717-734

机器人混合控制的连续离散强化学习

迈克尔·纽内特(Michael Neunert)、阿巴斯·阿卜杜勒马利基(Abbas Abdolmaleki)、马库斯·沃尔夫迈尔(Markus Wulfmeier)、托马斯·兰佩(Thomas Lampe)、托比亚斯·斯普林伯格(Tobias Springenberg)、罗兰·哈夫纳(Roland Hafner)、弗朗西斯科·罗曼诺(Fra;机器人学习会议记录,百万分之一百:735-751

从伙伴的行动中学习:分散机器人团队中的角色

Dylan P.Losey、Mengxi Li、Jeannette Bohg、Dorsa Sadigh;机器人学习会议记录,PMLR 100:752-765

基于空中和地面测量的地面机器人节能路径规划

沃尔坎岛明汉卫;机器人学习会议记录,PMLR 100:766-775

基于多步骤生成模型的多Agent强化学习

Orr Krupnik、Igor Mordatch、Aviv Tamar;机器人学习会议记录,PMLR 100:776-790

学习使用中级视觉优先级进行导航

亚历山大·萨克斯(Alexander Sax)、杰弗里·张(Jeffrey O.Zhang)、布拉德利·埃米(Bradley Emi)、阿米尔·扎米尔(Amir Zamir)、西尔维奥·萨瓦雷斯(Silvio Savarese)、列奥尼达斯·吉巴斯(Leonidas Guib;机器人学习会议记录,PMLR 100:791-812

学习外部过程规划的紧凑模型

罗汉·奇蒂尼斯(Rohan Chitnis)、托马斯·洛扎诺·佩雷斯(Tomás Lozano-Pérez);机器人学习会议记录,PMLR 100:813-822

大型机器人控制的图形策略梯度

阿尔巴兹·汗、叶卡捷琳娜·托尔斯塔亚、亚历杭德罗·里贝罗、维杰伊·库马尔;机器人学习会议记录,PMLR 100:823-834

连续参数化环境下Deep RL课程学习的教师算法

雷米·波特拉斯(Rémy Portelas)、塞德里克·科拉斯(Cédric Colas)、卡贾·霍夫曼(Katja Hofmann)、皮埃尔·伊夫斯·奥德耶(Pierre-Yves Oudeyer);机器人学习会议记录,PMLR 100:835-853

形态和行为的数据高效协同适应与深度强化学习

Kevin Sebastian Luck、Heni Ben Amor、Roberto Calandra;机器人学习会议记录,PMLR 100:854-869

用于解释和从演示中学习的纠缠关系表示

Yordan Hristov、Daniel Angelov、Michael Burke、Alex Lascarides、Subramanian Ramamoorthy;机器人学习会议记录,PMLR 100:870-884

RoboNet:大规模多机器人学习

Sudeep Dasari、Frederik Ebert、Stephen Tian、Suraj Nair、Bernadette Bucher、Karl Schmeckpeper、Siddharth Singh、Sergey Levine、Chelsea Finn;机器人学习会议记录,PMLR 100:885-897

环境行为界限的反例引导学习

陈宇晓、萨曼特·达塔赫里、董文明、理查德·默里;机器人学习会议记录,PMLR 100:898-909

MAME:模型预测Meta-Exploration

Swaminathan Gurumurthy、Sumit Kumar、Katia Sycara;机器人学习会议记录,PMLR 100:910-922

用于激光雷达点云三维目标检测的端到端多视图融合

Yin Zhou、Pei Sun、Yu Zhang、Dragomir Angelov、Jiyang Gao、Tom Ouyang、James Guo、Jiquan Ngiam、Vijay Vasudevan;机器人学习会议记录,PMLR 100:923-932

学习动作原语的任务条件变分自动编码器

Michael Noseworthy、Rohan Paul、Subhro Roy、Daehyung Park、Nicholas Roy;机器人学习会议记录,PMLR 100:933-944型

准纽顿信赖域策略优化

Devesh K.Jha、Arvind U.Raghunathan、Diego Romeres;机器人学习会议记录,PMLR 100:945-954型

用于指导任务和动作规划的具有关系状态表示的学习值函数

Beomjoon Kim、Luke Shimanuki;机器人学习会议记录,PMLR 100:955-968

自适应模型预测控制的局部加权回归伪随机

Grady R.Williams、Brian Goldfain、Keuntaek Lee、Jason Gibson、James M.Rehg、Evangelos A.Theodorou;机器人学习会议记录,PMLR 100:969-978

图形结构视觉模拟

马克西米利安·西布(Maximilian Sieb)、周贤(Zhou Xian)、黄奥黛丽(Audrey Huang)、奥利弗·克罗默(Oliver Kroemer)、卡特琳娜·弗拉基亚达基(Katerina Fraggiadaki);机器人学习会议记录,百万分之一百:979-989

深度值模型预测控制

David Hoeller、Farbod Farshidian、Marco Hutter;机器人学习会议记录,PMLR 100:990-1004

利用贝叶斯非参数逆强化学习推断任务目标和约束

大英公园、迈克尔·诺塞沃西、罗汉·保罗、苏布罗·罗伊、尼古拉斯·罗伊;机器人学习会议记录,下午:100:1005-1014

体验式视觉预见

Lin Yen-Chen、Maria Bauza、Phillip Isola;机器人学习会议记录,PMLR 100:1015-1024

接力策略学习:通过模仿和强化学习解决长期任务

阿比谢克·古普塔(Abhishek Gupta)、维卡什·库马尔(Vikash Kumar)、科里·林奇(Corey Lynch)、谢尔盖·莱文(Sergey Levine)、卡罗尔·豪斯曼(Karol Hausman);机器人学习会议记录,PMLR 100:1025-1037

面向人类教师的机器人非语言反馈

桑迪·H·黄、伊莎贝拉·黄、拉维·潘迪亚、安卡·D·德拉甘;机器人学习会议记录,PMLR 100:1038-1051

用于自我监督自我运动估计的双流网络

Rares Ambrus、Vitor Guizilini、Jie Li、Sudeep Pillai Adrien Gaidon;机器人学习会议记录,PMLR 100:1052-1061

基于模型的行为克隆与未来图像相似性学习

Alan Wu、AJ Piergiovanni、Michael S.Ryoo;机器人学习会议记录,PMLR 100:1062-1077

最坏情况策略渐变

伊川Charlie Tang、Jian Zhang、Ruslan Salakhutdinov;机器人学习会议记录,PMLR 100:1078-1093

元世界:多任务和元强化学习的基准和评估

余天河、迪尔德丽·奎伦、何展鹏、瑞安·朱利安、卡洛尔·豪斯曼、切尔西·芬恩、谢尔盖·莱文;机器人学习会议记录,PMLR 100:1094-1100

学习灵巧操作的深层动力学模型

Anusha Nagabandi、Kurt Konolige、Sergey Levine、Vikash Kumar;机器人学习会议记录,PMLR 100:1101-1112

从游戏中学习潜在计划

科里·林奇、莫希·坎萨里、特德·肖、维卡什·库马尔、乔纳森·汤普森、谢尔盖·莱文、皮埃尔·塞尔马内特;机器人学习会议记录,PMLR 100:1113-1132

密集目标多实例的场景级姿态估计

Chaitanya Mitash、Bowen Wen、Kostas Bekris、Abdeslam Boularias;机器人学习会议记录下午100:1133-1145

基于宏操作的深度多智能体强化学习

Yuchen Xiao、Joshua Hoffman、Christopher Amato;机器人学习会议记录,PMLR 100:1146-1161

主动域随机化

Bhairav Mehta、Manfred Diaz、Florian Golemo、Christopher J.Pal、Liam Paull;机器人学习会议记录,PMLR 100:1162-1176

提出简单问题:一种面向用户的主动奖励学习方法

Erdem B\iy\ik、马来亚人Palan、Nicholas C.Landolfi、Dylan P.Losey、Dorsa Sadigh;机器人学习会议记录,PMLR 100:1177-1190

动态体验重播

罗洁良、李慧;机器人学习会议记录,PMLR 100:1191-1200

部分可观测环境中的语言引导语义映射和移动操作

Siddharth Patki、Ethan Fahnestock、Thomas M.Howard、Matthew R.Walter;机器人学习会议记录,PMLR 100:1201-1210

从演示中学习高维参数约束

Glen Chou、Necmiye Ozay、Dmitry Berenson;机器人学习会议记录,PMLR 100:1211-1230

基于变分优化的无限维随机系统强化学习

伊桑·N·埃文斯(Ethan N.Evans)、马库斯·佩里拉(Marcus A.Periera)、乔治·布泽利斯(George I.Boutselis)、埃文格洛斯·塞奥多罗(Evangelos A.Theodorou);机器人学习会议记录,PMLR 100:1231-1246

了解机器人学习中的教师注视模式

Akanksha Saran、Elaine Schaertl Short、Andrea Thomaz、Scott Niekum;机器人学习会议记录,PMLR 100:1247-1258

模仿学习方法的发散最小化观点

Seyed Kamyar Seyed Ghasemipour、Richard Zemel、Shixiang Gu;机器人学习会议记录,PMLR 100:1259-1277

衰退的地平线好奇心

Matthias Schultheis、Boris Belousov、Hany Abdulsamad、Jan Peters;机器人学习会议记录,PMLR 100:1278-1288

学习将运动模型推广到新对象

Ben Abbatemateo、Stefanie Tellex、George Konidaris;机器人学习会议记录,PMLR 100:1289-1299

ROBEL:低成本机器人学习的机器人基准

Michael Ahn、Henry Zhu、Kristian Hartikainen、Hugo Ponte、Abhishek Gupta、Sergey Levine、Vikash Kumar;机器人学习会议记录,PMLR 100:1300-1313

视觉障碍者导航代理:人行道模拟器及实验

马丁·韦斯、西蒙·查莫罗、罗杰·吉尔吉斯、马戈·勒克、萨米拉·卡胡、约瑟夫·科恩、德里克·诺鲁泽扎莱、多伊娜·普雷库普、弗洛里安·戈列莫、克里斯·帕尔;机器人学习会议记录,PMLR 100:1314-1327

用于深度强化学习的认证对抗鲁棒性

Björn Lütjens、Michael Everett、Jonathan P.How;机器人学习会议记录,PMLR 100:1328-1337

基于模型的强化学习的异步方法

Yunzhi Zhang、Ignasi Clavera、Boren Tsai、Pieter Abbeel;机器人学习会议记录,下午:100:1338-1347

PyRoboLearn:面向机器人学习从业者的Python框架

Brian Delhaisse、Leonel Rozo、Darwin G.Caldwell;机器人学习会议记录下午100:1348-1358

无转矩测量反馈线性化控制的在线学习方法

M.Capotondi和G。C·特里西。Gaz,V。莫杜格诺,G。A.奥里奥洛。德卢卡;机器人学习会议记录,下午:100:1359-1368

两种模式的最佳选择:分别利用RGB和深度分割未显示对象实例

克里斯托弗·谢(Christopher Xie)、于翔(Yu Xiang)、阿萨兰·穆萨维安(Arsalan Mousavian)、迪特尔·福克斯(Dieter Fox);机器人学习会议记录,PMLR 100:1369-1378

策略梯度方法中方差减少的轨迹控制变量

程庆安、严新燕、拜伦·布茨;机器人学习会议记录,PMLR 100:1379-1394

学习用视觉触觉传感器检测和预测接触事件

张亚战、袁伟豪、菅子成、王宇;机器人学习会议记录,PMLR 100:1395-1404

多模态概率运动预测的核轨迹图

魏明志、莱昂内尔·奥特、法比奥·拉莫斯;机器人学习会议记录,PMLR 100:1405-1414

学习使用模拟飞行将自然语言指令映射到物理四旋翼机控制

Valts Blukis、Yannick Terme、Eyvind Niklasson、Ross A.Knepper、Yoav Artzi;机器人学习会议记录,PMLR 100:1415-1438

基于视觉模型的强化学习中的实体抽象

Rishi Veerapaneni、John D.Co-Reyes、Michael Chang、Michael Janner、Chelsea Finn、Jiajun Wu、Joshua Tenenbaum、Sergey Levine;机器人学习会议记录,PMLR 100:1439-1456

从人体演示中学习多任务空间中的反应性运动策略

M.Asif Rana、Anqi Li、Harish Ravichandar、Mustafa Mukadam、Sonia Chernova、Dieter Fox、Byron Boots、Nathan Ratliff;机器人学习会议记录,PMLR 100:1457-1468

订阅通过RSS