跳到主要内容
研究文章

一种结合符号和子符号元素的内省机器人混合技能参数化模型

出版:2023年3月1日 出版历史

摘要

在机器人技能的设计中,重点通常在于提高机器人执行过程的灵活性和可靠性;然而,典型的技能表示并不是为了分析执行失败(如果发生)或明确地从失败中学习而设计的。在本文中,我们描述了一种基于学习的技能参数化混合表示法,称为执行模型,该模型将执行失败视为执行过程的自然部分。然后,我们(i)演示如何将执行上下文包含在执行模型中,(ii)通过将机器人执行的泛化尝试与本体中表示的对象相似性知识相结合,引入一种在对象类别之间泛化模型的技术,以及(iii)描述使用执行模型识别参数化失败的可能假设的过程。在把手抓取、物体抓取和物体拉动的背景下,用物理机器人进行了多次实验,评估了所提方法的可行性。实验结果表明,执行模型有助于避免执行失败,但也代表了朝着更内省的机器人迈出的第一步,这些机器人能够以明确的方式分析一些执行失败。

集锦

执行模型的设计,这是一种用于技能参数化的混合表示,可以分析执行失败并从中学习。
描述学习如何在对象类别之间泛化执行模型的过程。
开发用于识别参数化失败的可能原因并提出参数修正的算法。

工具书类

[1]
Zech P.、Renaudo E.、Haller S.、Zhang X.、Piater J.,《机器人中的动作表示:分类学和系统分类》,国际J机器人。物件。38 (5) (2019) 518–562.
[2]
Steinbauer G.,《机器人杯机器人故障调查》,载:2012年机器人足球世界杯:机器人足球第十六届世界杯。计算机科学课堂讲稿2012年第7500卷,第344-355页。
[3]
Kuestenmacher A.、Akhtar N.、Plöger P.G.、Lakemeyer G.,《面向家庭服务机器人的稳健任务执行》,J.智力。机器人。系统。76 (1) (2014) 5–33.
[4]
Khalastchi E.,Kalech M.,机器人系统故障检测和诊断,ACM计算。Surv公司。51 (1) (2018).
[5]
F.Correia,C.Guerra,S.Mascarenhas,F.S.Melo,A.Paiva,《探索人类机器人信任中错误合理性的影响》,载于:第17届国际Conf.自治代理和多代理系统,AAMAS,2018年,第507–513页。
[6]
D.Das、S.Banerjee、S.Chernova,《机器人故障的可解释人工智能:生成改进故障恢复中用户协助的解释》,载于:ACM/IEEE Int.Conf.Human-Robot Interaction,HRI,2021年,第351-360页。
[7]
A.Mitrevski,P.G.Plöger,G.Lakemeyer,机器人动作执行可解释模型的表示和基于经验的学习,收录于:IEEE/RSJ Int.Conf.Intelligent Robots and Systems(IROS),2020年,第5641–5647页。
[8]
A.Mitrevski,P.G.Plöger,G.Lakemeyer,《通过伪造参数化执行模型进行机器人动作诊断和经验修正》,收录于:IEEE国际机器人技术与自动化(ICRA),2021年,第11025–11031页。
[9]
A.Mitrevski、P.G.Plöger、G.Lakemeyer,机器人动作执行知识的Ontology-Assisted Generalisation of Robot Action Execution Knowledge,收录于:IEEE/RSJ Int.Conf.Intelligent Robots and Systems(IROS),2021年,第6763-6770页。
[10]
L.Kaelbling,T.Lozano-Pérez,学习参数化技能的可组合模型,载于:IEEE国际会议。机器人与自动化(ICRA),2017,第886–893页。
[11]
S.Höfer,O.Brock,动作参数的耦合学习和操纵正向模型,收录于:IEEE/RSJ Int.Conf.Intelligent Robots and Systems(IROS),2016年,第3893–3899页。
[12]
A.Mitrevski、A.Kuestenmacher、S.Thoduka、P.G.Plöger,《通过学习动作执行模型提高服务机器人在外部故障情况下的可靠性》,收录于:IEEE国际机器人与自动化(ICRA),2017年,第4256–4263页。
[13]
F.Stulp,A.Fedrizzi,M.Beetz,动作相关的基于位置的移动操作,收录于:IEEE/RSJ Int.Conf.Intelligent Robots and Systems(IROS),2009年,第3115-3120页。
[14]
A.K.Bozcuoǧlu,Y.Furuta,K.Okada,M.Beetz,M.Inaba,符号知识库中造林的连续建模,在:IEEE/RSJ国际会议。智能机器人和系统(IROS),2019,第5452–5458页。
[15]
Koralewski S.、Kazhoyan G.、Beetz M.,基于经验的通用机器人计划的自我专业化,IEEE机器人。自动。莱特。4 (4) (2019) 3766–3773.
[16]
Ivaldi S.等人,通过主动探索进行对象学习,IEEE传输。自动。精神发育。6 (1) (2014) 56–72.
[17]
Z.Wang,C.R.Garrett,L.P.Kaelbling,T.Lozano-Pérez,《任务和运动规划的主动模型学习和多样性动作采样》,收录于:IEEE/RSJ Int.Conf.Int.Intelligent Robots and Systems(IROS),2018年,第4107-4114页。
[18]
N.Abdo,H.Kretzschmar,L.Spinello,C.Stachniss,《从几个演示中学习操纵动作》,收录于:IEEE国际机器人与自动化(ICRA),2013年,第1268–1275页。
[19]
A.S.Bauer,P.Schmaus,F.Stulp,D.Leidner,《通过语义增强和物理模拟进行概率效应预测》,收录于:IEEE国际机器人与自动化(ICRA),2020年,第9278–9284页。
[20]
O.O.Sushkov,C.Sammut,对象属性的主动机器人学习,收录于:IEEE/RSJ Int.Conf.Intelligent Robots and Systems(IROS),2012年,第2621–2628页。
[21]
S.Sanan,M.Bretan,L.Heck,《非全面操纵的学习对象模型》,收录于:IEEE/RSJ Int.Conf.Intelligent Robots and Systems(IROS),2019年,第4784-4789页。
[22]
Schoeler M.,Wörgötter F.,引导工具的语义:基于每个部分的现实世界对象的负担分析,IEEE传输。科尼特。开发系统。8 (2) (2016) 84–98.
[23]
I.Awaad,G.K.Kraetzschmar,J.Hertzberg,《寻找完成工作的方法:基于成本的方法》,收录于:第24届国际会议规划与调度(ICAPS),机器人轨道,2014年。
[24]
Kuestenmacher A。,提高服务机器人在外部故障情况下的可靠性,(博士论文)RWTH亚琛大学,2019年。
[25]
Karapinar S.、Sariel S.,认知机器人通过真实世界实验学习失败情境,自动。机器人39 (4) (2015) 469–485.
[26]
S.Konečn,S.Stock,F.Pecora,A.Saffiotti,《规划领域+执行语义:稳健执行的途径?》?,2014年AAAI春季研讨会系列。
[27]
L.E.Parker,B.Kannan,多机器人团队故障诊断和恢复的自适应因果模型,收录于:IEEE/RSJ Int.Conf.Int.Intelligent Robots and Systems(IROS),2006年,第2703–2710页。
[28]
J.P.Mendoza,M.Veloso,R.Simmons,《通过检测未满足的行动结果期望来计划执行监控》,载于:IEEE国际机器人技术与自动化(ICRA),2015年,第3247–3252页。
[29]
T.Welschehold,N.Abdo,C.Dornhege,W.Burgard,移动操作应用的人类演示中的任务和行动组合学习,收录于:IEEE/RSJ Int.Conf.Intelligent Robots and Systems(IROS),2019年,第4317–4324页。
[30]
Coruhlu G.、Erdem E.、Patoglu V.,部分可观测性下的可解释机器人计划执行监控,IEEE传输。机器人。38 (4) (2021) 2495–2515.
[31]
Sutton R.S.、Precup D.、Singh S.,《在MDP和半MDP之间:强化学习中时间抽象的框架》,人工智能112 (1) (1999) 181–211.
[32]
Konidaris G.,Kaelbling L.P.,Lozano-Pérez T.,《从技能到符号:学习抽象高层规划的符号表示法》,J.阿蒂夫。智力。物件。61 (1) (2018) 215–289.
[33]
Kroemer O.,Niekum S.,Konidaris G.,操作机器人学习综述:挑战、表示和算法,J.马赫。学习。物件。22 (2021) 1–82.
[34]
P.Varin,L.Grossman,S.Kuindersma,《学习操纵任务的动作空间比较》,载于:IEEE/RSJ国际会议。智能机器人与系统(IROS),2019,第6015–6021页。
[35]
Deisenroth M.P.、Neumann G.、Peters J.,机器人政策搜索调查,已找到。趋势机器人。2 (1–2) (2013) 1–142.
[36]
A.G.Kupcsik、M.P.Deisenroth、J.Peters、G.Neumann,《机器人技能与上下文策略搜索的数据效率通用化》,载于:第27届AAAI人工智能大会,2013年,第1401-1407页。
[37]
P.Pastor,L.Righetti,M.Kalakrishnan,S.Schaal,基于先前传感器经验的在线运动适应,收录于:IEEE/RSJ国际智能机器人与系统(IROS),2011年,第365-371页。
[38]
Eiband T.、Saveriano M.、Lee D.,通过演示多个解决方案实现条件任务的直观编程,IEEE机器人。自动。莱特。4 (4) (2019) 4483–4490.
[39]
Kober J.、Peters J.,《机器人强化学习:一项调查》,收录于:强化学习:现状2012年,第579–610页。
[40]
Arulkumaran K.,Deisenroth M.P.,Brundage M.,Bharath A.A.,深度强化学习:一项简短调查,IEEE信号处理。美格。34 (6) (2017) 26–38.
[41]
Dearden R.,Burbridge C.,使用学习的符号状态抽象进行操纵规划,机器人。自动。系统。62 (3) (2014) 355–365.
[42]
C.Mueller,J.Venicx,B.Hayes,使用概念约束从演示和技能修复中学习鲁棒机器人,收录于:IEEE/RSJ Int.Conf.Intelligent Robots and Systems(IROS),2018年,第6029–6036页。
[43]
de Kleer J.,Williams B.C.,《诊断多个故障》,人工智能32 (1987) 97–130.
[44]
Reiter R.,第一原理诊断理论,人工智能32 (1) (1987) 57–95.
[45]
B.Ames、A.Thackston和G.Konidaris,《使用参数化技能学习规划的符号表示法》,收录于:IEEE/RSJ Int.Conf.Intelligent Robots and Systems(IROS),2018年,第526–533页。
[46]
Rasmussen C.E.、Williams C.K.I.、。,机器学习的高斯过程麻省理工学院出版社,2006年。
[47]
C.D.McKinnon,A.P.Schoellig,《基于经验的模型选择,在不断变化的条件下实现对重复任务的长期安全控制》,收录于:IEEE/RSJ Int.Conf.Intelligent Robots and Systems(IROS),2018年,第2977–2984页。
[48]
Deisenroth M.P.、Fox D.、Rasmussen C.E.,机器人和控制中数据高效学习的高斯过程,IEEE传输。模式分析。机器。智力。37 (2) (2015) 408–423.
[49]
J.Collins、D.Howard和J.Leitner,《量化机器人操作任务中的现实差距》,载于《国际机器人技术与自动化》,2019年,第6706-6712页。
[50]
James S.、Ma Z.、Arrojo D.R.、Davison A.J.、Rlbench:机器人学习基准和学习环境,IEEE机器人。自动。莱特。5 (2) (2020) 3019–3026.
[51]
L.Hermann等人,《从模拟到实际视觉运动控制演示中生成自适应课程》,收录于:IEEE国际机器人与自动化(ICRA),2020年,第6498–6505页。
[52]
S.Mukherjee等人,《通过视觉技能和先决条件模型进行反应性长时间任务执行》,收录于:IEEE/RSJ Int.Conf.Intelligent Robots and Systems(IROS),2021年,第5717–5724页。
[53]
S.Ekvall,D.Kragic,《从多人演示中学习任务模型》,载于:第15届IEEE国际研讨会。机器人与人类交互通信,2006年,第358-363页。
[54]
S.Brandl,O.Kroemer,J.Peters,《使用扭曲参数概括物体之间的浇注动作》,载于:第14届IEEE-RAS国际会议。仿人机器人(Humanoids),2014,第616–621页。
[55]
G.Kazhoyan,M.Beetz,《基于在线投影在现实世界中执行未指定动作》,载于:IEEE/RSJ Int.Conf.Intelligent Robots and Systems(IROS),2019年,第5156–5163页。
[56]
J.Stüber,M.Kopicki,C.Zito,机器人推操作的基于特征的转移学习,收录于:IEEE国际机器人与自动化(ICRA),2018年,第5643–5650页。
[57]
I.Nematolahi,O.Mees,L.Hermann,W.Burgard,《预见的后见:物理交互的无监督结构动力学模型》,载于:IEEE/RSJ国际智能机器人与系统(IROS),2020年,第5319–5326页。
[58]
A.F.Abdelrahman,A.Mitrevski,P.G.Plöger,使用学徒学习执行上下文软件任务,收录于:IEEE Int.Conf.Robotics and Automation(ICRA),2020年,第1329–1335页。
[59]
Caruana R.,多任务学习,机器。学习。28 (1997) 41–75.
[60]
D.Song,K.Huebner,V.Kyrki,D.Kragic,使用图形模型学习机器人抓取的任务约束,收录于:IEEE/RSJ Int.Conf.Intelligent Robots and Systems(IROS),2010年,第1579-1585页。
[61]
Mahler J.等人。,Dex-net 2.0:深入学习使用合成点云和分析抓取指标规划稳健抓取, 2017.
[62]
W.Liu,A.Daruna,S.Chernova,CAGE:上下文软件抓取引擎,摘自:IEEE国际机器人技术与自动化(ICRA),2020年,第2550–2556页。
[63]
M.Beetz等人,《Know Rob 2.0——认知机器人代理的第二代知识处理框架》,收录于:IEEE国际机器人技术与自动化(ICRA),2018年,第512-519页。
[64]
Olivares-Alarcos A.等人,《基于本体论的机器人自主方法的回顾与比较》,知识。工程版次。34 (2019).
[65]
Paulius D.,Sun Y.,服务机器人知识表示调查,机器人。自动。系统。118 (2019) 13–30.
[66]
M.Diab等人,《自动化规划和执行中故障解释的本体论》,载于:机器人2019:第四届伊比利亚机器人大会,2020年,第381-390页。
[67]
Wu Z.,Palmer M.,动词语义和词汇选择,in:计算语言学协会第32届年会1994年,第133-138页。
[68]
Koller D.,Friedman N.,参数估计,in:概率图形模型:原理和技术麻省理工学院出版社,2009年,第733-739页。
[69]
Peischl B.,Wotawa F.,基于模型的诊断或基于第一原理的推理,IEEE智能。系统。18 (3) (2003) 32–37.
[70]
T.Obry,L.Travè-Massuyès,A.Subias,通过基于层次密度的聚类进行计算机辅助诊断,载于:第29届国际诊断原理研讨会,DX,2018。
[71]
Schölkopf B.等人,走向因果表征学习,程序。电气与电子工程师协会109 (5) (2021) 612–634.
[72]
Richens J.G.、Lee C.M.、Johri S.,通过因果机器学习提高医学诊断的准确性,自然公社。11 (1) (2020) 3923–3931.
[73]
Pearl J.,反事实的算法,安。数学。Artif公司。智力。61 (1) (2011) 29–39.
[74]
T.E.Lee,J.Zhao,A.S.Sawhney,S.Girdhar,O.Kroemer,《机器人操作策略的结构和转移学习模拟中的因果推理》,收录于:IEEE国际机器人与自动化(ICRA),2021年,第4776-4782页。
[75]
Korf R.E.,深度第一迭代深化:最优容许树搜索,人工智能27 (1) (1985) 97–109.
[76]
Riley K.F.、Hobson M.P.、Bence S.J.,指数和伽马分布,见:物理与工程数学方法第三版,剑桥大学出版社,2006年,第1190–1192页。
[77]
Yamamoto T.等人,作为家用移动机械手研究平台的人体支持机器人的开发,ROBOMECH J。6 (2019) 1–15.
[78]
Ren S.,He K.,Girshick R.,Sun J.,Faster R-CNN:使用区域提议网络实现实时目标检测,收录于:神经信息处理系统的进展282015年,第91–99页。
[79]
Ijspeert A.J.、Nakanishi J.、Hoffmann H.、Pastor P.、Schaal S.,《动态运动原语:运动行为的学习吸引子模型》,神经计算。25 (2) (2013) 328–373.
[80]
刘伟等。,SSD:单发多盒探测器2015年,CoRRarXiv:1512.02325,URLhttps://arxiv.org/abs/1512.02325.
[81]
B.Calli等人,《YCB对象和模型集:操纵研究的通用基准》,载于:国际Conf.Advanced Robotics,ICAR,2015年,第510-517页。
[82]
Fischler M.A.,Bolles R.C.,《随机样本共识:图像分析和自动制图应用的模型拟合范例》,Commun公司。ACM公司24 (6) (1981) 381–395.
[83]
Jonschkowski R.,Brock O.,使用机器人先验学习状态表示,自动。机器人39 (3) (2015) 407–428.
[84]
Kloss A.、Schaal S.、Bohg J.,结合学习和分析模型,从感官数据预测动作效果,国际J机器人。物件。(2020) 1–20.
[85]
刘浩、王义山、沈霞、蔡杰,《高斯过程遇到大数据时:可扩展GP的回顾》,IEEE传输。神经网络。李尔尼。系统。31 (11) (2020) 4405–4423.
[86]
D.Borrajo,M.Veloso,《通过计划分析实现智能执行》,收录于:IEEE/RSJ Int.Conf.Intelligent Robots and Systems(IROS),2021年。
[87]
C.Uhde,N.Berberich,K.Ramirez-Amaro,G.Cheng,《机器人作为科学家:使用心理模拟测试从虚拟现实中的人类活动中提取的因果假设》,载于:IEEE/RSJ Int.Conf.Intelligent Robots and Systems(IROS),2020年,第8081–8086页。
[88]
Levine S.,Finn C.,Darrell T.,Abbeel P.,深度视觉运动政策的端到端培训,J.马赫。学习。物件。17 (1) (2016) 1334–1373.
[89]
O.Groth,C.Hung,A.Vedaldi,I.Posner,《多功能技能原件的目标条件端到端视觉运动控制》,载于:IEEE国际会议机器人与自动化(ICRA),2021,第1319–1325页。

索引术语

  1. 一种结合符号和子符号元素的内省机器人混合技能参数化模型
            索引项已通过自动分类分配给内容。

            建议

            评论

            信息和贡献者

            问询处

            发布于

            封面图像机器人和自治系统
            机器人和自治系统 第161卷,C期
            2023年3月
            327页
            国际标准编号:0921-8890
            期刊目录

            出版商

            北韩出版公司。

            荷兰

            出版历史

            出版:2023年3月1日

            作者标记

            1. 机器人自省
            2. 机器人执行失败
            3. 技能执行模型

            限定符

            • 研究文章

            贡献者

            其他指标

            文献计量学和引文

            文献计量学

            文章指标

            • 0
              引文总数
            • 0
              总下载次数
            • 下载次数(过去12个月)0
            • 下载次数(最近6周)0
            反映截至2024年9月21日的下载量

            其他指标

            引文

            视图选项

            查看选项

            获取访问权限

            登录选项

            完全访问权限

            媒体

            数字

            其他

            桌子

            分享

            分享

            共享此出版物链接

            在社交媒体上分享