跳到主要内容
研究论文

基于线性时序逻辑的反应式高级任务的物理可行修复

出版:2023年9月15日 出版历史

摘要

创建复杂机器人行为的典型方法是组合原子控制器或技能,以便生成的行为满足高级任务;然而,当一项任务不能用一组给定的技能完成时,很难知道如何修改技能以使任务成为可能。我们提出了一种将符号修复与物理可行性检查相结合的方法,以自动修改现有技能,使机器人能够执行以前不可行的任务。我们用线性时间逻辑(LTL)公式对机器人技能进行编码,该公式捕捉了反应性任务的安全约束和目标。此外,我们的编码捕获了全部技能的执行,而之前的工作只考虑了技能执行前后的世界状态。我们的修复算法建议进行符号修改,然后尝试通过修改受符号修复衍生的线性时间逻辑(LTL)约束的原始技能来物理实现这些建议。如果技能在物理上不可行,我们会自动为符号修复提供附加约束。我们通过Baxter和Clearpath豺狼展示了我们的方法。

工具书类

[1]
G.Konidaris、L.P.Kaelbling和T.Lozano-Perez,“从技能到符号:学习抽象高层规划的符号表示”J.阿蒂夫。智力。物件。,第61卷,第215-289页,2018年1月。
[2]
R.Tedrake、I.R.Manchester、M.Tobenkin和J.W.Roberts,“LQR-树:通过平方和验证反馈运动规划,”国际J机器人。物件。2010年7月,第29卷,第8期,第1038–1052页。
[3]
A.Majumdar和R.Tedrake,“用于实时鲁棒反馈运动规划的漏斗库”国际J机器人。物件。,第36卷,第8期,第947-982页,2017年7月。
[4]
R.R.Burridge、A.A.Rizzi和D.E.Koditschek,“动态灵巧机器人行为的顺序组合”国际J机器人。物件。,第18卷,第6期,第534-555页,1999年6月。
[5]
H.Kress-Gazit、M.Lahijanian和V.Raman,“机器人合成:机器人行为的保证和反馈”每年。反向控制,机器人。,自动。系统。,第1卷,第211–236页,2018年5月。
[6]
S.M.LaValle,规划算法英国剑桥:剑桥大学出版社,2006年。
[7]
R.E.Fikes和N.J.Nilsson,“STRIPS:将定理证明应用于问题解决的新方法”Artif公司。智力。1971年9月,第2卷,第3-4期,第189-208页。
[8]
A.Pacheck、S.Moarref和H.Kress-Gazit,《为高层行为寻找缺失的技能》程序。IEEE国际会议机器人。自动垫。2020年,第10335–10341页。
[9]
G.E.Fainekos,“修改运动规划的时序逻辑规范”,in程序。IEEE国际会议机器人。自动化。2011年,第40-45页。
[10]
R.Alur、S.Moarref和U.Topcu,《GR(1)时序逻辑规范的反策略引导细化》程序。IEEE形式方法计算-辅助设计。2013年,第26-33页。
[11]
C.-I.Vasile、D.Aksaray和C.Belta,“时间窗口时序逻辑”西奥。计算。科学。第691卷,第27-54页,2017年。
[12]
S.Ghosh等人,“根据信号时序逻辑规范进行合成的诊断和修复”程序。第19届国际会议混合系统:计算。控制2016年,第31-40页。
[13]
A.T.Buyukkocak和D.Aksaray,“弹性控制合成信号时序逻辑规范的时序松弛”,in程序。IEEE第61届会议决定。2022年,第2890–2896页。
[14]
D.Kamale、E.Karyofylli和C.-I.Vasile,《基于自动化的放松规范优化规划》程序。IEEE/RSJ国际会议情报。机器人系统。2021年,第6525–6530页。
[15]
V.Raman和H.Kress-Gazit,“解释不可能的高级机器人行为”IEEE传输。机器人。,第29卷,第1期,第94-104页,2013年2月。
[16]
C.Innes和S.Ramamoorthy,“用时序逻辑规范阐述学习过的演示”程序。机器人:科学。系统。美国俄勒冈州科尔瓦利斯,2020年。
[17]
M.A.Rana、M.Mukadam、S.R.Ahmadzadeh、S.Chernova和B.Boots,“走向健壮的技能推广:统一从演示和动作规划中学习”,摘自程序。Conf.机器人学习。2017年,第109-118页。
[18]
R.Toro Icarte、T.Q.Klassen、R.Valenzano和S.A.McIlraith,“使用LTL向RL代理教授多项任务”,in程序。第17届国际会议自动。Agent多Agent系统。2018年,第452-461页。
[19]
R.Bloem、B.Jobstmann、N.Piterman、A.Pnueli和Y.Sa'ar,“反应(1)设计的合成”J.计算。系统科学。,第78卷,第3期,第911–938页,2012年5月。
[20]
R.Könighfer、G.Hofferek和R.Bloem,《使用简单反策略调试正式规范》,in计算中的形式方法-辅助设计。,2009年,第152-159页。
[21]
K.Kim、G.Fainekos和S.Sankaranarayanan,“关于规范自动机的最小修订问题,”国际J机器人。物件。,第34卷,第12期,第1515-1535页,2015年10月。
[22]
A.Dokhanchi、B.Hoxha和G.Fainekos,《度量时间间隔时序逻辑规范启发和调试》,in程序。ACM/IEEE国际协调形式化方法模型协同设计2015年,第70-79页。
[23]
K.Chatterjee、B.Henzinger和A.T.Jobstmann,《合成的环境假设》程序。第19届国际会议一致性理论,柏林,海德堡,2008年,第147-161页。
[24]
W.Li、L.Dworkin和S.A.Seshia,《综合采矿假设》程序。IEEE/ACM国际协调形式化方法模型协同设计,2011年,第43–50页。
[25]
M.Lahijanian、S.B.Andersson和C.Belta,“具有概率满意度保证的时序逻辑运动规划和控制”IEEE传输。机器人。,第28卷,第2期,第396–409页,2012年4月。
[26]
M.Lahijanian、M.R.Maly、D.Fried、L.E.Kavraki、H.Kress-Gazit和M.Y.Vardi,“具有部分满意度保证的不确定环境中的迭代时间规划,”IEEE传输。机器人。,第32卷,第3期,第583-599页,2016年6月。
[27]
A.Pacheck、G.Konidaris和H.Kress-Gazit,“使用学习的抽象表示自动编码和修复反应性高级任务”,摘自程序。第19国际交响乐团。机器人。物件。2019年,第509-525页。
[28]
X.Li,C.-I.Vasile和C.Belta,《时间逻辑奖励强化学习》程序。IEEE/RSJ国际会议情报。机器人系统。2017年,第3834–3839页。
[29]
L.Illanes、X.Yan、R.T.Icarte和S.A.McIlraith,《符号计划作为强化学习的高级指导》程序。国际协调自动化计划。行程安排2020年,第30卷,第540-550页。
[30]
A.Camacho、R.T.Icarte、T.Q.Klassen、R.A.Valenzano和S.A.McIlraith,《LTL及其以外:强化学习中奖励函数规范的形式语言》,in程序。国际联合协调条款。智力。2019年,第19卷,第6065–6073页。
[31]
C.R.Garrett等人,“综合任务和动作规划”每年。反向控制,机器人。,自动。系统。,第4卷,第1期,第265-293页,2021年5月。
[32]
S.Srivastava、E.Fang、L.Riano、R.Chitnis、S.Russell和P.Abbeel,《通过可扩展的计划依赖接口层进行任务和运动规划》程序。IEEE国际会议机器人。自动化。2014年,第639-646页。
[33]
M.Muhayyuddin、L.M.Kavraki和J.Rosell,“杂乱和不确定环境中抓取的基于随机物理的运动规划,”IEEE机器人。自动垫。莱特。,第3卷,第2期,第712-719页,2018年4月。
[34]
J.Lee、C.Nam、J.Park和C.Kim,“基于树搜索的任务和运动规划,具有抓取和非预想操作,用于杂乱中障碍物的重新排列”程序。IEEE国际会议机器人。自动化。2021年,第8516–8522页。
[35]
N.T.Dantam、Z.K.Kingston、S.Chaudhuri和L.E.Kavraki,“任务和动作规划的增量约束框架”国际J机器人。物件。,第37卷,第10期,第1134–1151页,2018年9月。
[36]
H.Ravichandar、A.S.Polydoros、S.Chernova和A.Billard,“机器人从演示中学习的最新进展,”每年。反向控制,机器人。,自动。系统。,第3卷,第297–330页,2020年。
[37]
A.Pnueli,“程序的时序逻辑”,in程序。IEEE第18年。交响乐团。基础计算。科学。1977年,第46-57页。
[38]
S.Schaal、J.Peters、J.Nakanishi和A.Ijspeert,《学习动作原语》程序。机器人。第11国际交响乐团决议。柏林,海德堡,2005年,第561-572页。
[39]
N.Jaquier、D.Ginsbourger和S.Calinon,《利用基于模型的高斯过程从演示中学习》程序。Conf.机器人学习。2019年,第247–257页。
[40]
M.Noseworthy、R.Paul、S.Roy、D.Park和N.Roy,“用于学习动作原语的任务条件可变自动编码器”,in程序。Conf.机器人学习。2019年,第933–944页。
[41]
T.Kulak、J.Silverio和S.Calinon,《傅里叶运动原语:从演示中学习机器人节奏技能的方法》程序。机器人:科学。系统。美国俄勒冈州科尔瓦利斯,2020年。
[42]
P.Beeson和B.Ames,“TRAC-IK:用于改进通用反向运动学求解的开源库”,in程序。IEEE-RAS第15届国际会议仿人机器人2015年,第928-935页。
[43]
O.Maler和D.Nickovic,“监测连续信号的时间特性”,in程序。形式技术、建模分析。定时容错系统:联合国际协调形式模型。分析。定时系统。,格式,正式技术,实时容错系统。,2004年,第152-166页。
[44]
H.Hansson和B.Jonsson,“关于时间和可靠性的推理逻辑,”形式方面计算。1994年,第6卷,第512-535页。
[45]
A.Paraschos、C.Daniel、J.R.Peters和G.Neumann,“概率运动原语”高级神经信息处理。系统。第26卷,第2616–2624页,2013年。

索引术语

  1. 基于线性时间逻辑的反应性高级任务的物理可行修复
            索引项已通过自动分类分配给内容。

            建议

            评论

            信息和贡献者

            问询处

            发布于

            封面图片IEEE机器人汇刊
            IEEE机器人汇刊 第39卷第6期
            2023年12月
            781页
            国际标准编号:1552-3098
            期刊目录

            出版商

            IEEE出版社

            出版历史

            出版:2023年9月15日

            限定符

            • 研究文章

            贡献者

            其他指标

            文献计量学和引文

            文献计量学

            文章指标

            • 0
              引用总数
            • 0
              总下载次数
            • 下载次数(过去12个月)0
            • 下载次数(最近6周)0
            反映截至2024年9月15日的下载量

            其他指标

            引文

            视图选项

            查看选项

            获取访问权限

            登录选项

            完全访问权限

            媒体

            数字

            其他

            桌子

            分享

            分享

            共享此出版物链接

            在社交媒体上分享