×

通过混合搜索实现复杂代理和环境下的不确定性运动规划。 (英语) Zbl 07596563号

摘要:随着自主系统和机器人应用于更真实的情况,他们在规划行动时必须考虑不确定性。任务的成功往往是无法保证的,规划师必须对失败的概率进行推理。不幸的是,由于需要考虑复杂的多维概率分布,计算满足任务目标的轨迹,同时限制故障概率是很困难的。最近的方法成功地使用了基于机会约束的模型规划。然而,这些方法中的大多数只能处理简单的环境和代理模型。我们认为,在不确定性条件下,现有的目标定向运动规划方法存在两个主要缺点。首先,目前的方法无法处理表达性环境模型,例如3D非凸障碍物。其次,大多数规划师在计算轨迹风险时都依赖于大量的简化,包括近似代理的动力学、几何和不确定性。在本文中,我们将混合搜索应用于有风险的、目标导向的规划问题。混合搜索由区域规划器和轨迹规划器组成。区域规划师通过推理自治主体为了完成任务应该访问的几何区域来进行离散选择。在制定区域规划器时,我们提出了有助于生成无障碍路径的地标区域。区域规划器将路径通过环境传递给轨迹规划器;轨迹规划器的任务是优化轨迹,以尊重代理的动态和用户期望的任务失败风险。我们讨论了三种轨迹风险建模方法:基于CDF的方法、基于抽样的配置方法和名为射法蒙特卡罗的算法。与过去的方法相比,这些模型允许在更复杂的环境、代理动力学、几何和不确定性模型中计算轨迹风险。本文介绍了各种2D和3D测试案例,包括线性案例、Dubins汽车模型和水下自主飞行器。该方法在解决方案的速度和实用性方面优于其他方法。此外,仿真结果表明,弹道风险模型能够更好地逼近风险。

MSC公司:

68次发射 人工智能
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Anton,H.(1999)。微积分:新视野。约翰·威利父子公司·Zbl 0997.26500号
[2] Berg,M.d.、Cheong,O.、Kreveld,M.v.和Overmars,M.(2008)。计算几何:算法和应用(第三版)。Springer-Verlag TELOS,美国加利福尼亚州圣克拉拉·Zbl 1140.68069号
[3] Betts,J.T.(2009)。使用非线性规划进行最优控制和估计的实用方法(第二版)。剑桥大学出版社,美国纽约州纽约市·兹比尔1189.49001
[4] Bhatia,A.、Kavraki,L.E.和Vardi,M.Y.(2010年)。具有时间目标的基于采样的运动规划。2010年IEEE机器人与自动化国际会议,第2689-2696页。
[5] Bhatia,A.、Maly,M.R.、Kavraki,L.E.和Vardi,M.Y.(2011年)。具有复杂目标的运动规划。IEEE机器人自动化杂志,18(3),55-64。
[6] Blackmore,L.(2008)。随机不确定性下的鲁棒路径规划和反馈设计。美国航空航天学会制导、导航和控制。
[7] Blackmore,L.、Li,H.和Williams,B.S.(2006年)。带障碍物的最优鲁棒路径规划的概率方法。2006年美国控制会议,7页。
[8] Blackmore,L.、Ono,M.、Bektassov,A.和Williams,B.C.(2010年)。机会约束随机预测控制的概率粒子控制近似。IEEE传输。机器人学,26(3),502-517。
[9] Blackmore,L.、Ono,M.和Williams,B.C.(2011年)。具有障碍物的机会约束最优路径规划。IEEE传输。机器人学,27(6),1080-1094。
[10] Breen,D.、Regli,W.和Peysakhov,M.(2020)。背面消隐、z缓冲、光线投射、光线跟踪光能传递。https://www.cs.drexel.edu/david/Classes/CS430/讲座/L-15_CullingZbufRays.pdf。
[11] Brzezniak,Z.和Zastawniak,T.(1999)。基本随机过程。斯普林格·弗拉格,伦敦·Zbl 0922.60003号
[12] Choset,H.(2010)。机器人运动规划:配置空间。https://www.cs.cmu。edu/motionplanning/leachs/Chap3-Config-Space_howie.pdf。
[13] Cooney,L.(2016)。扩展Slocum滑翔机的功能。2016年海洋运动会MTS/IEEE Monterey,1-5。
[14] Cui,M.L.、Harabor,D.D.和Grastien,A.(2017年)。导航网格上的无妥协寻路。《第26届国际人工智能联合会议论文集》,IJCAI’17,第496-502页。AAAI出版社。
[15] Davis,R.、C.Eriksen,C.和P.Jones,C.(2002)。自动浮标驱动的水下滑翔机。Griffiths,G.(编辑),《自动水下航行器的技术与应用》。泰勒和弗朗西斯。
[16] Deits,R.和Tedrake,R.(2015)。通过半定规划计算无障碍空间的大凸区域,第109-124页。施普林格国际出版公司,Cham。
[17] Elfes,A.(1989)。使用占用网格进行移动机器人感知和导航。计算机,22(6),46-57。
[18] Ericson,C.(2005)。实时碰撞检测。摩根考夫曼互动3D技术系列。Morgan Kaufmann,旧金山。
[19] Fainekos,G.、Kress-Gazit,H.和Pappas,G.(2005)。移动机器人的时序逻辑运动规划。2005年IEEE机器人与自动化国际会议论文集,第2020-2025页。
[20] Faust,A.,Ramirez,O.,Fiser,M.,Oslund,K.,Francis,A.,Davidson,J.,&Tapia,L.(2018)。PRM-RL:通过结合强化学习和基于采样的规划实现远程机器人导航任务。2018年IEEE机器人与自动化国际会议,ICRA 2018,布里斯班,第5113-5120页,澳大利亚布里斯班。
[21] Fernandez-Gonzalez,E.、Williams,B.C.和Karpas,E.(2018)。ScottyActivity:带凸优化的混合离散连续规划。人工智能研究杂志(JAIR),62579-664·Zbl 1448.68433号
[22] Freund,R.M.(2004)。非凸优化问题。https://ocw.mit。edu/courses/sloan-school-of-management/15-094j-systems-optimizationmodels-and-computation-sma-5223-spring-2004/lecture-notes/non-convex_prob.pdf。
[23] Genz,A.(1992年)。多元正态概率的数值计算。计算与图形统计杂志,1(2),141-149。
[24] Gill,P.E.、Murray,W.、Saunders,M.A.和Wong,E.(2017年)。SNOPT 7.6用户指南:大型非线性编程软件。加利福尼亚州圣地亚哥加利福尼亚大学数学系计算数学报告中心CCoM 17-1。
[25] Gonzalez,E.F.(2018)。长视野下的生成性多机器人任务和运动规划。马萨诸塞州剑桥市麻省理工学院博士论文,马萨诸塞02139。
[26] Gurobi Optimization,Inc.(2014)。Gurobi优化器参考手册.Gurobi.com/wpcontent/plugins/hd_documentations/documentation/9.0/refman.pdf。
[27] Hrabar,S.(2008)。旋翼机无人机的三维路径规划和基于立体的避障。2008年IEEE/RSJ国际智能机器人与系统会议,第807-814页。
[28] Ichter,B.、Schmerling,E.、Agha-mohammadi,A.和Pavone,M.(2017年)。基于GPU多目标搜索的实时随机运动规划。2017年IEEE机器人与自动化国际会议,ICRA 2017,新加坡,第5019-5026页。
[29] J.Kuffner,Jr.、J.和Lavalle,S.M.(2000)。RRT-Connect:一种有效的单查询路径规划方法。InProc.公司。IEEE机器人与自动化国际会议,第995-1001页。
[30] Janson,L.、Schmerling,E.和Pavone,M.(2018年)。不确定条件下机器人轨迹优化的蒙特卡洛运动规划,第343-361页。施普林格国际出版公司,Cham。
[31] Jasour,A.M.、Hofmann,A.和Williams,B.C.(2018年)。不确定环境中快速风险估计的平方矩方法。2018年IEEE决策与控制会议(CDC),第2445-2451页。
[32] Jetchev,N.和Toussant,M.(2010年)。杂波体素环境中的轨迹预测。2010年IEEE机器人与自动化国际会议,第2523-2528页。
[33] Jimenez,P.、Thomas,F.和Torras,C.(1998年)。用于运动规划的碰撞检测算法。在Laumond,J.-P.(编辑),机器人运动规划和控制,第6章,第305-343页。斯普林格。
[34] Johnson,A.(2010-2014)。Clipper-一个开源的免费库,用于剪裁和偏移直线和多边形。http://www.angusj.com/delphi/clipper.php。
[35] Jones,E.、Oliphant,T.、Peterson,P.等人(2001年)。SciPy:Python的开源科学工具。http://www.scipy.org/。
[36] Kelly,M.(2017)。轨迹优化简介:如何进行自己的直接搭配。SIAM评论,59849-904·Zbl 1474.37131号
[37] Kettner,L.(2018)。Halfedge数据结构。InCGAL用户和参考手册(4.13版)。CGAL编辑委员会。
[38] Kloeden,P.和Platen,E.(2011年)。随机微分方程的数值解。随机建模和应用概率。施普林格-柏林-海德堡。
[39] LaValle,S.M.(2006)。规划算法。剑桥大学出版社,美国纽约州纽约市·Zbl 1100.68108号
[40] LaValle,S.M.和Kuffner Jr.,J.J.(2000)。快速展开随机树:进展和前景。http://msl.cs.uiuc.edu/lavalle/papers/LavKuf01.pdf·Zbl 0986.68151号
[41] L´eaut´e,T.(2005)。通过基于模型的临时计划执行来协调敏捷系统。马萨诸塞州剑桥麻省理工学院硕士论文,马萨诸塞02139。
[42] Leonard,N.E.和Graver,J.G.(2001年)。基于模型的水下滑翔机反馈控制。IEEE海洋工程杂志,26(4),633-645。
[43] 李海霞(2010)。孔明:具有时间扩展目标的混合系统的生成规划器。马萨诸塞州剑桥市麻省理工学院博士论文,马萨诸塞02139。
[44] Luders,B.、Kothari,M.和How,J.P.(2010年)。针对环境不确定性的概率稳健性的机会约束RRT。InAIAA制导、导航和控制会议(GNC),加拿大多伦多。
[45] Ono,M.、Williams,B.C.和Blackmore,L.(2013年)。有界风险下连续动态系统的概率规划。《人工智能研究杂志》(JAIR),46,511-577·Zbl 1358.68270号
[46] Owen,A.B.(2013)。蒙特卡罗理论、方法和示例。斯坦福大学。
[47] Patil,S.、van den Berg,J.和Alterovitz,R.(2012)。高斯运动和传感不确定性下安全运动规划的碰撞概率估计。在IEEE机器人和自动化国际会议上,ICRA 2012,美国明尼苏达州圣保罗。
[48] Plaku,E.、Kavraki,L.E.和Vardi,M.Y.(2009年)。混合系统:通过结合运动规划和离散搜索,从验证到证伪。系统设计中的形式方法,34(2),157-182·Zbl 1192.68692号
[49] Powell,D.和Abel,T.(2015)。应用于物理保守体素化的精确通用重网格方案。计算物理杂志,297340-356·Zbl 1349.65084号
[50] Pr´ekopa,A.(1995年)。随机编程。多德雷赫特Kluwer学术出版集团;马萨诸塞州诺威尔·Zbl 0863.90116号
[51] Rudnick,D.L.、Davis,R.E.、Eriksen,C.C.、Fratantoni,D.M.和Perry,M.J.(2004)。用于海洋研究的水下滑翔机。InMarine Technology Society Journal,第48-59页。
[52] Santos,F.(2012)。多面体的直径与赫希猜想。https://www3.math。tu-berlin.de/combi/MDS/summerschool12-material/santos_1.pdf。
[53] Sucan,Ioan A.和Kavraki,Lydia E.(2010年)。内外细胞探索运动动力学规划。施普林格柏林海德堡·Zbl 1215.93104号
[54] Triantafyllou,M.(2004年)。移动框架的运动学。https://ocw.mit.edu/课程/机械工程/2-154-maneuveringandcontrol-of-surface-andunderwater vehicles-13-49-fall-2004/lecure-notes/lec1.pdf。
[55] van den Berg,J.、Abbeel,P.和Goldberg,K.Y.(2011年)。LQG-MP:针对运动不确定性和不完美状态信息的机器人优化路径规划。国际机器人研究杂志,30(7),895-913。
[56] Vasile,C.I.和Belta,C.(2014)。基于反应采样的时序逻辑路径规划。2014年IEEE国际机器人与自动化会议(ICRA),第4310-4315页。
[57] Vatti,B.R.(1992)。多边形剪裁的通用解决方案。Commun公司。美国医学会,35(7),56-63。
[58] Weisstein,E.W.(2018)。二元正态分布。来自MathWorld-A Wolfram Web资源。http://mathworld.wolfram.com/BivariateNormalDistribution.html。
[59] 齐格勒,J.和斯蒂勒,C.(2009)。用于动态道路驾驶场景中快速轨迹规划的时空状态格。2009年IEEE/RSJ智能机器人和系统国际会议,第1879-1884页
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。