×

多智能体系统反应控制器的合成和符号综合。 (英语) Zbl 1395.68267号

摘要:我们考虑由一组受控和非受控智能体组成的多智能体系统的控制器综合问题。受控代理可能需要相互合作,并对非受控代理的行为作出反应,以实现其目标。此外,代理可能不完美,即只对其环境进行了部分观察。我们提出了一个基于合成反应合成的控制器合成框架。我们象征性地实现了这些算法,并将其应用于机器人运动规划案例研究,其中多个机器人被放置在一个网格世界中,其中包含静态障碍物和其他动态、不受控和潜在敌对机器人。我们考虑了不同的目标,如避免碰撞、保持队形和有界可达性。我们表明,通过利用系统的结构,从时间和内存的角度来看,组合合成算法可以显著优于集中式算法,并且可以解决集中式算法不可行的问题。

MSC公司:

68T42型 Agent技术与人工智能
93亿B50 合成问题
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Halperin,D。;拉托姆,J.-C。;Wilson,R.H.,《装配规划的一般框架:运动空间方法》,《算法》,26,3-4,577-601,(2000)·Zbl 0999.68225号
[2] 罗德里格斯,S。;Amato,N.M.,基于行为的疏散规划,(IEEE机器人与自动化国际会议(ICRA),(2010),IEEE),350-355
[3] 詹宁斯,J.S。;惠兰,G。;Evans,W.F.,《与移动机器人团队合作搜索和救援》(第八届国际先进机器人会议(ICAR),(1997),IEEE),193-200年
[4] 福克斯博士。;伯加德,W。;Kruppa,H。;Thrun,S.,协作多机器人定位的概率方法,Auton。机器人,8,3,325-344,(2000)
[5] 罗斯·D。;唐纳德,B。;Jennings,J.,《用自主机器人团队移动家具》,(1995年IEEE/RSJ智能机器人和系统国际会议论文集,第1卷,(1995),IEEE),235-242
[6] Balch,T。;Arkin,R.C.,多机器人团队基于行为的队形控制,IEEE Trans。机器人。自动。,14, 6, 926-939, (1998)
[7] 普努利,A。;Rosner,R.,《关于反应模块的合成》,(第16届美国计算机学会编程语言原理研讨会论文集,(1989),美国计算机学会),179-190
[8] 普努利,A。;Rosner,R.,《分布式反应系统难以合成》(第31届计算机科学基础年度研讨会论文集,(1990),IEEE),746-757
[9] 彼得森,G。;Reif,J。;Azhar,S.,不完全信息多人非合作游戏的下限,计算。数学。申请。,41, 7, 957-992, (2001) ·Zbl 0991.91007号
[10] 布隆,R。;Jobstmann,B。;北卡罗来纳州皮特曼。;普努利,A。;Sa’ar,Y.,《反应(1)设计的合成》,J.Compute。系统。科学。,78, 3, 911-938, (2012) ·Zbl 1247.68050号
[11] Kress-Gazit,H。;费内科斯,G.E。;Pappas,G.J.,基于时间逻辑的反应性任务和运动规划,IEEE Trans。机器人。,25, 6, 1370-1381, (2009)
[12] 萨哈,I。;拉马伊提玛,R。;库马尔,V。;帕帕斯,G.J。;Seshia,S.A.,《基于安全LTL规范的多机器人系统运动原语的自动合成》,(IEEE/RSJ智能机器人和系统国际会议(IROS),(2014),IEEE),1525-1532
[13] 北阿扬扬。;卡莱姆,V。;Kumar,V.,《带几何约束的多空中机器人反馈控制器综合》,(IEEE/RSJ智能机器人与系统国际会议(IROS),(2011),IEEE),3126-3131
[14] Keviczky,T。;博雷利,F。;Balas,G.J.,大型动态解耦系统的分散滚动时域控制,Automatica,42,12,2105-2115,(2006)·Zbl 1104.93038号
[15] 邓巴,W.B。;Murray,R.M.,用于多车辆编队稳定的分布式滚动地平线控制,Automatica,42,4,549-558,(2006)·Zbl 1103.93031号
[16] ⑩ahin,E。;Girgin,S。;Bayindir,L。;Turgut,A.E.,《集群机器人》(Swarm Intelligence,(2008),Springer),第87-100页
[17] 施,Z。;涂,J。;张,Q。;刘,L。;Wei,J.,群体机器人系统综述,(《群体智能进展》,(2012),施普林格出版社),564-572
[18] Filiot,E。;Jin,N。;Raskin,J.-F.,LTL合成的反链和合成算法,形式方法系统。设计。,39, 3, 261-296, (2011) ·Zbl 1258.03046号
[19] Church,A.,《逻辑、算术和自动机》(国际数学家大会论文集,1962年),23-35
[20] Safra,S.,关于ω-自动机,(第29届计算机科学基础年会,(1988),IEEE),319-327
[21] Rosner,R.,反应系统的模块合成,(1992),魏茨曼科学研究所,博士论文
[22] 阿鲁尔(Alur,R.)。;La Torre,S.,《ltl碎片的确定性生成器和游戏》,ACM Trans。计算。日志。,5, 1, 1-25, (2004) ·Zbl 1366.03181号
[23] Asarin,E。;马勒,O。;普努利,A。;Sifakis,J.,定时自动机的控制器合成,IFAC Proc。第31卷,第18卷,第447-452页,(1998年)
[24] 库普夫曼,O。;Vardi,M.Y.,无安全决策程序,(第46届IEEE计算机科学基础年会,(2005),IEEE),531-540
[25] 库普夫曼,O。;北卡罗来纳州皮特曼。;Vardi,M.,无安全成分合成,(计算机辅助验证(CAV),(2006),Springer),31-44·Zbl 1188.68193号
[26] 拜尔,C。;克莱因,J。;Klüppelholz,S.,控制器综合的组合框架,(并发理论(CONCUR),(2011),Springer),512-527·Zbl 1329.68182号
[27] Sohail,S。;Somenzi,F.,《安全第一:LTL游戏的两阶段算法》,(计算机辅助设计中的形式化方法,(2009),IEEE),77-84
[28] 阿鲁尔(Alur,R.)。;莫拉里夫,S。;Topcu,U.,反应合成中基于模式的假设保证规范细化,(系统构建和分析的工具和算法,(2015),施普林格),501-516
[29] Lustig,Y。;Vardi,M.Y.,《从组件库合成》,Int.J.Softw。技术工具。传输。,15, 5-6, 603-618, (2013)
[30] 阿鲁尔(Alur,R.)。;莫拉里夫,S。;Topcu,U.,带参数反应控制器的合成,(第19届混合系统国际会议论文集:计算与控制,(2016),ACM),215-224·Zbl 1364.93252号
[31] Reif,J.H.,《两层不完全信息博弈的复杂性》,J.Compute。系统。科学。,29, 2, 274-301, (1984) ·Zbl 0551.90100号
[32] 查特吉,K。;Henzinger,T.A.,《半完美信息游戏》(Semiperfective information games)(软件技术和理论计算机科学基础(FSTTCS),(2005),Springer),1-18·Zbl 1172.68540号
[33] De Wulf,M。;Doyen,L。;Raskin,J.-F.,解决不完全信息博弈的格理论,(混合系统:计算与控制,(2006),Springer),153-168·Zbl 1178.93072号
[34] 查特吉,K。;Doyen,L。;Henzinger,T.A。;Raskin,J.-F.,《信息不完全的欧米伽规则游戏算法》(Computer Science Logic,(2006),Springer),第287-302页·兹比尔1225.91012
[35] Wongpiromsarn,T。;托普库,美国。;Murray,R.M.,衰退期时序逻辑规划,IEEE Trans。自动化。控制,57,11,2817-2830,(2012)·Zbl 1369.93392号
[36] Kress-Gazit,H。;Wongpiromsarn,T。;Topcu,U.,正确、反应、高级机器人控制,IEEE机器人。自动化。Mag.,18,3,65-74,(2011)
[37] Wongpiromsarn,T。;Ulusoy,A。;贝尔塔,C。;弗拉佐利,E。;Rus,D.,具有线性时序逻辑规范的异构多智能体系统控制策略的增量综合,(IEEE机器人与自动化国际会议,(2013),IEEE),5011-5018
[38] Kloetzer,M。;Belta,C.,根据时序逻辑运动规范自动部署分布式机器人团队,IEEE Trans。机器人。,26, 1, 48-61, (2010)
[39] Ozay,N。;托普库,美国。;Murray,R.M.,车辆管理系统的分布式功率分配,(第50届IEEE决策与控制会议和欧洲控制会议,(2011年),IEEE),4841-4848
[40] Tabuada,P.,《混合系统的验证和控制:符号方法》(2009),施普林格科学与商业媒体·Zbl 1195.93001号
[41] R·帕里赫。;Ramanujam,R.,分布式过程与知识逻辑,(程序逻辑,(1985)),256-268·Zbl 0565.68025号
[42] 费金,R。;Halpern,J.Y。;摩西,Y。;瓦尔迪,M.,《关于知识的推理》(2004),麻省理工学院出版社
[43] 拉塞尔,S。;Norvig,P.,《人工智能:现代方法》,(2009),普伦蒂斯·霍尔出版社,新泽西州,美国
[44] LaValle,S.M.,规划算法,(2006),剑桥大学出版社·Zbl 1100.68108号
[45] 阿鲁尔(Alur,R.)。;莫拉里夫,S。;Topcu,U.,多智能体系统反应控制器的合成,(计算机辅助验证,(2016),Springer),251-270
[46] 克拉克,E.M。;格伦伯格,O。;Peled,D.,模型检验,(1999),麻省理工出版社
[47] 古雷维奇,Y。;Harrington,L.,《树、自动机和游戏》(第十四届ACM计算机理论研讨会论文集,(1982),ACM),60-65
[48] Schewe,S。;Finkbeiner,B.,有界综合,(验证和分析自动化技术,(2007),Springer),474-488·Zbl 1141.68491号
[49] Ehlers,R.,符号有界合成,形式。方法系统。设计。,40, 2, 232-262, (2012) ·Zbl 1247.68163号
[50] 马勒,O。;普努利,A。;Sifakis,J.,《关于定时系统离散控制器的综合》,(STACS 95,(1995),Springer),229-242·Zbl 1379.68227号
[51] 布隆,R。;Gabow,H.N。;Somenzi,F.,《n个对数n个符号步骤中的强连通成分分析算法》,《形式方法系统》。设计。,28, 1, 37-56, (2006) ·Zbl 1110.68161号
[52] Rudell,R.,有序二元决策图的动态变量排序,(1993年IEEE/ACM计算机辅助设计国际会议论文集,(1993),IEEE计算机社会出版社),42-47
[53] Moarref,S.,多智能体系统的合成反应合成,(2016),宾夕法尼亚大学
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。