×

有时间限制的小组计划。 (英语) Zbl 1357.68246号

摘要:在实际领域中嵌入规划系统导致了分布式连续规划(DCP)系统,其中计划活动分布在多个代理中,计划生成可能与计划执行同时发生。DCP系统中的一个关键挑战是如何协调一组规划代理的活动。当这些代理位于真实世界的动态域中时,这些代理经常会遇到不同的、不完整的、甚至可能不一致的环境视图,这一问题就更加复杂了。迄今为止,DCP系统只关注代理行为旨在优化全球计划的情况。相比之下,本文提出了一种针对自利规划代理的时间推理机制。为此,我们基于合作的信念-期望-意图(BDI)理论模型对代理的行为进行建模,同时通过创建与时间约束网络相结合的层次抽象计划来建模具有组时间约束的动态联合计划BDI模型规定了在组中工作的自利代理的行为,允许单个代理以自主的方式安排其活动,同时考虑到其组成员的时间约束;(ii)抽象计划允许工作组计划联合行动,而无需事先明确描述所有可能的状态,从而可以减少基于BDI的方法中需要考虑的状态数量;以及(iii)时间约束网络使每个代理能够自行推理调度活动的最佳时间,从而可以减少组之间的协调消息。该机制确保了合作计划的时间一致性,使计划和执行在个人和团体两个级别上交错进行。我们报告了该机制是如何在商业培训和模拟应用程序中实施的,并提供了其在现实场景中以及在减少沟通以协调小组成员活动方面有效性的实证证据。

MSC公司:

68T42型 Agent技术与人工智能

软件:

商店2
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Allen,J.F.:保持对时间间隔的了解。ACM通信26,832-843(1983)·Zbl 0519.68079号 ·数字对象标识代码:10.1145/182.358434
[2] 艾伦,J.F.:走向行动和时间的一般理论。《人工智能杂志》23(2),123-144(1984)·Zbl 0567.68025号 ·doi:10.1016/0004-3702(84)90008-0
[3] Barbulescu,L.,Rubinstein,Z.B.,Smith,S.F.,Zimmerman,T.L.:移动代理团队的分布式协调:提前规划的优势。在:AAMAS,第1331-1338页(2010年)·兹比尔0945.68038
[4] van Beek,P.:关于定性时间信息的推理。人工智能期刊58(1):297-326(1992)·Zbl 0782.68106号 ·doi:10.1016/0004-3702(92)90011-L
[5] Boerkoel,J.C.Jr.,Durfee,E.H.:评估调度代理的混合约束收紧。收录于:AAMAS,第673-680页(2009年)
[6] Boerkoel,J.C.Jr.,Durfee,E.H.:解决多智能体时间解耦问题的分布式算法。收录于:AAMAS,第141-148页(2011年)
[7] Boerkoel,J.C.Jr.,Durfee,E.H.:总结多智能体调度空间的分布式方法。收录于:AAAI,第1742-1748页(2012年)·Zbl 1056.68137号
[8] Chen,Y.,Wah,B.W.,Hsu,C.W.:使用SGPlan中的子目标划分和分解进行时间规划。《人工智能研究杂志》26,323-369(2006)·Zbl 1182.68229号
[9] Chien,S.、Rabideau,G.、Willis,J.、Mann,T.:航天飞机有效载荷操作的自动化规划和调度。人工智能期刊114(1),239-255(1999)·Zbl 0939.68850号 ·doi:10.1016/S0004-3702(99)00069-7
[10] Chien,S.、Rabideau,G.、Knight,R.、Sherwood,R.,Engelhardt,B.、Mutz,D.、Estlin,T.、Smith,B.,Fisher,F.、Barrett,T.,Stebbins,G..、Tran,D.:使用自动规划和调度的ASPEN自动化空间任务操作。收录:《太空行动》,第1-10页(2000年)·Zbl 0782.68106号
[11] Clement,B.J.,Barrett,A.C.:通过共享活动持续协调。收录于:AAMAS,第57-64页(2003年)·Zbl 0939.68850号
[12] Corkill,D.:分布式环境中的分层规划。收录于:IJCAI,第168-175页(1979年)·Zbl 0926.68111号
[13] Cormen,T.H.,Leiserson,C.E.,Rivest,R.L.,Stein,C.:算法导论。麻省理工学院出版社,伦敦(2001)·Zbl 1047.68161号
[14] Currie,K.,Tate,A.:O-Plan:开放式规划架构。《人工智能杂志》52(1),49-86(1991)·doi:10.1016/0004-3702(91)90024-E
[15] Dean,T.L.,McDermott,D.V.:临时数据库管理。《人工智能杂志》32(1),1-55(1987)·doi:10.1016/0004-3702(87)90061-0
[16] Dechter,R.、Meiri,I.、Pearl,J.:时间约束网络。《人工智能期刊》49(1),61-95(1991)·Zbl 0737.68070号
[17] Demetrescu,C.,Italiano,G.F.:动态全对最短路径算法的实验分析。ACM事务处理。阿尔戈。2(4),578-601(2006)·兹比尔1321.05257 ·doi:10.1145/1198513.1198519
[18] desJardins,M.,Durfee,E.H.,Ortiz,C.,Wolverton,M.:分布式连续规划研究综述。AI Mag 1(4),13-22(1999)
[19] Dudek,G.,Jenkin,M.R.M.,Milios,E.,Wilkes,D.:多智能体机器人分类法。自动。机器人。3(4), 375-397 (1996) ·doi:10.1007/BF00240651
[20] Durfee,E.H.,Lesser,V.R.:部分全球规划:分布式假设形成的协调框架。IEEE传输。系统。人类网络。21(5), 1167-1183 (1991) ·doi:10.1109/21.120067
[21] 德菲,裕利安怡;Weiss,G.(编辑),分布式问题解决和规划,121-164(1999),马萨诸塞州剑桥
[22] El-Kholy,A.,Richards,B.:规划中的时间和资源推理:parcPlan方法。收录于:ECAI,第614-618页(1996年)
[23] Erol,K.、Nau,D.、Hendler,J.:HTN规划:复杂性和表达性。收录于:AAAI,第1123-1128页(1994年)
[24] Garey,M.R.,Johnson,D.S.:《计算机与难治性:NP-完备性理论指南》。W.H.Freeman,加利福尼亚州旧金山(1979)·Zbl 0411.68039号
[25] Ghallab,M.,Nau,D.,Traverso,P.:自动化规划:理论与实践。Morgan Kaufmann,加利福尼亚州旧金山(2004)·兹比尔1074.68613
[26] Grosz,B.J.,Kraus,S.:复杂群体行动的合作计划。《人工智能杂志》86(2),269-357(1996)·Zbl 1523.68100号 ·doi:10.1016/0004-3702(95)00103-4
[27] 格罗斯,BJ;克劳斯,S。;Rao,A.(编辑);Wooldridge,M.(编辑),《共享计划的演变》,227-262(1999),马萨诸塞州波士顿·Zbl 0926.68111号 ·doi:10.1007/978-94-015-9204-8_10
[28] Grosz,B.J.、Hunsberger,L.、Kraus,S.:共同规划和行动。AI Mag 20(4),23-34(1999)
[29] 哈达德,M。;克劳斯,S。;Klusch,M.(编辑),《电子商务共享计划》,204-231(1999),纽约·doi:10.1007/978-3-642-60018-0_11
[30] Hadad,M.,Kraus,S.:协作代理进行时间推理的机制。收录于:中央情报局,第229-234页(2001年)·Zbl 1024.68733号
[31] Hadad,M.,Kraus,S.:通过协作代理交换和组合时间信息。载于:中央情报局,第279-286页(2002年)·兹比尔1014.68672
[32] Hadad,M.,Rosenfeld,A.:适应:抽象层次结构,以更好地模拟动态下的团队合作。收录:教育游戏和模拟代理,第166-182页(2012)
[33] Hadad,M.、Kraus,S.、Gal,Y.、Lin,R.:动态环境中协作规划代理的时间推理。安。数学。Artif公司。智力。37(4), 331-380 (2003) ·Zbl 1010.68172号 ·doi:10.1023/A:1021512627215
[34] Harbers,T.、Maheswaran,R.T.、Szekely,P.:集中式、分布式还是其他?在多智能体系统中做出及时决策。收录于:AAAI,第738页(2007年)·Zbl 0926.68111号
[35] Hirayama,K.,Yokoo,M.:分布式部分约束满足问题。In:约束编程的原理与实践,pp.222-236(1997)
[36] Hirayama,K.,Yokoo,M.:过约束分布式约束满足问题的一种方法:分布式层次约束满足。收录于:AAMAS,第135-142页(2000年)
[37] Horling,B.,Lesser,V.,Vincent,R.,Wagner,T.,Raja,A.,Zhang,S.,Decker,K.,Garvey,A.:TAEMS白皮书。马萨诸塞大学多代理系统实验室(1999)·Zbl 1321.05257号
[38] Hunsberger,L.:在多个代理之间分配时间网络的控制。收录于:AAMAS,第899-906页(2003年)
[39] Jennings,N.R.:使用联合意图控制工业多智能体系统中的合作问题解决。《人工智能杂志》75(2),1-46(1995)·doi:10.1016/0004-3702(94)00020-2
[40] Kamar,E.,Gal,Y.,Grosz,B.:将有益行为纳入协作规划。收录于:AAMAS,第875-882页(2009年)
[41] Kaminka,G.A.,Frenkel,I.:BITE多机器人体系结构中协调机制的集成。收录于:ICRA,第2859-2866页(2007年)
[42] 新泽西州卡拉卡皮利斯:不确定性下的规划:定性方法。收录于:EPIA,第285-296页(1995年)·Zbl 0939.68850号
[43] Kim,Y.,Krainin,M.,Lesser,V.:雷达协调和调度的最大和算法的有效变体。摘自:2011年IEEE/WIC/ACM网络智能和智能代理技术国际会议记录,第357-364页(2011)
[44] Kitano,H.:机器人杯救援:多智能体系统面临的巨大挑战。收录于:ICMAS,马萨诸塞州波士顿,第5-12页(2000年)
[45] Kohout,B.:DARPA协调员计划:回顾。收录于:CTS,第342-342页(2011年)·Zbl 1054.68664号
[46] Lansky,A.和Getoor,L.:范围和抽象:本地化规划的两个标准。载于:IJCAI,第1612-1619页(1995年)·兹比尔1182.68229
[47] Lesser,V.、Decker,K.、Wagner,T.、Carver,N.、Garvey,A.、Horling,B.、Neiman,D.、Podorozhny,R.、Nagendra Prasad,M.、Raja,A.、Vincent,R.、Xuan,P.、Zhang,X.Q.:GPGP/TEAMS领域独立协调框架的演变。见:AAMAS,pp.87-143(2004)·兹比尔1132.68706
[48] Lever,J.,Richards,B.:parcPlan:具有并行行动、资源和约束的规划架构。摘自:《智能系统方法论》,第213-222页(1994年)
[49] Liu,J.S.,Sycara,K.:利用问题结构进行分布式约束优化。收录于:ICMAS,第246-253页(1995年)
[50] Maheswaran,R.T.,Szekely,P.:分布式计划和进度管理的关键性指标。In:ICAPS,第2卷,第2页(2008年)
[51] Maheswaran,R.、Rogers,C.M.、Sanchez,R.,Szekely,P.、Gati,G.、Smyth,K.、VanBuskirk,C.:现实世界的多代理系统。收录于:AAMAS,第1281-1282页(2009年)·Zbl 0782.68106号
[52] Mailler,R.,Lesser,V.:使用协作中介解决分布式约束优化问题。收录于:AAMAS,第438-445页(2004年)
[53] Mailler,R.,Lesser,V.:使用合作中介解决分布式约束满足问题。收录于:AAMAS,第446-453页(2004年)
[54] Miller,D.P.,Gat,E.:利用已知拓扑以低计算感知导航。摘自:光电仪器工程师学会(SPIE)会议系列,第1383卷,第425-435页(1991)
[55] Modi,P.J.,Shen,W.M.,Tambe,M.,Yokoo,M.:采用:具有质量保证的异步分布式约束优化。《人工智能期刊》161(1),149-180(2005)·兹比尔1132.68706 ·doi:10.1016/j.artint.2004.09.003
[56] Mohr,R.,Henderson,T.C.:重新审视弧线和路径一致性。《人工智能杂志》28(2),225-233(1986)·doi:10.1016/0004-3702(86)90083-4
[57] Monasson,R.、Zecchina,R.,Kirkpatrick,S.、Selman,B.、Troyansky,L.:根据特征“相变”确定计算复杂性。《自然》400(6740),133-137(1999)·Zbl 1369.68244号 ·doi:10.1038/22055
[58] Montanari,U.:约束网络:图像处理的基本特性和应用。信息科学。7, 95-132 (1974) ·Zbl 0284.68074号 ·doi:10.1016/0020-0255(74)90008-5
[59] Morris,P.、Muscettola,N.、Vidal,T.等人:具有时间不确定性的计划的动态控制。收录于:IJCAI,第494-502页(2001年)
[60] Musliner,D.J.、Dufree,E.H.、Shin,K.G.:CIRCA:合作智能实时控制架构。IEEE传输。计算。23(6), 1561-1574 (1993)
[61] Musliner,D.J.、Dufree,E.H.、Shin,K.G.:实时控制计划动态构建的世界建模。《人工智能杂志》74(1),83-127(1995)·doi:10.1016/0004-3702(94)00008-O
[62] Nareyek,A.:动态和不确定实时环境中代理的规划模型。In:AIPS综合规划研讨会,第7-14页(1998年)
[63] Nareyek,A.:作为scsp的开放世界规划。摘自:AAAI限制和AI规划研讨会,第35-46页(2000年)
[64] Nau,D.,Cao,Y.,Lotem,A.,Muñoz-Avila,H.:SHOP和M-SHOP:有序任务分解规划。马里兰大学技术报告(2000年)
[65] Nau,D.S.,Au,T.C.,Ilghami,O.,Kuter,U.,Murdock,J.W.,Wu,D.,Yaman,F.:SHOP2:HTN规划系统。《人工智能研究杂志》20,379-404(2003)·Zbl 1058.68106号
[66] Penberthy,J.S.,Weld,D.:持续变化的时间规划。在:AAAI,第1010-1015页(1994年)
[67] Petcu,A.:一类分布式约束优化算法。博士。论文编号3942,瑞士联邦理工学院(EPFL),瑞士洛桑(2007)·Zbl 1180.90355号
[68] Planken,L.,De Weerdt,M.,van der Krogt,R.,Rintanen,J.,Nebel,B.,Beck,J.C.,Hansen,E.:P3c:简单时间问题的新算法。收录于:ICAPS,第256-263页(2008年)
[69] Planken,L.R.,de Weerdt,M.M.,Yorke-Smith,N.:通过强制部分路径一致性增量求解stns。In:ICAPS,第129-136页(2010年)·Zbl 1182.68229号
[70] Pynadath,D.V.,Tambe,M.:沟通型多智能体团队决策问题:分析团队合作理论和模型。《人工智能研究杂志》16,389-423(2002)·Zbl 1056.68137号
[71] Rochlin,I.,Sarne,D.,Laifenfeld,M.:在昂贵的环境中,以共同的目标协调勘探。收录于:ECAI,第690-695页(2012年)·Zbl 1327.68301号
[72] Sarne,D.,Grosz,B.J.:确定信息对协作多智能体规划的价值。自动。代理人。多代理系统。26(3), 456-496 (2013) ·doi:10.1007/s10458-012-9206-9
[73] Shah,J.A.,Williams,B.C.:通过增量编译实现析取时间约束网络的快速动态调度。In:ICAPS,第322-329页(2008年)
[74] Shah,J.A.、Conrad,P.R.、Williams,B.C.:具有动态任务分配和调度的快速分布式多代理计划执行。In:ICAPS,第289-296页(2009年)·Zbl 0519.68079号
[75] Shu,I.、Effinger,R.、Williams,B.:通过增量时间推理和冲突提取实现快速灵活规划。收录于:ICAPS,第252-261页(2005年)
[76] Simmons,R.:协调规划、感知和行动的架构。In:程序。DARPA计划、进度和控制创新方法研讨会,第292-297页(1990年)
[77] Smith,S.F.、Gallagher,A.、Zimmerman,T.:灵活时间表的分布式管理。收录于:AAMAS,第74页(2007年)·Zbl 1056.68137号
[78] Sonenberg,E.,Tidhar,G.,Werner,E.,Kinny,D.,Ljungberg,M.,Rao,A.:计划的团队活动。《技术报告26》,澳大利亚人工智能研究所,澳大利亚(1992年)
[79] Stefanovich,N.、Farinelli,A.、Rogers,A.、Jennings,N.R.:高效多代理协调的资源-软件连接树。在:AAMAS,第363-370页(2011年)·Zbl 1054.68664号
[80] Stergiou,K.,Koubarakis,M.:时间约束析取的回溯算法。人工智能期刊120(1),81-117(2000)·Zbl 0945.68038号 ·doi:10.1016/S0004-3702(00)00019-9
[81] Sultanik,E.,Modi,P.J.,Regli,W.C.:将多智能体任务调度建模为分布式约束优化问题。收录于:IJCAI,第1531-1536页(2007年)
[82] Tambe,M.:走向灵活的团队合作。《人工智能研究杂志》(Journal of Artificial Intelligence Research)783-124(1997)
[83] Vidal,T.,Fargier,H.:处理时间约束网络中的偶然事件:从一致性到可控性。J.实验理论。Artif公司。智力。11, 23-45 (1999) ·Zbl 1054.68664号 ·doi:10.1080/095281399146607
[84] Vidal,T.,Ghallab,M.:处理专门用于规划的时间约束网络中的不确定持续时间。摘自:ECAI,第48-52页(1996年)
[85] Vilain,M.,Kautz,H.A.:时间推理的约束传播算法。收录于:AAAI,第132-144页(1986年)
[86] Wehowsky,A.,Block,S.,Williams,B.:通过时间计划网络实现异构机器人的鲁棒分布式协调。In:ICAPS多智能体规划与调度研讨会,第67-72页(2005)
[87] Weld,D.,Anderson,C.,Smith,D.:扩展图形计划以处理不确定性和传感行为。收录于:AAAI,第897-904页(1998年)
[88] Wilkins,D.E.,Myers,K.L.,Lowrance,J.D.,Wesley,L.P.:不确定和动态环境中的规划和反应。J.实验理论。Artif公司。智力。7(1), 197-227 (1995) ·Zbl 0939.68834号 ·doi:10.1080/09528139508953802
[89] Wolverton,M.,desJardins,M.:使用无关推理控制分布式规划中的通信。收录于:AAAI,第868-874页(1998年)
[90] Xu,L.,Choueiry,B.:改进回溯搜索以解决tcsp。In:约束编程的原理与实践,第754-768页(2003)
[91] Yokoo,M.:分布式约束说明。施普林格,德国(2001)·Zbl 0968.68150号 ·doi:10.1007/978-3-642-59546-2
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。