×

代理人在动态环境中的维护目标:制定和政策建设。 (英语) Zbl 1183.68630号

摘要:人工智能文献中经常出现代理行为和计划背景下的维护概念。在本文中,我们认为维护概念的早期表征对于表征动态环境中某些代理的维护行为是不直观的。我们提出了不同的维护特征,并将其与早期的概念(如稳定性)区分开来。我们的维护概念对一个与“敌对”环境作斗争的心地善良的代理人更为敏感,这种环境通过不可预见的事件阻碍她实现目标(不是原则上的,而是以防万一)。它有一个参数\(k\),表示维持目标所需的不干涉(来自外部事件)的长度;我们将此概念称为“(k)-可维护性”。我们通过示例演示了这一概念,并解决了有效构建可维护性控制功能这一重要但非平凡的问题。我们提出了一种算法,该算法在多项式时间内构造一个(k)-可维护控制函数(如果存在),或者告诉我们不可能有这样的控制。我们的算法基于SAT求解,并采用了一个适当的公式来表示SAT片段中存在(k)-可维护控制,该片段是可处理的。对于小(k)(由常数限定),我们的算法是线性时间。然后,我们给出了我们算法的逻辑编程实现,并使用它给出了一个标准的过程算法,并分析了在不同的假设(如k=1)和变量描述的状态下构造(k)-可维护控件的复杂性。一方面,我们的工作为动态环境中的维护提供了新的概念和算法,另一方面,计算逻辑工具的应用也非常丰富。我们将我们的工作与早期基于时序逻辑规范的控制合成工作进行了比较,并将我们的研究与Dijkstra的自稳定概念和分布式计算中的相关概念联系起来。

MSC公司:

68T42型 Agent技术与人工智能

软件:

斯莫德尔斯
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿巴迪,M。;Lamport,L。;Wolper,P.,《反应式系统的可实现和不可实现规范》,(第16届国际自动化、语言和编程会议论文集(ICALP 89)。程序。第十六届国际自动化、语言和编程会议(ICALP 89),LNCS,第372卷(1989),斯普林格),1-17
[2] Arora,A。;Gouda,M.G.,《封闭与收敛:容错计算的基础》,IEEE软件工程学报,19,11,1015-1027(1993)
[3] 巴克斯,F。;Kabanza,F.,《临时扩展目标的规划》,《数学和人工智能年鉴》,22,5-27(1998)·Zbl 1034.68549号
[4] Baral,C。;艾特,T。;赵,J.,《使用SAT和LP设计用于非确定性领域规划的多项式时间算法》,(第20届全国人工智能会议论文集(AAAI'05)(2005),AAAI出版社),578-583
[5] Baral,C。;Gelfond,M。;普罗维蒂,A.,《代表行动:定律、观察和假设》,《逻辑编程杂志》,31201-243(1997)·Zbl 0882.68030号
[6] Baral,C。;克里诺维奇,V。;Trejo,R.,《不完全情况下规划和近似规划的计算复杂性》,人工智能,122,1-2,241-267(2000)·兹比尔0948.68088
[7] Baral,C。;克里诺维奇,V。;Trejo,R.,具有时间目标的规划的计算复杂性,(Nebel,B.,Proc.17th International Joint Conference on Artificial Intelligence(IJCAI-01)(2001),Morgan Kaufmann),509-514
[8] Baral,C。;Son,T.,动作和反应控制的相关理论,人工智能电子交易,2,3-4,211-271(1998)
[9] Baral,C。;Zhao,J.,《存在非确定性行为时的目标规范》(de Mántaras,R.L.;Saitta,L.,Proc.第16届欧洲人工智能会议(ECAI 2004)(2004),IOS出版社),273-277
[10] M.Barbeau,F.Kabanza,R.St-Denis,使用实时目标合成计划控制器,见:Proc。第十四届国际人工智能联合会议(IJCAI-95),1995年,第791-800页;M.Barbeau,F.Kabanza,R.St-Denis,使用实时目标合成计划控制器,见:Proc。第十四届国际人工智能联合会议(IJCAI-95),1995年,第791-800页
[11] 巴林顿,D。;Immerman,N。;Straubing,H.,《论(N C^1)内的一致性》,《计算机与系统科学杂志》,41,274-306(1990)·Zbl 0719.68023号
[12] M.Ben-Ari,Z.Manna,A.Puneli,分支时间的时间逻辑,in:Proc。第八届程序设计语言原理研讨会,1981年,第164-176页;M.Ben-Ari,Z.Manna,A.Puneli,分支时间的时间逻辑,in:Proc。第八届程序设计语言原理研讨会,1981年,第164-176页
[13] P.Bertoli,A.Cimatti,M.Pistore,部分可观测性下的强循环规划,收录于:ECAI,2006年,第580-584页;P.Bertoli,A.Cimatti,M.Pistore,部分可观测性下的强循环规划,收录于:ECAI,2006年,第580-584页
[14] P.Bertoli,M.Pistore,《具有扩展目标和部分可观察性的规划》,载于:S.Zilberstein,J.Koehler,S.Koenig(编辑),ICAPS,2004年,第270-278页;P.Bertoli,M.Pistore,《具有扩展目标和部分可观察性的规划》,载于:S.Zilberstein,J.Koehler,S.Koenig(编辑),ICAPS,2004年,第270-278页
[15] Brooks,R.,移动机器人的鲁棒分层控制系统,IEEE机器人与自动化杂志,2,1,14-23(1986)
[16] Bylander,T.,命题条带规划的计算复杂性,人工智能,69,165-204(1994)·Zbl 0821.68065号
[17] S.Ceri,J.Widom,《导出约束维护的生产规则》,收录于:P.M.G.Apers,G.Wiederhold(编辑),Proc。第十五届超大数据库国际会议(VLDB-90),1990年,第566-577页;S.Ceri,J.Widom,《导出约束维护的生产规则》,收录于:P.M.G.Apers,G.Wiederhold(编辑),Proc。第十五届超大数据库国际会议(VLDB-90),1990年,第566-577页
[18] Cimatti,A。;皮斯托尔,M。;Roveri,M。;Traverso,P.,《通过符号模型检查进行弱、强和强循环规划》,《人工智能》,147,1-2,35-84(2003)·Zbl 1082.68800号
[19] 克拉克,E。;Emerson,E.,《使用分支时间时序逻辑设计和合成同步骨架》,(程序逻辑研讨会,程序逻辑研讨会会议,LNCS,第131卷(1981),Springer),52-71·Zbl 0546.68014号
[20] 克拉克,E。;艾默生。;Sistla,A.,使用时态逻辑规范自动验证有限状态并发系统,ACM编程语言和系统事务,8,2,244-263(1986)·兹比尔0591.68027
[21] 丹尼尔,M。;特拉弗索,P。;Vardi,M.,《重新审视强循环规划》,(第五届欧洲规划会议(ECP’99)公报)。程序。第五届欧洲规划会议(ECP’99),LNCS/LNAI,第1809卷(1999),斯普林格出版社,35-48
[22] Dantsin,E。;艾特,T。;Gottlob,G。;Voronkov,A.,逻辑编程的复杂性和表达能力,ACM计算调查,33,3,374-425(2001)
[23] G.De Giacomo,R.Reiter,M.Soutchanski,高级机器人程序的执行监控,在:Proc。第六届知识表示和推理原则会议(KR-98),1998年,第453-465页;G.De Giacomo,R.Reiter,M.Soutchanski,高级机器人程序的执行监控,在:Proc。第六次知识表示和推理原则会议(KR-98),1998年,第453-465页
[24] Dijkstra,E.W.,《分布式控制下的自稳定系统》,CACM,17,11,644-843(1974)·Zbl 0305.68048号
[25] 道林,W。;Gallier,J.H.,用于测试命题Horn理论可满足性的线性时间算法,逻辑编程杂志,3267-284(1984)·Zbl 0593.68062号
[26] M.Drummond,《态势控制规则》,摘自:Proc。第一届知识表示和推理原则国际会议(KR-89),1989年,第103-113页;M.Drummond,《态势控制规则》,摘自:Proc。第一届知识表示和推理原则国际会议(KR-89),1989年,第103-113页·Zbl 0709.68049号
[27] 邓恩,P。;Laurence,M。;Wooldridge,M.,代理设计问题的复杂性结果,《数学、计算与远程信息年鉴》,1,1,19-36(2003)
[28] 邓恩,P。;Wooldridge,M.,乐观和析取代理设计问题,(Castelfranchi,C.;Lespérance,Y.,第七届智能代理国际研讨会(ATAL VII)。程序。第七届智能代理国际研讨会(ATAL VII),LNCS,卷1986(2001),Springer,1-14·Zbl 1056.68575号
[29] 艾特,T。;Faber,W。;塞拉利昂,北卡罗来纳州。;Pfeifer,G.,使用DLV系统解决声明性问题,(Minker,J.,基于逻辑的人工智能(2000),Kluwer),79-103·Zbl 0979.68091号
[30] Emerson,E.,《时间和模态逻辑》(van,J.,《理论计算机科学手册》,B卷(1990),Elsevier),第16章·Zbl 0900.03030号
[31] 埃罗尔,K。;Subrahmanian,V。;Nau,D.,域相关规划的复杂性、可判定性和不可判定性结果,人工智能,76,75-88(1995)·Zbl 1013.68548号
[32] Fikes,R.E。;Nilsson,N.J.,Strips:应用定理证明解决问题的新方法,《人工智能》,第2期,第3-4期,第189-208页(1971年)·Zbl 0234.68036号
[33] Gelfond,M。;Lifschitz,V.,逻辑程序和析取数据库中的经典否定,新一代计算,9365-385(1991)·Zbl 0735.68012号
[34] Gelfond,M。;Lifschitz,V.,《表示扩展逻辑程序中的行为》,(《逻辑编程联合国际会议和研讨会论文集》(1992年),麻省理工学院出版社),559-573
[35] 加拉布,M。;Nau,D。;Traverso,P.,《自动规划理论与实践》(2004),Morgan Kaufmann·Zbl 1074.68613号
[36] Ginsberg,M.L.,《通用规划:一个(几乎)通用的坏主意》,AI杂志,10,4,40-44(1989)
[37] 哈丁,A。;Ryan,M。;Schobbens,P.-Y.,《ltl游戏中策略合成的新算法》,(Halbwachs,N.;Zuck,L.D.,TACAS。TACAS,LNCS,第3440卷(2005),Springer),477-492·Zbl 1087.68020号
[38] Immerman,N.,《描述性复杂性》(1999),施普林格出版社·Zbl 0918.68031号
[39] R.M.Jensen、M.M.Veloso和M.H.Bowling,基于OBDD的乐观和强大的循环对抗计划,见:Proc。第六届欧洲规划会议(ECP-01),2001年;R.M.Jensen、M.M.Veloso和M.H.Bowling,基于OBDD的乐观和强大的循环对抗计划,见:Proc。第六届欧洲规划会议(ECP-01),2001年
[40] R.M.Jensen,M.M.Veloso,R.E.Bryant,容错规划:符号非确定性规划中的概率不确定性模型,收录于:S.Zilberstein,J.Koehler,S.Koenig(编辑),Proc。第十四届自动规划和调度国际会议(ICAPS 2004),2004年,第335-344页;R.M.Jensen,M.M.Veloso,R.E.Bryant,容错规划:符号非确定性规划中的概率不确定性模型,收录于:S.Zilberstein,J.Koehler,S.Koenig(编辑),Proc。第十四届自动规划和调度国际会议(ICAPS 2004),2004年,第335-344页
[41] 卡班扎,F。;巴博,M。;St-Denis,R.,反应剂的规划控制规则,人工智能,95,1,67-113(1997)·Zbl 0894.68138号
[42] L.P.Kaelbling,S.J.Rosenschein,《嵌入式代理的行动和规划》,摘自:Maes[47];L.P.Kaelbling,S.J.Rosenschein,嵌入式代理中的行动和规划,摘自:Maes[47]
[43] 库拉托夫斯基,C.,《拓扑I》(1966),学术出版社:纽约学术出版社·Zbl 0158.40901号
[44] U.D.Lago,M.Pistore,P.Traverso,《用语言进行扩展目标的规划》,载于:AAAI/IAAI,2002年,第447-454页;U.D.Lago,M.Pistore,P.Traverso,《用语言进行扩展目标的规划》,载于:AAAI/IAAI,2002年,第447-454页
[45] 塞拉利昂,北卡罗来纳州。;Pfeifer,G。;Faber,W。;艾特,T。;Gottlob,G。;佩里,S。;Scarcello,F.,《用于知识表示和推理的DLV系统》,ACM计算逻辑学报,7,3,499-562(2006)·兹比尔1367.68308
[46] M.L.Littman,《概率命题规划:表征与复杂性》,摘自:Proc。第十四届全国人工智能大会和第九届人工智能创新应用大会(AAAI/IAAI 1997),1997年,第748-754页;M.L.Littman,《概率命题规划:表征与复杂性》,摘自:Proc。第十四届全国人工智能大会和第九届人工智能创新应用大会(AAAI/IAAI 1997),1997年,第748-754页
[47] (Maes,P.,《设计自主代理:从生物学到工程及其后的理论和实践》(1990),麻省理工学院出版社)
[48] Manna,Z。;Pnueli,A.,《反应和并发系统规范的时间逻辑》(1992),Springer
[49] Manna,Z。;Wolper,P.,《从时序逻辑规范合成通信过程》,《ACM编程语言和系统事务》,6,1,68-93(1984)·Zbl 0522.68030号
[50] Minoux,M.,LTUR:Horn公式和计算机实现的简化线性时间单位分辨率,《信息处理快报》,29,1-12(1988)·Zbl 0658.68110号
[51] 中村,M。;Baral,C.,《触发器的不变性、维护和其他声明性目标——主动数据库的正式特征》(Lloyd,J.,Proc.First International Conference on Computational Logic(CL 2000))。程序。第一届国际计算逻辑会议(CL 2000),LNAI,第1861卷(2000),施普林格,1210-1224·Zbl 0983.68742号
[52] 中村,M。;Baral,C。;Bjreland,M.,《可维护性:一种类似于弱稳定性的高层控制概念》,(第17届全国人工智能会议和第十二届人工智能创新应用会议论文集(AAAI/IAAI 2000)(2000),AAAI出版社),62-67
[53] 尼美拉,I。;西蒙斯,P。;Syrjänen,T.,Smodels:答案集编程系统,(Baral,C.;Truszczynski,M.,Proc.第八届非单调推理国际研讨会(NMR’2000)(2000)),在线阅读
[54] Niyogi,R。;Sarkar,S.,《目标的逻辑规范》,(Ghosh,R.K.;Misra,D.,第三届国际信息技术会议(CIT 2001)(2000),塔塔·麦格劳-希尔),77-82
[55] Ortiz,C.,《推理因果关系和理性行为的常识性语言》,《人工智能》,第111、2、73-130页(1999年)·Zbl 0996.68190号
[56] Ozveren,O。;A.威尔斯基。;Antsaklis,P.,离散事件动态系统的稳定性和可稳定性,美国计算机学会期刊,38,3,730-752(1991)·兹比尔0812.93002
[57] Papadimitriou,C.H.,计算复杂性(1994),Addison Wesley·兹伯利0557.68033
[58] Passino,K。;Burgess,K.,《离散事件系统的稳定性分析》(1998),John Wiley and Sons
[59] N.Piterman,A.Pnueli,Y.Sa'ar,反应(1)设计合成,收录于:VMCAI,2006年,第364-380页;N.Piterman,A.Pnueli,Y.Sa'ar,反应(1)设计的合成,收录于:VMCAI,2006年,第364-380页·Zbl 1176.68126号
[60] A.Pnueli,R.Rosner,《关于反应性模块的合成》,摘自:Proc。第16届美国计算机学会编程语言原理年会(POPL 1989),1989年,第179-190页;A.Pnueli,R.Rosner,《关于反应性模块的合成》,摘自:Proc。第16届美国计算机学会编程语言原理年会(POPL 1989),1989年,第179-190页·兹伯利0686.68015
[61] 拉马奇,P。;Wonham,W.,离散事件系统的模块反馈逻辑,SIAM控制与优化杂志,25,5,1202-1217(1987)·Zbl 0694.93037号
[62] 拉马奇,P。;Wonham,W.,一类离散事件过程的监督控制,SIAM控制与优化杂志,25,1,206-230(1987)·Zbl 0618.93033号
[63] Reiter,R.,《行动中的知识:描述和实现动态系统的逻辑基础》(2001),麻省理工学院出版社·Zbl 1018.03022号
[64] J.Rintanen,《具有部分可观测性的规划复杂性》,载于:S.Zilberstein,J.Koehler,S.Koenig(编辑),Proc。第十四届自动规划和调度国际会议(ICAPS 2004),2004年,第345-354页;J.Rintanen,《具有部分可观测性的规划复杂性》,载于:S.Zilberstein,J.Koehler,S.Koenig(编辑),Proc。第十四届自动规划和调度国际会议(ICAPS 2004),2004年,第345-354页
[65] 西蒙斯,P。;尼美拉,I。;Soininen,T.,《扩展和实现稳定模型语义》,《人工智能》,138181-234(2002)·兹比尔0995.68021
[66] Sontag,E.,《稳定性和稳定性:不连续性和扰动的影响》,(Clarke,F.;Stern,R.,《北约高级研究所学报》(1998),Kluwer),551-598·Zbl 0937.93034号
[67] 焊缝,D。;Etzioni,O.,《机器人第一定律》(The first law of robots(a call to arms)),(第十二届全国人工智能会议论文集(AAAI-94)(1994),AAAI出版社),1042-1047
[68] (Widom,J.;Ceri,S.,《主动数据库系统:高级数据库处理的触发器和规则》(1996),Morgan Kaufmann)
[69] Wooldridge,M.,代理设计问题的计算复杂性,(第四届多代理系统国际会议(ICMAS 2000)(2000),IEEE出版社),341-348
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。