×

在不确定性下建模多个代理的独立选择逻辑。 (英语) Zbl 0902.03017号

摘要:受博弈论表示、贝叶斯网络、影响图、结构化马尔可夫决策过程模型、逻辑编程和动态系统工作的启发,独立选择逻辑(ICL)是一个允许独立选择的语义框架(由各种代理(包括自然)做出)和一个逻辑程序,它给出了选择的结果。这种表示可以用作在一个世界中行动、观察该世界并具有记忆的代理的规范,也可以用作具有不确定性的动态环境的建模工具。规则规定了行为的后果、可以感知的内容和结果的效用。本文提出了ICL的可能世界语义,并说明了如何在ICL中嵌入影响图、结构化马尔可夫决策过程以及策略(正常)形式和扩展(游戏树)形式的游戏。有人认为,ICL为不确定性下的多智能体决策提供了一种自然而简洁的表示,允许表示结构化概率表、网络的动态构建(通过使用逻辑变量)以及在逻辑表示中处理不确定性和决策的方法。

MSC公司:

03B80号 逻辑的其他应用
91A05型 2人游戏
91年35日 博弈决策理论
68T27型 人工智能中的逻辑
68N17号 逻辑编程

软件:

高尔夫
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Albus,J.S.,(《大脑、行为和机器人学》(1981),BYTE出版物:BYTE出版社,新罕布什尔州彼得堡)
[2] Apt,K.R。;Bezem,M.,非循环程序,新一代计算。,9, 335-363 (1991) ·Zbl 0744.68034号
[3] Bacchus,F.,(《用不确定知识表示和推理》(1990),麻省理工学院出版社:麻省理学院出版社,马萨诸塞州剑桥)
[5] 布特利耶,C。;迪尔登,R。;Goldszmidt,M.,《政策构建中的结构开发》(Proceedings IJCAI-95)。会议记录IJCAI-95,魁北克省蒙特利尔市(1995)),1104-1111
[6] 布特利耶,C。;Friedman,N.,《非确定性行动与框架问题》,(1995年AAAI春季研讨会工作笔记——扩展行动理论:形式理论与实际应用(1995))
[7] 布特利耶,C。;弗里德曼,N。;Goldszmidt,M。;Koller,D.,《贝叶斯网络中的上下文特定独立性》,(Horvitz,E.;Jensen,F.,《第12届人工智能不确定性会议论文集》(UAI-96)。人工智能不确定性第12届会议论文集(UAI-96),俄勒冈州波特兰(1996),115-123
[8] 布特利耶,C。;Poole,D.,《使用紧凑表示法计算部分可观察决策过程的最优策略》(Proceedings AAAI-96)。美国俄勒冈州波特兰市AAAI-96会议记录(1996),1168-1174
[9] Breese,J.S.,信念和决策网络的构建,计算机。智力。,8, 624-647 (1992)
[10] Brooks,R.A.,移动机器人的鲁棒分层控制系统,IEEE J.机器人自动化,214-23(1986)
[11] Clark,K.L.,《否定即失败》(Gallaire,H.;Minker,J.,《逻辑与数据库》(1978),阻燃出版社:纽约阻燃出版社),293-322
[12] 迪安·T·L。;金泽,K.,关于持久性和因果关系的推理模型,Comput。智力。,5, 142-150 (1989)
[13] 迪安·T·L。;Wellman,M.P.(规划与控制(1991),Morgan Kaufmann:Morgan Koufmann San Mateo,CA)
[14] 德雷珀,D。;汉克斯,S。;Weld,D.S.,《信息收集和应急执行的概率规划》,(第二届人工智能规划系统国际会议论文集。第二届国际人工智能规划体系会议论文集,加利福尼亚州门洛帕克(1994)),31-36
[15] 费金,R.Y。;Halpern,J.Y。;摩西,Y。;Vardi,M.Y.,(《知识推理》(Reasoning about Knowledge)(1994),麻省理工学院出版社:麻省理学院出版社剑桥)
[16] 《福布斯》,J。;黄,T。;金泽,K。;Russell,S.,《蝙蝠车:朝向贝叶斯自动出租车》(Proceedings IJCAI-95)。《IJCAI-95会议记录》,魁北克省蒙特利尔(1995),1878-1885
[17] 福登堡,D。;Tirole,J.,(《博弈论》(1992),麻省理工学院出版社:麻省理学院出版社,马萨诸塞州剑桥)
[18] Gelfond,M。;Lifschitz,V.,《逻辑编程的稳定模型语义》,(Kowalski,R.;Bowen,K.,《第五届逻辑编程研讨会论文集》,马萨诸塞州剑桥(1988),1070-1080
[19] Haddawy,P.,《在不确定性下表示计划:时间、机会和行动的逻辑》(人工智能讲义,第770卷(1994),施普林格:施普林格-柏林)·Zbl 0875.68777号
[20] Halpern,J.Y.,《概率的一阶逻辑分析》,人工智能,46311-350(1990)·Zbl 0723.03007号
[21] Halpern,J.Y。;Turtle,M.R.,《知识、概率和对手》,J.ACM,40,917-962(1993)·Zbl 0783.68120号
[22] Howard,R.A.,《从影响到相关性再到知识》(Oliver,R.M.;Smith,J.Q.,《影响图、信念网和决策分析》(1990),威利:威利纽约),3-23,第1章
[23] 霍华德·R·A。;Matheson,J.E.,《影响图》(Howard,R.A.;Matheson
[24] Kanazawa,K.,《概率推理的逻辑和时间网》(Proceedings AAAI-91)。AAAI-91会议记录,加利福尼亚州阿纳海姆(1991),360-365
[25] 科勒,D。;Megiddo,N.,《二人零和博弈的广泛形式复杂性》,《博弈与经济行为》,4528-552(1992)·兹标0758.90084
[26] 科勒,D。;Pfeffer,A.J.,《生成和解决不完美信息游戏》(Proceedings IJCAI-95。《国际JCAI-95会议记录》,魁北克省蒙特利尔(1995),1185-1192
[27] Kowalski,R.,《问题解决的逻辑》(《人工智能系列》(1979),北卡罗来纳州:北卡罗莱纳州纽约州)·Zbl 0426.68002号
[28] Levesque,H.J。;Reiter,R。;Lespérance,Y。;林,F。;Scherl,R.B.,GOLOG:一种用于动态域的逻辑编程语言,《关于动作和变化的推理》。《关于行动和变化的推理》,J.Logic Programming(1996),专刊
[29] Luenberger,D.G.,(《动力系统导论:理论、模型和应用》(1979),威利出版社:威利纽约)·Zbl 0458.93001号
[30] McCarthy,J.,《限定在形式化常识中的应用》,《人工智能》,第28期,第89-116页(1986年)
[31] 麦卡锡,J。;Hayes,P.J.,《从人工智能的角度来看的一些哲学问题》,(Meltzer,B.;Michie,D.,《机器智能》,第4卷(1969年),爱丁堡大学出版社:爱丁堡学院出版社),463-502·Zbl 0226.68044号
[32] Myerson,R.B.,(博弈论:冲突分析(1991),哈佛大学出版社:哈佛大学出版社,马萨诸塞州剑桥)·兹比尔0729.90092
[33] 新泽西州尼尔森,《逻辑与人工智能》,《人工智能》第47期,第31-56页(1991年)
[34] (Oliver,R.M.;Smith,J.Q.,《概率和数理统计系列》,《概率与数理统计、影响图、信念网和决策分析系列》(1990),威利出版社:威利·奇切斯特)
[35] Pearl,J.,(智能系统中的概率推理:合理推理网络(1988),Morgan Kaufmann:Morgan Koufmann San Mateo,CA)
[36] Poole,D.,概率Horn诱拐和贝叶斯网络,人工智能,64,81-129(1993)·Zbl 0792.68176号
[38] Poole,D.,《在独立选择逻辑中开发决策规则结构》(Besnard,P.;Hanks,S.,《人工智能不确定性第11届会议论文集》(UAI-95)。《第11届人工智能不确定性会议论文集》(UAI-95),魁北克省蒙特利尔(1995),454-463
[39] Poole,D.,《机器人控制逻辑编程》(Proceedings IJCAI-95)。《国际JCAI-95会议记录》,魁北克省蒙特利尔(1995),150-157
[40] Poole,D.,《决策理论规划框架I:结合情境演算、条件规划、概率和效用》(Horvitz,E.;Jensen,F.,《人工智能不确定性第12届会议论文集》(UAI-96)。人工智能不确定性第12届会议论文集(UAI-96),俄勒冈州波特兰(1996),436-445
[42] 普尔,D。;Mackworth,A.K。;Goebel,R.G.,(计算智能:逻辑方法(1997),牛津大学出版社:牛津大学出版社,纽约)
[43] Przymusinski,T.C.,逻辑程序的三值非单调形式主义和语义,人工智能,49,309-343(1991)·Zbl 0741.03014号
[44] Puterman,M.L.,《马尔可夫决策过程》(Heyman,D.P.;Sobel,M.J.,《运筹学和管理科学手册》,第2卷(1990年),北荷兰人:北荷兰阿姆斯特丹),331-434,第8章
[45] Reiter,R.,《情境演算中的框架问题:目标回归的简单解决方案(有时)和完整结果》,(Lifschitz,V.,《人工智能和计算数学理论:约翰·麦卡锡荣誉论文》(1991),学术出版社:加州圣地亚哥学术出版社),359-380·Zbl 0755.68124号
[46] Rivest,R.L.,学习决策列表,机器学习,229-246(1987)
[47] Rosenschein,S.J。;Kaelbling,L.P.,《表征与控制的情境视图》,《人工智能》,第73期,第149-173页(1995年)
[48] 罗素·S·J。;Subramanian,D.,Provably bounded-optimal agents,J.Artif。智力。研究,2575-609(1995)·Zbl 0900.68091号
[49] L.J.萨维奇,统计学基础; L.J.萨维奇,统计学基础
[50] 舒伯特,L.K.,《情境演算中框架问题的单调解:具有完全指定动作的世界的一种有效方法》,(Kyburg,H.E.;Loui,R.P.;Carlson,G.N.,《知识表示和可击败推理》(1990),克鲁沃学术出版社:克鲁沃学院出版社,马萨诸塞州波士顿),23-67
[51] Shoham,Y.,面向代理编程,人工智能,60,51-92(1993)
[52] 史密斯,J.E。;霍尔兹曼,S。;Matheson,J.E.,《在影响图中构建条件关系》,Oper。研究,41,280-297(1993)
[53] 冯·诺依曼,J。;Morgenstern,O.(游戏与经济行为理论(1953),普林斯顿大学出版社:普林斯顿大学出版,新泽西州普林斯顿)·Zbl 0053.09303号
[54] 张,L。;齐,R。;Poole,D.,《决策网络的计算理论》,《国际近似推理》,第1183-158页(1994年)·兹比尔0816.90005
[55] Zhang,Y.,机器人系统和行为的设计和分析基础,(不列颠哥伦比亚大学计算机科学系博士论文(1994):不列颠s哥伦比亚大学温哥华分校计算机科学系)
[56] Zhang,Y。;麦克沃思,A.K.,机器人会做正确的事吗?,(《加拿大智能计算研究学会第十届两年期会议论文集》,加拿大智能计算学会第十次两年期会议,阿尔塔州班夫(1994)),255-262
[57] Zhang,Y。;Mackworth,A.K.,《约束网:混合动态系统的语义模型》,Theoret。计算。科学。,138, 211-239 (1995) ·Zbl 0874.68205号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。