×

具有概率的动态更新。 (英语) Zbl 1183.03015号

摘要:当前的动态认知逻辑对多智能体场景中不同类型的信息变化进行建模。我们将这些逻辑推广到概率设置中,得到了具有三个自然时隙的多智能体更新演算:状态的先验概率、相关过程发生的发生概率和事件的观察概率。为了匹配这种更新机制,我们提出了一种具有概率特征的信息变化的完整动态逻辑。完整性证明遵循的组合方法也适用于更大类别的动态概率逻辑。最后,我们讨论了如何为不同的更新策略或学习方法参数化我们的基本更新规则。

MSC公司:

03B42号 知识和信念的逻辑(包括信念变化)
03B48号 概率和归纳逻辑
68T27型 人工智能中的逻辑
68T42型 Agent技术与人工智能
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Aucher,G.,“我们的信念如何解释行动”,第四届中欧和东欧多智能体系统国际研讨会(CEEMAS05),2005年。出现在Springer-Verlag的人工智能课堂讲稿中。
[2] Bacchus F.(1990)用概率知识表示和推理,概率的逻辑方法。麻省理工学院出版社,马萨诸塞州剑桥·Zbl 0721.68059号
[3] Baltag A.(2002)《可疑玩家的逻辑:游戏中的认知行为和信念更新》。经济研究公报54(1):1–45·数字对象标识代码:10.1111/1467-8586.00138
[4] Baltag,A.、L.S.Moss和S.Solecki,《公共知识、公共公告的逻辑和私人怀疑》,载于I.Gilboa(编辑),《理性和知识理论方面第七届会议论文集》(TARK 98),1998年,第43-56页·Zbl 1386.03019号
[5] Baltag A.、Smets S.(2008)“概率动态信念修正”。合成165(2):179-202·Zbl 1169.03015号 ·doi:10.1007/s11229-008-9369-8
[6] CarnapR.(1952)《归纳方法的连续体》。芝加哥大学出版社,芝加哥·Zbl 0047.37210号
[7] Fagin R.,Halpern J.Y.(1993)《关于知识和概率的推理》。美国医学会杂志41(2):340–367·兹伯利0806.68098 ·数字对象标识代码:10.1145/174652.174658
[8] Fitelson,B.,《贝叶斯确认理论研究》,博士论文,威斯康星大学哲学系,麦迪逊,2001年。
[9] Gärdenfors,P.和H.Rott,“信念修正,人工智能和逻辑编程逻辑手册(第4卷):认知和时间推理,牛津大学出版社,英国牛津,1995年,第35-132页。
[10] Gerbrandy,J.D.,《克里普克星球上的双模拟》,阿姆斯特丹大学博士论文,1998年。ILLC论文集DS-1999-01。
[11] Gierasimczuk,N.,“衔接学习理论和动态认知逻辑”,综合,2009年。出现在T.奥戈特斯、J.van Benthem和E.Pacuit(编辑)的《知识、理性和行动》特刊中,内容是“逻辑和智能交互”·Zbl 1183.03012号
[12] Grünwald P.,Halpern J.Y.(2003)“更新概率”。人工智能研究杂志19:243–278·Zbl 1076.68579号
[13] Halpern,J.Y.,《关于不确定性的推理》,麻省理工学院出版社,2003年·Zbl 1090.68105号
[14] Halpern J.Y.,Pucella R.(2006)《证据推理的逻辑》。人工智能研究杂志26:1–34·doi:10.1007/s10462-007-9045-2
[15] Halpern J.Y.,Tuttle M.R.(1993)“知识、概率和对手”。ACM杂志40(4):917–962·Zbl 0783.68120号 ·doi:10.1145/153724.153770
[16] Hommersom A.、Meyer J.-J.和de Vink E.(2005)“更新安全协议的语义”。合成142(2):229–267·Zbl 1072.03019号 ·doi:10.1007/s11229-004-2247-0
[17] Kelly K.(1996)《可靠调查的逻辑》。牛津大学出版社·Zbl 0910.03023号
[18] Kooi B.(2003)“概率动态认知逻辑”。逻辑、语言与信息杂志12(4):381-408·Zbl 1031.03044号 ·doi:10.1023/A:1025050800836
[19] Liu,F.,《向更好的方向改变:偏好动力学和代理多样性》,阿姆斯特丹大学博士论文,2008年。ILLC论文系列DS-2008-02。
[20] Plaza,J.A.,“公共通信的逻辑”,载于M.L.Emrich、M.S.Pfeifer、M.Hadzikadic和Z.W.Ras(编辑),《第四届智能系统方法学国际研讨会论文集》,1989年,第201–216页。
[21] Romeijn,J.W.,“荷兰书籍与认识论事件”,2005年,在阿姆斯特丹的概率与认识论交流研讨会上发表的演讲。
[22] Sack,J.,“扩展概率动态认知逻辑”,综合,2009年。出现在T.奥戈特斯、J.van Benthem和E.Pacuit(编辑)的《知识、理性和行动》特刊中,内容是“逻辑和智能交互”·兹比尔1183.03013
[23] Shafer,G.,《证据的数学理论》,普林斯顿大学出版社,1976年。
[24] Shafer G.(1982)“信念函数和参数模型”。英国皇家统计学会杂志44(3):322–352·Zbl 0499.62007号
[25] van Benthem J.(2003)“条件概率满足更新逻辑”。逻辑、语言与信息杂志12(4):409–421·Zbl 1031.03045号 ·doi:10.1023/A:1025002917675
[26] van Benthem,J.、J.Gerbrandy、T.Hoshi和E.Pacuit,“融合互动框架”,《哲学逻辑杂志》,2009年。出现·Zbl 1185.03019号
[27] van Benthem,J.、J.Gerbrandy和B.Kooi,《概率动态更新》,ILLC预出版PP-2006-21,http://www.illc.uva.nl/Publications/ResearchReports/PP-2006-21.text.pdf , 2006.
[28] van Benthem,J.、J.Gerbrandy和E.Pacuit,“交互的合并框架:DEL和ETL”,载于Dov Samet(编辑),《TARK会议录》,2007年11月,第72–82页。
[29] van Benthem J.、van Eijck J.、Kooi B.(2006)《沟通与变革的逻辑》。信息与计算204(11):1620–1662·2012年3月11日 ·doi:10.1016/j.ic.2006.04.006
[30] van der Hoek,W.,《关于知识和数量的推理模式》,阿姆斯特丹Vrije大学,1992年·Zbl 0797.03013号
[31] van Ditmarsch H.、van der Hoek W.、Kooi B.(2007)《动态认识逻辑》。多德雷赫特·施普林格·Zbl 1156.03320号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。