×

风险意识分析,用于解释概率实现和维护承诺。 (英语) Zbl 07698051号

概要:概率承诺为多智能体协调提供了一个计算框架,其中一个自主智能体(承诺提供者)承诺未来的行动过程,以接收方希望的方式概率地影响另一个智能体的本地状态(承诺接收者)。传统上,概率承诺是抽象指定的,以便在运行时为提供者提供关于如何实现它的自由度。不幸的是,正如我们在本文中分析的那样,这种抽象会给接收者带来性能次优的风险。对于提供者(实现)承诺实现接收者喜欢但最初不支持的条件,我们证明接收者可以做出限制其次优风险的建模选择。然而,令人惊讶的是,对于提供者(维护)承诺维护初始值已经是接收者偏好的条件,我们证明不可能有这种次优风险边界。我们对这两种类型的承诺进行了实证研究,以衡量它们在不同条件下产生的次优度,并根据我们的理论和实证结果表明,在指定概率维护承诺时添加选择性细节是有益的。

MSC公司:

68T42型 Agent技术与人工智能

软件:

普罗莫卡
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Singh,M.P.,《辩证承诺和实践承诺的语义考虑》(第二十届美国人工智能学会人工智能会议论文集(2008)),176-181
[2] Jennings,N.R.,承诺和约定:多智能体系统中协调的基础,Knowl。工程版次,8,3,223-250(1993)
[3] Xing,J。;Singh,M.P.,基于承诺的代理交互形式化,(2001年ACM应用计算研讨会论文集(2001)),115-120
[4] Winikoff,M.,《使用分布式承诺机实现灵活而健壮的代理交互》,多代理网格系统。,2, 4, 365-381 (2006) ·Zbl 1117.68010号
[5] Durfee,E.H。;Singh,S.,《关于诚信履行承诺》(Osman,N.;Sierra,C.,《自治代理和多代理系统:2016年AAMAS研讨会最佳论文》(2016),Springer),1-13
[6] Xuan,P。;Lesser,V.R.,《将不确定性纳入代理承诺》(代理理论、架构和语言国际研讨会(1999),Springer),57-70·兹伯利0970.68642
[7] Maheswaran,R。;Szekely,P。;贝克尔,M。;菲茨帕特里克,S。;加蒂,G。;Jin,J。;Neches,R。;北卡罗来纳州努里。;罗杰斯,C。;Sanchez,R.,《复杂环境中协调的可预测性和关键性度量》,(第七届自主代理和多代理系统国际联合会议论文集(2008)),647-654
[8] Witwicki,S.J。;Durfee,E.H.,基于承诺的服务协调,Int.J.Agent-Oriented Softw。工程,359-87(2009)
[9] 张,Q。;Durfee,E.H。;辛格,S。;陈,A。;Witwicki,S.J.,《报酬不确定性下顺序决策的承诺语义》,(第二十五届国际人工智能联合会议(2016)论文集),3315-3323
[10] 克莱门特,B.J。;Schaffer,S.R.,利用C-TÆMS模型进行政策搜索,(ICAPS多智能体规划研讨会(2008))
[11] Goldman,R.P。;Musliner,D.J。;Durfee,E.H。;Boddy,M.S.,《协调高度应急计划:将分布式MDP偏向于合作行为》(ICAPS多智能体规划研讨会(2008))
[12] Hiatt,L.M.,概率计划管理(2009),卡内基梅隆大学,博士论文
[13] Witwicki,S.J。;Durfee,E.H.,承诺驱动的分布式联合政策搜索,(第六届自治代理和多代理系统国际联合会议记录(2007年)),480-487
[14] 张,Q。;Durfee,E.H。;Singh,S.,高效查询合作概率承诺,(第三十五届AAAI人工智能会议论文集(2021)),11378-11386
[15] 张,Q。;辛格,S。;Durfee,E.,在承诺约束的顺序决策中最大限度地减少后悔,(第二十七届国际自动规划与调度会议(2017)论文集),348-356
[16] 张,Q。;Durfee,E.H。;Singh,S.,模型不确定性下实现可信承诺的语义和算法,Auton。代理多代理系统。,34, 1, 19 (2020)
[17] Singh,M.P.,《多智能体系统中的承诺:一些历史,一些困惑,一些争议,一些前景》(The Goals of Cognition.Essays in Honor of Cristiano Castelfranchi,The Goals-The Goals.The Goal of Cognation.Essaws in Honow of Cristano Castelfranchi,London(2012)),第601-626页
[18] Vokrínek,J。;Komenda,A。;Pechoucek,M.,《非确定性环境中多智能体执行的去承诺:实验方法》,(第八届自主智能体和多智能体系统国际会议论文集(2009)),977-984
[19] 桑德霍姆,T。;Lesser,V.R.,《平准承诺合同和战略违约》,《奥运经济》。行为。,35, 212-270 (2001) ·Zbl 1050.91034号
[20] 北德赛。;北卡罗来纳州纳伦德拉。;Singh,M.P.,《通过承诺检查商业合同的正确性》,(第七届自治代理和多代理系统国际联合会议记录(2008年)),787-794
[21] Günay,A。;刘,Y。;Zhang,J.,Promoca:承诺协议中代理的概率建模和分析,J.人工制品。智力。决议,57,465-508(2016)·Zbl 1401.68337号
[22] 佩雷拉,R.F。;北奥伦。;Meneguzzi,F.,《通过监测计划执行期间的次优步骤来检测承诺放弃》,(第十六届自治代理和多代理系统会议记录(2017年)),1685-1687
[23] 特朗,P。;梅内古齐,F.R。;Singh,M.,《关于目标和承诺的层次规划》,(第十二届自主代理和多代理系统国际会议论文集(2013年))
[24] King,T.C。;Günay,A。;Chopra,A.K。;辛格,M.P.,托斯卡:信息协议的操作承诺,arXiv预印本
[25] 班纳扎德,H。;Leon-Garcia,A.,面向服务系统的分布式概率承诺控制算法,IEEE Trans。Netw公司。服务。管理。,7, 4, 204-217 (2010)
[26] 卡明卡,G.A。;亚基尔,A。;Erusalimchik,D。;Cohen-Nov,N.,《迈向协作任务和团队维护》,(第六届自治代理和多代理系统国际联合会议记录(2007)),1-8
[27] Newell,A.,《统一认知理论》(1994),哈佛大学出版社
[28] 卡明卡,G.A。;Frenkel,I.,《在基于行为的机器人中实现灵活的团队合作》,(第四届自主代理和多代理系统国际联合会议论文集(2005)),1355-1356
[29] 巴拉尔,C。;艾特,T。;比亚雷兰德,M。;Nakamura,M.,《动态环境中代理人的维护目标:制定和政策构建》,Artif。整数。,172, 12-13, 1429-1469 (2008) ·Zbl 1183.68630号
[30] 巴克斯,F。;Kabanza,F.,《临时扩展目标的规划》,《数学年鉴》。Artif公司。整数。,22, 1, 5-27 (1998) ·Zbl 1034.68549号
[31] Özveren,C.M.(奥地利)。;Willsky,A.S。;Antsaklis,P.J.,离散事件动态系统的稳定性和稳定性,J.ACM,38,3,729-751(1991)
[32] 达夫,S。;桑加拉杰,J。;Harland,J.,智能代理中的维护目标,Comput。整数。,30, 1, 71-114 (2014) ·Zbl 1328.68234号
[33] Oliehoek,F.A。;Amato,C.,《去中心化POMDP简介》(2016),施普林格出版社·Zbl 1355.68005号
[34] Witwicki,S.J。;Durfee,E.H.,弱耦合Dec-POMDP的基于影响的政策抽象,(第二十届国际自动规划与调度会议论文集(2010)),185-192
[35] 贝克尔,R。;Zilberstein,S。;Lesser,V。;Goldman,C.V.,转移相关的分散马尔可夫决策过程,(第二届自治代理和多代理系统国际联合会议论文集(2003)),41-48
[36] 瓦拉坎塔姆,P。;Kwak,J.-y。;泰勒,M。;Marecki,J。;Scerri,P。;Tambe,M.,《通过社会模型塑造在分布式pomdps中开发协调场所》(第十九届国际自动规划与调度会议(2009年))
[37] Shapley,L.S.,《随机游戏》,Proc。国家。阿卡德。科学。,39, 10, 1095-1100 (1953) ·Zbl 0051.35805号
[38] Oliehoek,F.A。;Witwicki,S.J。;Kaelbling,L.P.,多智能体系统的基于影响的抽象,(第二十六届AAAI人工智能会议论文集(2012)),1422-1428
[39] 奥利霍克,F.A。;麻省理工斯潘。;Witwicki,S.J.,《多智能体规划的影响乐观局部值》(2015年自治智能体和多智能体系统国际会议论文集(2015)),1703-1704
[40] Hindriks,K.V。;van Riemsdijk,M.B.,《满足维护目标》,(第五届声明性代理语言和技术国际研讨会(DALT)(2007)),86-103
[41] Singh,M.P.,《作为承诺领域的多智能体系统》(《国际城市管理科学协会规范、义务和公约研讨会论文集》(1996年),Citeser)
[42] Xing,J。;Singh,M.P.,《基于工程承诺的多智能体系统:时序逻辑方法》,(第二届自主智能体和多智能体联合会议论文集(2003)),891-898
[43] Altman,E.,《约束马尔可夫决策过程:随机建模》(1999),Routledge·Zbl 0963.90068号
[44] 斯坦梅茨,M。;霍夫曼,J。;Buffet,O.,概率规划中的目标概率分析:探索和提高最新技术,J.Artif。智力。决议,57,229-271(2016)·Zbl 1401.68294号
[45] Jin,C。;Jin,T。;罗,H。;Sra,S.公司。;Yu,T.,学习带有强盗反馈和未知转换的对抗性马尔可夫决策过程,(机器学习国际会议(2020)),4860-4869
[46] 达夫,S。;桑加拉杰,J。;Harland,J.,《智能代理的维护目标》,计算机。整数。,30, 1, 71-114 (2014) ·Zbl 1328.68234号
[47] 史密斯,T。;Simmons,R.,POMDP的启发式搜索值迭代,(第20届人工智能不确定性会议论文集(2004)),520-527
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。