文件Zbl 07698051-zbMATH打开

风险意识分析，用于解释概率实现和维护承诺。（英语） Zbl 07698051号

Artif公司。智力。 317，文章ID 103864，22 p.（2023）.

概要：概率承诺为多智能体协调提供了一个计算框架，其中一个自主智能体（承诺提供者）承诺未来的行动过程，以接收方希望的方式概率地影响另一个智能体的本地状态（承诺接收者）。传统上，概率承诺是抽象指定的，以便在运行时为提供者提供关于如何实现它的自由度。不幸的是，正如我们在本文中分析的那样，这种抽象会给接收者带来性能次优的风险。对于提供者（实现）承诺实现接收者喜欢但最初不支持的条件，我们证明接收者可以做出限制其次优风险的建模选择。然而，令人惊讶的是，对于提供者（维护）承诺维护初始值已经是接收者偏好的条件，我们证明不可能有这种次优风险边界。我们对这两种类型的承诺进行了实证研究，以衡量它们在不同条件下产生的次优度，并根据我们的理论和实证结果表明，在指定概率维护承诺时添加选择性细节是有益的。

MSC公司：

68T42型

Agent技术与人工智能

关键词：

概率承诺;多智能体协同规划;不确定性下的规划;成就承诺;维护承诺

软件：

普罗莫卡

PDF格式 BibTeX公司 XML格式引用

全文： DOI程序

参考文献：

[1]	Singh，M.P.，《辩证承诺和实践承诺的语义考虑》（第二十届美国人工智能学会人工智能会议论文集（2008）），176-181
[2]	Jennings，N.R.，承诺和约定：多智能体系统中协调的基础，Knowl。工程版次，8，3，223-250（1993）
[3]	Xing，J。；Singh，M.P.，基于承诺的代理交互形式化，（2001年ACM应用计算研讨会论文集（2001）），115-120
[4]	Winikoff，M.，《使用分布式承诺机实现灵活而健壮的代理交互》，多代理网格系统。，2, 4, 365-381 (2006) ·Zbl 1117.68010号
[5]	Durfee，E.H。；Singh，S.，《关于诚信履行承诺》（Osman，N.；Sierra，C.，《自治代理和多代理系统：2016年AAMAS研讨会最佳论文》（2016），Springer），1-13
[6]	Xuan，P。；Lesser，V.R.，《将不确定性纳入代理承诺》（代理理论、架构和语言国际研讨会（1999），Springer），57-70·兹伯利0970.68642
[7]	Maheswaran，R。；Szekely，P。；贝克尔，M。；菲茨帕特里克，S。；加蒂，G。；Jin，J。；Neches，R。；北卡罗来纳州努里。；罗杰斯，C。；Sanchez，R.，《复杂环境中协调的可预测性和关键性度量》，（第七届自主代理和多代理系统国际联合会议论文集（2008）），647-654
[8]	Witwicki，S.J。；Durfee，E.H.，基于承诺的服务协调，Int.J.Agent-Oriented Softw。工程，359-87（2009）
[9]	张，Q。；Durfee，E.H。；辛格，S。；陈，A。；Witwicki，S.J.，《报酬不确定性下顺序决策的承诺语义》，（第二十五届国际人工智能联合会议（2016）论文集），3315-3323
[10]	克莱门特，B.J。；Schaffer，S.R.，利用C-TÆMS模型进行政策搜索，（ICAPS多智能体规划研讨会（2008））
[11]	Goldman，R.P。；Musliner，D.J。；Durfee，E.H。；Boddy，M.S.，《协调高度应急计划：将分布式MDP偏向于合作行为》（ICAPS多智能体规划研讨会（2008））
[12]	Hiatt，L.M.，概率计划管理（2009），卡内基梅隆大学，博士论文
[13]	Witwicki，S.J。；Durfee，E.H.，承诺驱动的分布式联合政策搜索，（第六届自治代理和多代理系统国际联合会议记录（2007年）），480-487
[14]	张，Q。；Durfee，E.H。；Singh，S.，高效查询合作概率承诺，（第三十五届AAAI人工智能会议论文集（2021）），11378-11386
[15]	张，Q。；辛格，S。；Durfee，E.，在承诺约束的顺序决策中最大限度地减少后悔，（第二十七届国际自动规划与调度会议（2017）论文集），348-356
[16]	张，Q。；Durfee，E.H。；Singh，S.，模型不确定性下实现可信承诺的语义和算法，Auton。代理多代理系统。，34, 1, 19 (2020)
[17]	Singh，M.P.，《多智能体系统中的承诺：一些历史，一些困惑，一些争议，一些前景》（The Goals of Cognition.Essays in Honor of Cristiano Castelfranchi，The Goals-The Goals.The Goal of Cognation.Essaws in Honow of Cristano Castelfranchi，London（2012）），第601-626页
[18]	Vokrínek，J。；Komenda，A。；Pechoucek，M.，《非确定性环境中多智能体执行的去承诺：实验方法》，（第八届自主智能体和多智能体系统国际会议论文集（2009）），977-984
[19]	桑德霍姆，T。；Lesser，V.R.，《平准承诺合同和战略违约》，《奥运经济》。行为。，35, 212-270 (2001) ·Zbl 1050.91034号
[20]	北德赛。；北卡罗来纳州纳伦德拉。；Singh，M.P.，《通过承诺检查商业合同的正确性》，（第七届自治代理和多代理系统国际联合会议记录（2008年）），787-794
[21]	Günay，A。；刘，Y。；Zhang，J.，Promoca:承诺协议中代理的概率建模和分析，J.人工制品。智力。决议，57，465-508（2016）·Zbl 1401.68337号
[22]	佩雷拉，R.F。；北奥伦。；Meneguzzi，F.，《通过监测计划执行期间的次优步骤来检测承诺放弃》，（第十六届自治代理和多代理系统会议记录（2017年）），1685-1687
[23]	特朗，P。；梅内古齐，F.R。；Singh，M.，《关于目标和承诺的层次规划》，（第十二届自主代理和多代理系统国际会议论文集（2013年））
[24]	King，T.C。；Günay，A。；Chopra，A.K。；辛格，M.P.，托斯卡：信息协议的操作承诺，arXiv预印本
[25]	班纳扎德，H。；Leon-Garcia，A.，面向服务系统的分布式概率承诺控制算法，IEEE Trans。Netw公司。服务。管理。，7, 4, 204-217 (2010)
[26]	卡明卡，G.A。；亚基尔，A。；Erusalimchik，D。；Cohen-Nov，N.，《迈向协作任务和团队维护》，（第六届自治代理和多代理系统国际联合会议记录（2007）），1-8
[27]	Newell，A.，《统一认知理论》（1994），哈佛大学出版社
[28]	卡明卡，G.A。；Frenkel，I.，《在基于行为的机器人中实现灵活的团队合作》，（第四届自主代理和多代理系统国际联合会议论文集（2005）），1355-1356
[29]	巴拉尔，C。；艾特，T。；比亚雷兰德，M。；Nakamura，M.，《动态环境中代理人的维护目标：制定和政策构建》，Artif。整数。，172, 12-13, 1429-1469 (2008) ·Zbl 1183.68630号
[30]	巴克斯，F。；Kabanza，F.，《临时扩展目标的规划》，《数学年鉴》。Artif公司。整数。，22, 1, 5-27 (1998) ·Zbl 1034.68549号
[31]	Özveren，C.M.（奥地利）。；Willsky，A.S。；Antsaklis，P.J.，离散事件动态系统的稳定性和稳定性，J.ACM，38，3，729-751（1991）
[32]	达夫，S。；桑加拉杰，J。；Harland，J.，智能代理中的维护目标，Comput。整数。，30, 1, 71-114 (2014) ·Zbl 1328.68234号
[33]	Oliehoek，F.A。；Amato，C.，《去中心化POMDP简介》（2016），施普林格出版社·Zbl 1355.68005号
[34]	Witwicki，S.J。；Durfee，E.H.，弱耦合Dec-POMDP的基于影响的政策抽象，（第二十届国际自动规划与调度会议论文集（2010）），185-192
[35]	贝克尔，R。；Zilberstein，S。；Lesser，V。；Goldman，C.V.，转移相关的分散马尔可夫决策过程，（第二届自治代理和多代理系统国际联合会议论文集（2003）），41-48
[36]	瓦拉坎塔姆，P。；Kwak，J.-y。；泰勒，M。；Marecki，J。；Scerri，P。；Tambe，M.，《通过社会模型塑造在分布式pomdps中开发协调场所》（第十九届国际自动规划与调度会议（2009年））
[37]	Shapley，L.S.，《随机游戏》，Proc。国家。阿卡德。科学。，39, 10, 1095-1100 (1953) ·Zbl 0051.35805号
[38]	Oliehoek，F.A。；Witwicki，S.J。；Kaelbling，L.P.，多智能体系统的基于影响的抽象，（第二十六届AAAI人工智能会议论文集（2012）），1422-1428
[39]	奥利霍克，F.A。；麻省理工斯潘。；Witwicki，S.J.，《多智能体规划的影响乐观局部值》（2015年自治智能体和多智能体系统国际会议论文集（2015）），1703-1704
[40]	Hindriks，K.V。；van Riemsdijk，M.B.，《满足维护目标》，（第五届声明性代理语言和技术国际研讨会（DALT）（2007）），86-103
[41]	Singh，M.P.，《作为承诺领域的多智能体系统》（《国际城市管理科学协会规范、义务和公约研讨会论文集》（1996年），Citeser）
[42]	Xing，J。；Singh，M.P.，《基于工程承诺的多智能体系统：时序逻辑方法》，（第二届自主智能体和多智能体联合会议论文集（2003）），891-898
[43]	Altman，E.，《约束马尔可夫决策过程：随机建模》（1999），Routledge·Zbl 0963.90068号
[44]	斯坦梅茨，M。；霍夫曼，J。；Buffet，O.，概率规划中的目标概率分析：探索和提高最新技术，J.Artif。智力。决议，57，229-271（2016）·Zbl 1401.68294号
[45]	Jin，C。；Jin，T。；罗，H。；Sra，S.公司。；Yu，T.，学习带有强盗反馈和未知转换的对抗性马尔可夫决策过程，（机器学习国际会议（2020）），4860-4869
[46]	达夫，S。；桑加拉杰，J。；Harland，J.，《智能代理的维护目标》，计算机。整数。，30, 1, 71-114 (2014) ·Zbl 1328.68234号
[47]	史密斯，T。；Simmons，R.，POMDP的启发式搜索值迭代，（第20届人工智能不确定性会议论文集（2004）），520-527

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：书籍文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

风险意识分析，用于解释概率实现和维护承诺。（英语） Zbl 07698051号

MSC公司：

关键词：

软件：

参考文献：

示例

领域

操作员

风险意识分析，用于解释概率实现和维护承诺。 （英语） Zbl 07698051号

MSC公司：

关键词：

软件：

参考文献：

风险意识分析，用于解释概率实现和维护承诺。（英语） Zbl 07698051号