文件Zbl 1080.68688-zbMATH Open

用于多代理团队的混合BDI-POMDP框架。（英语） Zbl 1080.68688号

J.阿蒂夫。智力。研究（JAIR） 23, 367-420 (2005).

概要：当前许多大规模多智能体团队实现的特点是遵循“信念-需求-关注”（BDI）范式，明确表示团队计划。尽管他们做出了承诺，但目前的BDI团队方法缺乏在不确定性下进行定量绩效分析的工具。分布式部分可观测马尔可夫决策问题（POMDP）非常适合于此类分析，但在此类模型中寻找最优策略的复杂性非常困难。本文的主要贡献是一种混合的BDI-POMDP方法，其中利用BDI团队计划来提高POMDP的可处理性，POMDP分析可以提高BDI团队规划的性能。具体来说，我们关注角色分配，这是BDI团队中的一个基本问题：将哪些代理分配给团队中的不同角色。这篇文章提供了三个关键贡献。首先，我们描述了一种考虑域中未来不确定性的角色分配技术；以前在多智能体角色分配方面的工作未能解决这种不确定性。为此，我们引入了RMTDP（基于角色的马尔可夫团队决策问题），这是一种新的用于分析角色分配的分布式POMDP模型。我们的技术通过大幅缩减RMTDP政策搜索而提高了可控制性；特别是，BDI团队计划提供了不完整的RMTDP策略，RMTDP政策搜索通过搜索最佳角色分配来填补此类不完整策略中的空白。我们的第二个关键贡献是一种新的分解技术，可以进一步提高RMTDP策略搜索效率。尽管仅限于搜索角色分配，但仍有许多组合角色分配，并且在RMTDP中评估每个角色分配以确定最佳分配非常困难。我们的分解技术利用了BDI团队计划中的结构，显著地减少了角色分配的搜索空间。我们的第三个关键贡献是一种非常快速的策略评估算法，适用于我们的BDI-POMDP混合方法。最后，我们还提供了两个领域的实验结果：任务预演模拟和RoboCupRescue灾难救援模拟。

引用于2文件

MSC公司：

68层37	人工智能背景下的不确定性推理
68T05型	人工智能中的学习和自适应系统

软件：

BDI-POMDP公司

PDF格式 BibTeX公司 XML格式引用

全文： arXiv公司

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
右心室	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑非
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

用于多代理团队的混合BDI-POMDP框架。（英语） Zbl 1080.68688号

MSC公司：

软件：

示例

领域

操作员

用于多代理团队的混合BDI-POMDP框架。 （英语） Zbl 1080.68688号

MSC公司：

软件：

用于多代理团队的混合BDI-POMDP框架。（英语） Zbl 1080.68688号