×

用于多代理团队的混合BDI-POMDP框架。 (英语) Zbl 1080.68688号

概要:当前许多大规模多智能体团队实现的特点是遵循“信念-需求-关注”(BDI)范式,明确表示团队计划。尽管他们做出了承诺,但目前的BDI团队方法缺乏在不确定性下进行定量绩效分析的工具。分布式部分可观测马尔可夫决策问题(POMDP)非常适合于此类分析,但在此类模型中寻找最优策略的复杂性非常困难。本文的主要贡献是一种混合的BDI-POMDP方法,其中利用BDI团队计划来提高POMDP的可处理性,POMDP分析可以提高BDI团队规划的性能。具体来说,我们关注角色分配,这是BDI团队中的一个基本问题:将哪些代理分配给团队中的不同角色。这篇文章提供了三个关键贡献。首先,我们描述了一种考虑域中未来不确定性的角色分配技术;以前在多智能体角色分配方面的工作未能解决这种不确定性。为此,我们引入了RMTDP(基于角色的马尔可夫团队决策问题),这是一种新的用于分析角色分配的分布式POMDP模型。我们的技术通过大幅缩减RMTDP政策搜索而提高了可控制性;特别是,BDI团队计划提供了不完整的RMTDP策略,RMTDP政策搜索通过搜索最佳角色分配来填补此类不完整策略中的空白。我们的第二个关键贡献是一种新的分解技术,可以进一步提高RMTDP策略搜索效率。尽管仅限于搜索角色分配,但仍有许多组合角色分配,并且在RMTDP中评估每个角色分配以确定最佳分配非常困难。我们的分解技术利用了BDI团队计划中的结构,显著地减少了角色分配的搜索空间。我们的第三个关键贡献是一种非常快速的策略评估算法,适用于我们的BDI-POMDP混合方法。最后,我们还提供了两个领域的实验结果:任务预演模拟和RoboCupRescue灾难救援模拟。

MSC公司:

68层37 人工智能背景下的不确定性推理
68T05型 人工智能中的学习和自适应系统

软件:

BDI-POMDP公司
PDF格式BibTeX公司 XML格式引用
全文: arXiv公司