文件Zbl 1399.68137-zbMATH打开

基于约束简化DCOP的多智能体协作强化学习。（英语） Zbl 1399.68137号

J.北京理工大学。 26，第4期，525-533（2017）.

摘要：协作多智能体强化学习（MARL）是人工智能领域的一个重要课题，其中分布式约束优化（DCOP）算法被广泛用于协调多智能体的行为。然而，代理之间的密集通信影响了DCOP算法的实用性。本文提出了一种新的DCOP算法，通过减少约束来解决先前DCOP算法的通信问题。本文的贡献主要有三方面：
1.证明了去除约束可以有效降低DCOP算法的通信负担。
2.提供了一个准则，用于识别那些对整个系统性能影响不大的不重要约束。
3.通过采用一种不同的谱聚类算法来检测和消除不重要的约束，提出了一种减少约束的DCOP算法。我们的算法减少了基准DCOP算法的通信负担，同时不影响其整体性能。在四种协作传感器网络配置下，评估了约束简化DCOP算法的性能。通过比较约束约简DCOP和基准DCOP，验证了通信约简的有效性。

MSC公司：

68T05年	人工智能中的学习和自适应系统
第68页第42页	Agent技术与人工智能

关键词：

强化学习;协作多智能体系统;分布式约束优化;约束减少的DCOP

PDF格式 BibTeX公司 XML格式引用

全文：内政部

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
拉	语言
所以	来源
实验室	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!实验室	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

基于约束简化DCOP的多智能体协作强化学习。（英语） Zbl 1399.68137号

MSC公司：

关键词：

示例

领域

操作员

基于约束简化DCOP的多智能体协作强化学习。 （英语） Zbl 1399.68137号

MSC公司：

关键词：

基于约束简化DCOP的多智能体协作强化学习。（英语） Zbl 1399.68137号