谢,易;刘忠义;刘,赵;顾一军 基于约束简化DCOP的多智能体协作强化学习。 (英语) Zbl 1399.68137号 J.北京理工大学。 26,第4期,525-533(2017). 摘要:协作多智能体强化学习(MARL)是人工智能领域的一个重要课题,其中分布式约束优化(DCOP)算法被广泛用于协调多智能体的行为。然而,代理之间的密集通信影响了DCOP算法的实用性。本文提出了一种新的DCOP算法,通过减少约束来解决先前DCOP算法的通信问题。本文的贡献主要有三方面:1.证明了去除约束可以有效降低DCOP算法的通信负担。2.提供了一个准则,用于识别那些对整个系统性能影响不大的不重要约束。3.通过采用一种不同的谱聚类算法来检测和消除不重要的约束,提出了一种减少约束的DCOP算法。我们的算法减少了基准DCOP算法的通信负担,同时不影响其整体性能。在四种协作传感器网络配置下,评估了约束简化DCOP算法的性能。通过比较约束约简DCOP和基准DCOP,验证了通信约简的有效性。 MSC公司: 68T05年 人工智能中的学习和自适应系统 第68页第42页 Agent技术与人工智能 关键词:强化学习;协作多智能体系统;分布式约束优化;约束减少的DCOP PDF格式BibTeX公司 XML格式引用 \textit{Y.Xie}等人,J.北京理工大学。26,第4号,525--533(2017;Zbl 1399.68137) 全文: 内政部