×

通过阻尼和分裂控制DCOP上Max-sum的收敛。 (英语) Zbl 1478.68319号

摘要:Max-sum是Belief Propagation的一个版本,用于求解DCOP。在树结构问题中,Max-sum在线性时间内收敛到最优解。不幸的是,当表示问题的约束图包含多个循环时(如许多标准DCOP基准测试中一样),Max-sum不会收敛并探索低质量的解决方案。最近,为了解决这一限制,提出了保证收敛的Max-sum版本,同时忽略了问题的一些约束。阻尼是一种常用的方法,用于增加信念传播收敛的机会。也就是说,在提出求解DCOP的Max-sum算法中,没有建议包含阻尼。
本文通过以下几个方面推进了对不完全干涉DCOP算法的研究:1)研究阻尼对Max-sum的影响。我们证明了,当阻尼减缓代理之间的信息传播时,在树结构图上,具有阻尼的Max-sum保证在弱多项式时间内收敛到最优解;以及2)在使用Max-sum求解DCOP时,提出了一种调整因子图中不对称程度的新方法,以实现开发与探索之间的平衡。通过将标准因子图转换为等效分割约束因子图(SCFG),其中每个函数节点被分割为两个函数节点,我们可以控制每个约束的不对称程度。
我们的经验结果表明,当使用阻尼时,Max-sum的性能有了显著改善(本文称为阻尼Max-sum,DMS)。然而,与通常认为Max-sum在收敛时表现最佳的假设相反,我们证明了非收敛版本在任何时间框架内实现时都能进行有效的探索,并产生高质量的结果。在大多数标准基准测试中,使用具有高阻尼因子的版本可以获得最佳结果,其性能优于现有的不完全DCOP算法。此外,我们的结果表明,通过将DMS应用于具有较小不对称程度的SCFG,即使不使用任何时间框架,我们也可以在少量迭代内找到高质量的解决方案。我们证明,对于具有单个约束的因子图,如果该约束是对称拆分的,应用于结果循环的最大和保证收敛到最优解。我们进一步证明,对于非对称分裂,不能保证收敛。

MSC公司:

68T20型 人工智能背景下的问题解决(启发式、搜索策略等)
90 C59 数学规划中的近似方法和启发式
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 莫迪,P.J。;沈伟(Shen,W.)。;塔姆贝,M。;Yokoo,M.,采用:具有质量保证的异步分布式约束优化,Artif。智力。,161, 1-2, 149-180 (2005) ·Zbl 1132.68706号
[2] 佩特库,A。;Faltings,B.,多智能体约束优化的可扩展方法,(IJCAI(2005)),266-271
[3] Gershman,A。;梅赛尔,A。;Zivan,R.,《异步前向跳跃》,J.Artif。智力。研究,34,25-46(2009)·Zbl 1180.90166号
[4] Yeoh,W。;费尔纳,A。;Koenig,S.,BnB-采用:异步分支绑定DCOP算法,J.Artif。智力。研究(JAIR),38,85-133(2010)·Zbl 1191.68733号
[5] Maheswaran,R.T。;皮尔斯,J.P。;Tambe,M.,《DCOP的分布式算法:基于图形游戏的方法》(PDCS(2004)),432-439
[6] 张伟。;邢,Z。;王,G。;Wittenburg,L.,《分布式随机搜索和分布式突破:传感器网络中约束优化问题的特性、比较和应用》,Artif。智力。,161, 1-2, 55-88 (2005) ·Zbl 1132.68718号
[7] Zivan,R。;冈本,S。;Peled,H.,《分布式约束优化的探索性随时随地局部搜索》,Artif。智力。,212, 1-26 (2014) ·Zbl 1405.68334号
[8] 佩特库,A。;Faltings,B.,《分布式优化中的近似方法》(van Beek,P.,CP 2005)。CP 2005,LNCS,第3709卷(2005)),802-806·Zbl 1153.90583号
[9] Farinelli,A。;罗杰斯,A。;佩特库,A。;Jennings,N.R.,使用最大和算法的低功耗嵌入式设备的分散协调,(AAMAS(2008)),639-646
[10] 斯特兰德斯,R。;Farinelli,A。;罗杰斯,A。;Jennings,N.R.,使用max-sum算法的移动传感器分散协调,(第21届国际人工智能联合会议论文集。第21届人工智能国际联合会议论文,2009年7月11日至17日,美国加利福尼亚州帕萨迪纳,2009年),299-304
[11] Vinyals,M。;罗德里格斯·阿吉拉尔,J.A。;Cerquides,J.,通过广义分配律构造动态规划DCOP算法的统一理论,Auton。Agent多Agent系统。,22, 3, 439-464 (2011)
[12] 阿吉,S.M。;McEliece,R.J.,《广义分配定律》,IEEE Trans。Inf.理论,46,2325-343(2000)·兹比尔0998.65146
[13] 陈,Z。;邓,Y。;Wu,T。;He,Z.,一类通过非连续值传播策略的迭代优化最大和算法,Auton。Agent多Agent系统。,32, 6, 822-860 (2018)
[14] Teacy,W.T.L。;Farinelli,A。;新泽西州格拉巴姆。;Padhy,P。;罗杰斯,A。;Jennings,N.R.,传感器系统的Max-sum分散协调,(AAMAS(2008)),1697-1698
[15] 拉姆特尔,S.D。;Farinelli,A。;麦克阿瑟,K.S。;Jennings,N.R.,机器人救援中的分散协调,计算机。J.,53,9,1447-1461(2010)
[16] 锈蚀,P。;皮卡德,G。;Ramparany,F.,使用消息传递DCOP算法解决节能智能环境配置问题,(《第二十五届国际人工智能联合会议记录》,第二十五届人工智能国际联合会议记录,2016年7月9日至15日,美国纽约州纽约市),468-474
[17] 亚诺威,C。;Meltzer,T。;Weiss,Y.,线性规划松弛和信念传播——一项实证研究,J.Mach。学习。第7号决议,1887-1907(2006)·Zbl 1222.90033号
[18] Zivan,R。;帕拉什,T。;Naveh,Y.,将max-sum应用于不对称分布式约束优化,(第二十四届国际人工智能联合会议论文集,第二十四届人工智能国际联合会议论文,2015年7月25日至31日,阿根廷布宜诺斯艾利斯,2015年),432-439
[19] Lazic,N。;弗雷,B。;Aarabi,P.,《使用消息传递算法解决无容量设施位置问题》,(国际人工智能与统计会议(2010)),429-436
[20] 索姆·P。;Chockalingam,A.,严重延迟扩展UWB MIMO-ISI信道基于阻尼信念传播的近最优均衡,(2010年IEEE国际通信会议(ICC)(2010年),IEEE),1-5
[21] 塔洛,D。;吉沃尼,我。;泽梅尔,R。;Frey,B.,Graph cuts是一种最大生成算法(第27届人工智能不确定性会议论文集(2011))
[22] Pretti,M.,《带阻尼的消息传递算法》,J.Stat.Mech。理论实验,11,文章P11008 pp.(2005)
[23] 罗杰斯,A。;法里内利,A。;斯特兰德斯,R。;Jennings,N.R.,通过最大和算法的有界近似分散协调,Artif。智力。,175, 2, 730-759 (2011) ·Zbl 1216.68305号
[24] Zivan,R。;Peled,H.,通过交替DAG上的值传播实现最大/最小和分布式约束优化,(AAMAS(2012)),265-272
[25] 墨菲,K.P。;韦斯,Y。;Jordan,M.I.,近似推理的Loopy信念传播:一项实证研究,(UAI’99:第十五届人工智能不确定性会议论文集,UAI’99:第十五届人造智能不确定性大会论文集,瑞典斯德哥尔摩,1999年7月30日至8月1日(1999)),467-475
[26] Som,A.C.P.,《严重延迟扩展UWB MIMO-ISI信道基于阻尼信念传播的近最优均衡》,(2010年IEEE国际通信会议(ICC)(2010)),1-5
[27] Dueck,D.,《亲和力传播:通过传递消息聚类数据》(2009),多伦多大学博士论文
[28] 冈本,S。;Zivan,R。;Nahon,A.,《分布式突破:超越满足》,(《第二十五届国际人工智能联合会议论文集》,第二十五届人工智能国际联合会议论文,2016年7月9日至15日,美国纽约州纽约市,2016年),447-453
[29] Verman,A.B.M。;Stutz,P.,使用秩解决分布式约束优化问题,(AAAI研讨会:统计关系人工智能(2014))
[30] 艾勒,A.T。;McAllester,D.A.,《粒子信念传播》,(第十二届国际人工智能与统计会议论文集。第十二届人工智能与统计学国际会议论文集,AISTATS 2009,美国佛罗里达州清水海滩,2009年4月16日至18日(2009)),256-263
[31] 帕切科,J。;Sudderth,E.B.,《蛋白质、粒子和伪混合边缘:子模块方法》,(第32届机器学习国际会议论文集。第32届国际机器学习会议论文集,2015年7月6日至11日,法国里尔(2015)),2200-2208
[32] Rebeschini,P。;Tatikonda,S.C.,通过最小和分裂加速共识,(神经信息处理系统进展30:2017年神经信息处理体系年度会议)。神经信息处理系统进展30:2017年12月4日至9日在美国加利福尼亚州长滩举行的神经信息处理年度会议(2017年),1374-1384
[33] 若兹,N。;Tatikonda,S.,《消息传递算法:重新参数化和拆分》,IEEE Trans。《信息理论》,59,9,5860-5881(2013)·Zbl 1364.94063号
[34] Kschichang,F.R。;弗雷,B.J。;Loeliger,H.A.,因子图和和积算法,IEEE Trans。《信息论》,47,2,181-208(2001)
[35] Zivan,R。;帕拉什,T。;科恩,L。;贝利德,H。;Okamoto,S.,分布式约束优化中不完全最小/最大和推理的平衡探索和利用,Auton。Agent多Agent系统。,31, 5, 1165-1207 (2017)
[36] 桑塔格,D。;梅尔策,T。;Globerson,A。;Jaakkola,T。;Weiss,Y.,使用消息传递加强MAP的LP松弛,(UAI(2008)),503-510
[37] Yedidsion,H。;Zivan,R。;Farinelli,A.,移动传感代理团队的探索性最大值,(自治代理和多代理系统国际会议,AAMAS’14。2014年5月5日至9日(2014年)在法国巴黎举行的2014年AAMAS自治代理和多代理系统国际会议,549-556
[38] Weiss,Y.,带回路的图形模型中局部概率传播的正确性,神经计算。,12, 1, 1-41 (2000)
[39] Farinelli,A。;罗杰斯,A。;佩特库,A。;Jennings,N.,《使用max-sum算法对低功耗嵌入式设备进行分散协调》,(第七届自治代理和多代理系统国际联合会议论文集-第2卷,国际自治代理和多重代理系统基金会(2008)),639-646
[40] Kiekintveld,C。;尹,Z。;库马尔,A。;Tambe,M.,《具有质量边界的近似分布式约束优化的异步算法》(AAMAS(2010)),133-140
[41] DiMaio,F。;Shavlik,J.W.,《基于三维零件的对象识别的大型高连通图中的信念传播》,(第六届IEEE数据挖掘国际会议论文集(ICDM 2006)。第六届IEEE数据挖掘国际会议记录(ICDM 2006),中国香港,2006年12月18日至22日(2006)),845-850
[42] Pearl,J.,《智能系统中的概率推理:合理推理网络》(1988),摩根·考夫曼:摩根·考夫曼,加利福尼亚州旧金山
[43] 科恩,L。;Zivan,R.,《重温Max-sum:阻尼的真正力量》(2017年AAMAS多智能体优化研讨会)。2017年AAMAS多智能体优化(OptMAS)研讨会,巴西圣保罗,2017年5月(2017年),1505-1507
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。