×

具有稀疏高阶势的稠密CRF的有效松弛。 (英语) Zbl 1423.90263号

摘要:密集条件随机场(CRF)已成为计算机视觉中建模若干问题的流行框架,例如立体对应和多类语义分割。通过对远程交互进行建模,密集CRF提供了一种比稀疏CRF捕捉更精细细节的标签。目前,最先进的算法使用基于滤波器的方法进行平均场推断,但无法对解的质量提供强有力的理论保证。自然会出现一个问题,即是否可以使用原则方法获得致密CRF的最大后验(MAP)估计。在本文中,我们表明这确实是可能的。具体来说,我们将表明,通过使用基于滤波器的方法,可以使用最先进的算法有效地优化MAP问题的连续松弛。具体来说,我们将使用Frank-Wolfe算法解决二次规划松弛问题,并通过开发近似最小化框架解决线性规划松弛问题,我们能够制定上述算法,使得每次迭代在类数和随机变量数上具有线性复杂性。所提出的算法可以应用于任何使用稀疏高阶势的密集CRF的标记问题。在本文中,我们使用语义分割作为一个示例应用程序,因为它证明了该算法能够扩展到大维度的稠密CRF。我们在Pascal数据集上进行了实验,表明所提出的算法能够获得比平均场推理方法更低的能量。

MSC公司:

90立方厘米 涉及图形或网络的编程
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] A.Adams、J.Baek和M.Abraham,《使用置换自面体晶格的快速高维滤波》,《欧洲制图学报》,2010年。
[2] T.Ajanthan、A.Desmaison、R.Bunel、M.Salzmann、P.H.S.Torr和M.P.Kumar,《稠密CRF的高效线性规划》,载于《CVPR学报》,2017年·Zbl 1423.90263号
[3] F.R.Bach,{次梯度法和条件梯度法之间的对偶},SIAM J.Optim。,25(2015),第115-129页·Zbl 1358.90155号
[4] P.Baqueí,T.Bagautdinov,F.Fleuret,and P.Fua,{\it Principled parallel mean-field inference for discrete random fields},《CVPR学报》,2016年。
[5] S.Chandra、N.Usunier和I.Kokkinos,{使用深度嵌入的稠密和低阶高斯crfs},《计算机视觉国际会议论文集》,2017年第2卷。
[6] C.Chekuri、S.Khanna、J.Naor和L.Zosin,{通过新的线性规划公式求解度量标记问题的近似算法},《SODA学报》,2001年·Zbl 0989.90104号
[7] L.Chen、G.Papandreou、I.Kokkinos、K.Murphy和A.L.Yuille,{\it Semantic image segmentation with deep convolutional nets and fully connected CRF},发表在《ICLR会议录》,2015。
[8] L.-C.Chen、G.Papandreou、I.Kokkinos、K.Murphy和A.L.Yuille,{\it DeepLab:使用深度卷积网络、atrous卷积和全连接CRFs}进行语义图像分割,IEEE Trans。模式分析。机器。整数。,40(2018年),第834-848页。
[9] D.Comaniciu和P.Meer,{均值漂移:特征空间分析的稳健方法},IEEE Trans。模式分析。机器。整数。,24(2002),第603-619页。
[10] A.Desmaison、R.Bunel、P.Kohli、P.H.S.Torr和M.P.Kumar,{致密CRF的有效连续松弛},《ECCV学报》,2016年·Zbl 1423.90263号
[11] M.Everingham、L.Van Gool、C.K.I.Williams、J.Winn和A.Zisserman,《PASCAL可视化对象类挑战》(2010)(VOC(2010)结果}。
[12] M.Frank和P.Wolfe,《二次规划的算法》,Naval Res.Logistics Q.,3(1956),第95-110页。
[13] J.L.Kelley,{一般拓扑},Grad。数学课文。1975年,纽约施普林格27号·Zbl 0306.54002号
[14] J.Kleinberg和E.Tardos,《成对关系分类问题的近似算法:度量标记和马尔可夫随机场》,J.ACM,49(2002),第616-639页·Zbl 1326.68336号
[15] P.Kohli、P.Kumar和P.Torr,{\it\(P3\)&beyond:用高阶团求解能量},载于《CVPR学报》,2007年。
[16] P.Kohli、T.Minka和J.Winn,《MSRC数据集》,(2017年)。
[17] D.Koller和N.Friedman,《概率图形模型:原理和技术》,麻省理工学院出版社,英国剑桥,2009年·Zbl 1183.68483号
[18] V.Kolmogorov和R.Zabih,{\it什么能量函数可以最小化?},IEEE Trans。模式分析。机器。整数。,2(2004年),第147-159页。
[19] P.Kra¨henbu¨hl和V.Koltun,{高斯边势全连通CRF中的有效推理},《NIPS学报》,2011年。
[20] P.Kra¨henbu¨hl和V.Koltun,{稠密随机场的参数学习和收敛推断},《国际货币市场协会学报》,2013年。
[21] M.P.Kumar、V.Kolmogorov和P.H.S.Torr,《离散mrfs映射估计的凸松弛分析》,J.Mach。学习。Res.,10(2008),第71-106页·Zbl 1235.90092号
[22] S.Lacoste-Julien,{非凸目标下Frank-Wolfe的收敛速度},2016年。
[23] S.Lacoste Julien、M.Jaggi、M.Schmidt和P.Pletscher,{\it Block coordinate Frank Wolfe optimization for structural SVM}{\it Block coordinate,发表在《ICML Proceedings of ICML》,2012。
[24] L.Ladicky、C.Russell、P.Kohli和P.Torr,{基于图切割的推断与共现统计},《ECCV学报》,2010年·Zbl 1270.68350号
[25] L.Ladicky、C.Russell、P.Kohli和P.H.S.Torr,{\it对象类图像分割的关联层次CRFs},《IEEE第12届计算机视觉会议论文集》,2009年,第739-746页。
[26] J.Long、E.Shelhamer和T.Darrell,{语义分割的完全卷积网络},《CVPR学报》,2015年。
[27] N.Parikh和S.Boyd,{近似算法},发现。最佳趋势。,1(2014年),第123-131页。
[28] P.Ravikumar和J.Lafferty,{度量标记和马尔可夫随机场图估计的二次规划松弛},《ICML学报》,2006年。
[29] A.Schwing和R.Urtasun,《完全连接的深层结构网络》,2015年。
[30] J.Shotton、J.Winn、C.Rother和A.Criminisi,《图像理解的文本增强:通过联合建模纹理、布局和上下文的多类对象识别和分割》,国际计算机杂志。视觉。,81(2009),第2-23页。
[31] J.Snoek、H.Larochelle和R.Adams,《机器学习算法的实用贝叶斯优化》,《NIPS学报》,2012年·兹比尔1433.68379
[32] M.Tappen、C.Liu、E.Adelson和W.Freeman,《低水平视觉的高斯条件随机场学习》,载《CVPR学报》,2007年。
[33] A.Torralba、K.P.Murphy和W.T.Freeman,《为多类和多视图对象检测共享视觉特征》,IEEE Trans。模式分析。机器。英特尔。,29(2007),第854-869页。
[34] V.Vineet,J.Warrell,and P.H.S.Torr,{it Filter-based mean field inference for random fields with high-order terms and product label-spaces},收录于《计算机视觉:ECCV 2012》,《计算机课堂讲稿》。科学。7576,Springer,纽约,第31-44页·Zbl 1328.68252号
[35] P.Wang、C.Shen和A.van den Hengel,《基于低秩分解的全连通CRFs的高效SDP推理》,载于《CVPR论文集》,2015年。
[36] X.Xiao和D.Chen,{非负二次规划的乘法迭代},Numer。线性代数应用。,提交。
[37] Y.Zhang和T.Chen,{平稳全连通CRF的有效推断},载《CVPR学报》,2012年。
[38] S.Zheng、S.Jayasumana、B.Romera-Polares、V.Vineet、Z.Su、D.Du、C.Huang和P.Torr,{条件随机场作为递归神经网络},《ICCV学报》,2015年。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。