×

具有高阶项和乘积标签空间的随机场的基于滤波器的平均场推断。 (英语) Zbl 1328.68252号

摘要:最近,人们提出了许多用于解决计算机视觉中多标签问题的交叉双边滤波方法,例如立体、光流和对象类分割,这些方法的速度比以前的方法提高了一个数量级。尽管使用的模型只有一元和/或两两项,但这些方法还是取得了良好的效果。然而,以前的工作已经证明了使用具有高阶项的模型的价值,例如用于表示大区域的标签一致性或全球共现关系。我们展示了如何对这些高阶项进行公式化,从而使基于过滤器的推理保持可能。我们展示了我们在联合立体和对象标记问题以及对象类分割方面的技术,此外还展示了我们的方法如何为产品标签空间中的推理提供有效的方法。我们表明,对于相互竞争的图形剪切/动画制作方法,我们能够将这些模型中的推理速度提高约10-30倍,并在所有情况下保持或提高准确性。我们在PascalVOC-10上显示了对象类分割的结果,在Leuven上显示了联合对象立体标记的结果。

MSC公司:

68T45型 机器视觉和场景理解
62时35分 多元分析中的图像分析
62H30型 分类和区分;聚类分析(统计方面)
68平方英寸10 图像处理的计算方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Adams,A.、Baek,J.和Davis,M.A.(2010年)。使用置换自面体晶格的快速高维滤波。计算机图形论坛,29(2),753-762·文件编号:10.1111/j.1467-8659.2009.01645.x
[2] Bai,X.和Sapiro,G.(2007年)。用于快速交互式图像和视频分割和消光的测地线框架。在ICCV中·Zbl 1179.68188号
[3] Bleyer,M.、Rhemann,C.和Rother,C.(2012)。从立体图像中提取3D场景一致的对象建议和深度。在ECCV中,(第467-481页)。
[4] Bleyer,M.、Rother,C.、Kohli,P.、Scharstein,D.和Sinha,S.(2011年)。对象立体-联合立体匹配和对象分割。在CVPR中,(第3081-3088页)。
[5] Borestein,E.和Malik,J.(2006年)。形状引导的对象分割。CVPR(第969-976页)。
[6] Boykov,Y.和Jolly,M.(2001)用于N-D图像中对象的最佳边界和区域分割的交互式图形切割。在ICCV中,(第105-112页)·Zbl 1179.68188号
[7] Boykov,Y.、Veksler,O.和Zabih,R.(2001)。通过图形切割实现快速近似能量最小化。IEEE PAMI,23(11),1222-1239·数字对象标识代码:10.1109/34.969114
[8] Comaniciu,D.和Meer,P.(2002年)。均值偏移:一种稳健的特征空间分析方法。TPAMI,24,603-619·doi:10.1109/34.1000236
[9] Comaniciu,D.和Meer,P.(2002年)。均值偏移:一种稳健的特征空间分析方法。IEEE PAMI,24(5),603-619·doi:10.1109/34.1000236
[10] Criminisi,A.Sharp,T.和Blake,A.(2008)。GeoS:测地图像分割。在ECCV中,(第99-112页)。
[11] Everingham,M.Van Gool,L.,Williams,C.K.I.,Winn,J.和Zisserman,A.(2011年)。PASCAL可视对象类,挑战(VOC2011)。
[12] Galleguillos,C.Rabinovich,A.和Belongiem,S.(2008)。使用共现、位置和外观进行对象分类。在CVPR中。
[13] Gastla,E.S.S.L.和Oliveira,M.M.(2011)。用于边缘感知图像和视频处理的域变换。ACM图形学报,30(4),69。
[14] Goldluke,B.和Cremers,D.(2010年)。产品标签空间多标签问题的凸松弛。在ECCV中,(第225-238页)。
[15] Gonfaus,J.M.、Boix,X.、Van De Weijer,J.、Bagdanov,A.D.、Serrat,J.和J.(2010)。冈萨雷斯。联合分类和分割的和谐潜力。在IEEE CVPR中·Zbl 1235.68246号
[16] Grady,L.(2006)。用于图像分割的随机行走。TPAMI,281768-1783年·doi:10.10109/TPAMI.2006.233
[17] Kohli,P.、Kumar,M.P.和Torr,P.H.S.(2007年)。P3及以上:用高阶团解决能量问题。在IEEE CVPR中。
[18] Koller,D.和Friedman,N.(2009年)。概率图形模型。伦敦:麻省理工学院出版社·Zbl 1183.68483号
[19] Kolmogorov,V.(2006)。收敛树重加权消息传递以实现能量最小化。IEEE PAMI,28(10),1568-1583·doi:10.1109/TPAMI.2006.200
[20] Komodakis,N.和Paragios,N.(2009年)。超越两两能量:高效优化高阶MRF。IEEE CVPR,(第2985-2992页)。
[21] Komodakis,N.、Paragios,N.和Tziritas,G.(2011年)。通过双重分解实现MRF能量最小化和超越。IEEE PAMI,33(3),531-552·doi:10.1109/TPAMI.2010.108
[22] Kornprobst,P.、Tumblin,J.和Durand,F.(2009年)。双边滤波:理论与应用。计算机图形与视觉基础与趋势,4(1),1-74·Zbl 1179.68188号
[23] 克拉亨布尔。P.和Koltun,V.(2011年)。高斯边缘势全连通CRF中的有效推理。在NIPS中,(第109-117页)。
[24] Kumar,M.、Torr,P.和Zisserman,A.(2005年)。对象切割。CVPR(第18-25页)。
[25] Kumar,M.P.、Veksler,O.和Torr,P.H.S.(2011)。改进了截断凸模型的移动。JMLR,第12、31-67页·Zbl 1280.68174号
[26] Ladickí,L.、Russell,C.、Kohli,P.和Torr,P.H.S.(2009)。用于对象类图像分割的层次关联CRF。在ICCV中,(第739-746页)。
[27] Ladickí,L.、Russell,C.、Kohli,P.和Torr,P.H.S.(2010)。基于图割的同现统计推理。在ECCV中,(第239-253页)·兹比尔1270.68350
[28] Ladickí,L.、Sturgess,P.、Alahari,K.、Russell,C.和Torr,P.H.S.(2010年)。什么,在哪里,有多少?结合目标检测器和crf。在ECCV中。
[29] Ladickí,L.,Sturgess,P.,Russell,C.,Sengupta,S.,Bastanlar,Y.,Clocksin,W.F.和Torr,P.H.S.(2010年)。对象类分割和稠密立体重建的联合优化。在BMVC中,(第1-11页)。
[30] Lan,X.、Roth,S.、Huttenlocker,D.和Black,M.(2009)。基于学习高阶马尔可夫随机场的有效信念传播。在ECCV中,(第269-283页)。
[31] Liu,C.、Yuen,J.、Torralba,A.、Sivic,J.和Freeman,W.T.(2008)。SIFT流:不同场景之间的密集通信。在ECCV中。
[32] Liu,C.、Yuen,J.和Torralba,A.(2009年)。非参数场景解析:通过密集场景对齐进行标签传输。在CVPR中。
[33] Oliva,A.和Torralba,A.(2001)。场景形状建模:空间包络线的整体表示。IJCV,第42页,第145-175页·Zbl 0990.68601号
[34] Pawan Kumar,M.和Torr,Philip H.S.(2008)。改进了截断凸模型的移动。在NIPS中,(第889-896页)·Zbl 1280.68174号
[35] Payet,N.和Todorovic,S.(2010年)\[(\text{RF})^2\]RF)2-随机森林随机场。以NIPS为单位。
[36] Potetz,B.和Lee,T.S.(2008年)。使用线性约束节点对高阶团进行有效的信任传播。CVIU,第112页,第39-54页。
[37] Rabinovich,A.、Vedaldi,A.、Galleguillos,C.、Wiewiora,E.和Belongie,S.(2007年)。上下文中的对象。在ICCV中。
[38] Rhemann,C.、Hosni,A.、Bleyer,M.、Rother,C.和Gelautz。M.(2011)。视觉通信和其他方面的快速成本-体积过滤。CVPR(第3017-3024页)。
[39] Rother,C.、Kohli,P.、Feng,W.和Jia,J.(2009年)。最小化离散变量的稀疏高阶能量函数。在CVPR中,(第1382-1389页)。
[40] Rother,C.、Kohli,P.、Feng,W.和Jia,J.(2009)。最小化离散变量的稀疏高阶能量函数。在CVPR中。
[41] Rother,C.、Kolmogorov,V.和Blake,A.(2004)。抓取:使用迭代图形切割的交互式前景提取。ACM TOG,23,309-314·doi:10.1145/1015706.1015720
[42] Shotton,J.、Winn,J.M.、Rother,C.和Criminisi,A.(2009年)。用于图像理解的Textonboost:通过联合建模纹理、布局和上下文来识别和分割多类对象。国际JCV,81(1),2-23·doi:10.1007/s11263-007-0109-1
[43] Singaraju,D.、Grady,L.和Vidal R.(2008年)。P-Brush:用于图像分割的具有赋范成对分布的连续值MRF。在CVPR中。
[44] Torralba,A.、Murphy,K.P.和Freeman,W.T.(2007年)。共享多类和多视图对象检测的视觉功能。IEEE PAMI,29854-869·doi:10.1109/TPAMI.2007.1055
[45] Toyoda,T.和Hasegawa,O.(2008)。用于集成局部信息和全局信息的随机场模型。TPAMI,第30期,1483-1489页·doi:10.1109/TPAMI.2008.105
[46] Turner,R.E.和Sahani,M.(2011年)。时间序列模型的两个变分期望最大化问题。贝叶斯时间序列模型(第109-130页)。
[47] Veksler,O.(2007)。基于图割的截断凸先验MRF优化。在CVPR中。
[48] Weiss,Y.,比较平均场方法和置信传播在MRF中的近似推理(2001),马萨诸塞州剑桥
[49] Woodford,O.、Torr,P.H.S.、Reid,I.和Fitzgibbon,A.(2009年)。二阶平滑先验下的全局立体重建。IEEE PAMI,31(12),2115-2128·doi:10.1109/TPAMI.2009.131
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。