×

具有共现统计的CRF推断方法。 (英语) Zbl 1270.68350号

摘要:计算机视觉中使用的马尔可夫和条件随机场(CRF)通常只对变量之间的局部交互进行建模,因为这通常被认为是唯一可计算的情况。在本文中,我们考虑了一类定义在CRF中所有变量上的全局势。我们展示了与标准成对字段相比,如何使用标准图切割算法轻松优化它们,而只需花费很少的额外费用。该结果可以直接用于基于类别的图像分割问题,该问题近年来在计算机视觉领域受到越来越多的关注。这里的目的是从一组可能的对象类中为给定图像的每个像素指定一个标签。通常,这些方法使用随机场来模拟像素或超像素之间的局部交互。有助于识别的线索之一是全局对象共现统计,这是一种衡量哪些类(如椅子或摩托车)可能会出现在同一图像中的指标。已经提出了几种利用此特性的方法,但所有这些方法都有不同的局限性,并且通常具有较高的计算成本,从而阻碍了它们在大型图像上的应用。我们发现,与仅使用成对模型相比,我们提出的新模型在标记方面产生了显著的改进,并且这种改进随着标记数量的增加而增加。

理学硕士:

68T45型 机器视觉和场景理解
62M40型 随机字段;图像分析
94A08型 信息与通信理论中的图像处理(压缩、重建等)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Benson,H.Y.,&;Shanno,D.F.(2007)。一种精确的原始-对偶惩罚方法,用于线性规划的温启动内点方法。计算优化与应用,38(3),371-399·Zbl 1171.90546号
[2] Borenstein,E.和;Malik,J.(2006)。形状引导的对象分割。在IEEE计算机视觉和模式识别会议上,(第969–976页),纽约。
[3] Boykov,Y.、Veksler,O.和;Zabih,R.(2001)。通过图形切割实现快速近似能量最小化。IEEE模式分析和机器智能汇刊,23(11),1222-1239。
[4] Choi,M.J.、Lim,J.J.、Torralba,A.和;Willsky,A.S.(2010年)。在大型对象类别数据库上利用层次上下文。在旧金山举行的IEEE计算机视觉和模式识别会议上。
[5] 科马尼丘·D·;Meer,P.(2002)。均值偏移:一种稳健的特征空间分析方法。IEEE模式分析和机器智能汇刊,24,603–619。
[6] Csurka,G.和;Perronnin,F.(2008)。一种简单的高性能语义分割方法。在英国机器视觉会议08,利兹。
[7] A.德隆、A.奥索金、H.伊萨克;Boykov,Y.(2010年)。快速近似能量最小化和标签成本。在旧金山举行的IEEE计算机视觉和模式识别会议上·Zbl 1235.68257号
[8] Felzenszwalb,P.F.和;Huttenlocher,D.P.(2004年)。高效的基于图形的图像分割。国际计算机视觉杂志,59(2),167-181。
[9] Galleguillos,C.、Rabinovich,A.和;Belongie,S.(2008)。使用共现、位置和外观进行对象分类。在IEEE计算机视觉和模式识别会议上,安克雷奇。
[10] Gould,S.、Fulton,R.和;Koller,D.(2009)。将场景分解为几何和语义一致的区域。在京都举行的计算机视觉国际会议上。
[11] Heitz,G.和;Koller,D.(2008)。学习空间语境:利用事物来寻找事物。在马赛举行的欧洲计算机视觉会议上。
[12] Hoiem,D.、Rother,C.和;Winn,J.M.(2007)。用于多视图对象类识别和分割的三维布局crf。在圣地亚哥举行的IEEE计算机视觉和模式识别会议上。
[13] Kleinberg,J.和;Tardos,E.(2002年)。具有成对关系的分类问题的近似算法:度量标记和马尔可夫随机场。美国医学会杂志,49(5),616–639·Zbl 1326.68336号
[14] Kohli,P.、Ladicky,L.和;Torr,P.H.S.(2008)。增强标签一致性的强大高阶潜力。在IEEE计算机视觉和模式识别会议上,安克雷奇。
[15] Kolmogorov,V.(2006)。收敛树重加权消息传递以实现能量最小化。IEEE模式分析和机器智能汇刊,28(10),1568-1583。
[16] Kolmogorov,V.和;Rother,C.(2006)。高连通图能量最小化算法的比较。《欧洲计算机视觉会议论文集》(第1-15页)。海德堡:施普林格。
[17] Komodakis,N.、Tziritas,G.和;Paragios,N.(2007年)。单个和动态mrf的快速近似最优解决方案。在明尼阿波利斯举行的IEEE计算机视觉和模式识别会议上。
[18] Kumar,M.和;Torr,P.H.S.(2008)。有效解决地图估计中的凸松弛问题。在机器学习国际会议上。纽约:ACM。
[19] Kumar,M.P.,Veksler,O.,&;Torr,P.H.S.(2011)。改进了截断凸模型的移动。机器学习研究杂志,12,31–67·Zbl 1280.68174号
[20] Ladicky,L.、Russell,C.、Kohli,P.和;Torr,P.H.S.(2009)。用于对象类图像分割的关联层次crf。在国际计算机视觉会议上。
[21] Ladicky,L.、Russell,C.、Sturgess,P.、Alahari,K.和;Torr,P.H.S.(2010年)。什么,在哪里,有多少?结合目标检测器和crf。欧洲计算机视觉会议。
[22] Lafferty,J.、McCallum,A.和;Pereira,F.(2001)。条件随机场:用于分割和标记序列数据的概率模型。在机器学习国际会议上。
[23] 拉鲁斯·D·;Jurie,F.(2008)。结合外观模型和马尔可夫随机场进行类别级对象分割。在IEEE计算机视觉和模式识别会议上。
[24] Narasimhan,M.和;Bilmes,J.A.(2005)。一个用于区分结构学习的子模块-超模块过程。《人工智能的不确定性》(第404–412页)。
[25] Rabinovich,A.、Vedaldi,A.、Galleguillos,C.、Wiewiora,E.和;Belongie,S.(2007)。上下文中的对象。在里约热内卢举行的计算机视觉国际会议上。
[26] Ren,X.、Fowlkes,C.和;Malik,J.(2005)。中级提示可以改进边界检测。加州大学伯克利分校EECS系技术代表UCB/CSD-05-1382。
[27] Rother,C.、Kumar,S.、Kolmogorov,V.和;Blake,A.(2005年)。数字挂毯。IEEE计算机视觉和模式识别会议(第589-596页)。
[28] Russell,B.、Freeman,W.、Efros,A.、Sivic,J.和;Zisserman,A.(2006年)。使用多个分割来发现图像集合中的对象及其范围。在IEEE计算机视觉和模式识别会议上。
[29] Russell,C.、Ladicky,L.、Kohli,P.和;Torr,P.H.S.(2010年)。使用图割的关联层次网络中的精确和近似推理。人工智能中的不确定性,加利福尼亚州卡塔利纳岛。
[30] Schlesinger,M.(1976年)。噪声条件下二维视觉信号的句法分析。Kibernetika,第4113–130页。(俄语)。
[31] Schölkopf,B.,&;Smola,A.J.(2001)。使用内核学习:支持向量机、正则化、优化及其他。采用计算与;机器学习。马萨诸塞州剑桥:麻省理工学院出版社。
[32] Shi,J.和;Malik,J.(2000)。标准化切割和图像分割。IEEE Trans-Pattern Ana Mach Intell,22(8),888–905。
[33] Shotton,J.、Winn,J.和Rother,C;克里米尼西,A.(2006)。TextonBoost:用于多类对象识别和分割的联合外观、形状和上下文建模。在欧洲计算机视觉会议上(第1卷,第1-15页)。
[34] Sturgess,P.、Ladicky,L.、Crook,N.和;Torr,P.H.S.(2012)。语义图像分割的可缩放级联推理。在英国机器视觉会议上。
[35] Szeliski,R.、Zabih,R.,Scharstein,D.、Veksler,O.、Kolmogorov,V.、Agarwala,A.等人(2006年)。马尔可夫随机场能量最小化方法的比较研究。在欧洲计算机视觉会议上。
[36] Torr,P.H.S.(1998年)。几何运动分割和模型选择[和讨论]。《哲学汇刊:数学、物理和工程科学》,356(1740),1321-1340·Zbl 0902.68201号
[37] Torralba,A.、Murphy,K.P.、Freeman,W.T.和;鲁宾,M.A.(2003)。用于位置和对象识别的基于上下文的视觉系统。第九届IEEE计算机视觉国际会议论文集。
[38] 丰田章男;Hasegawa,O.(2008)。用于集成局部信息和全局信息的随机场模型。IEEE模式分析和机器智能汇刊,30(8),1483-1489。
[39] Wainwright,M.、Jaakkola,T.和;Willsky,A.(2002)。通过(超)树协议进行地图估算:消息传递和线性规划方法。马萨诸塞州剑桥:麻省理工学院出版社。
[40] Wainwright,M.、Jaakkola,T.和;Willsky,A.(2005)。通过树协议进行地图估算:消息传递和线性规划。IEEE信息理论汇刊(第3697–3717页)·Zbl 1318.94025号
[41] Weiss,Y.,&;Freeman,W.(2001)。关于任意图中最大乘积信任传播算法解的最优性。IEEE信息理论汇刊,47(2),723–735·Zbl 1002.94057号
[42] 沃纳,T.(2007)。最大和问题的线性规划方法:综述。IEEE模式分析和机器智能汇刊,29(7),1165–1179。
[43] Yang,L.,Meer,P.和;Foran,D.J.(2007)。在均值漂移补丁上使用统一框架进行多类分割。在IEEE计算机视觉和模式识别会议上。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。