×

从图像恢复遮挡边界。 (英语) Zbl 1235.68268号

摘要:遮挡推理是计算机视觉中的一个基本问题。本文提出了一种恢复场景中独立结构遮挡边界和深度排序的算法。我们的方法不是将问题视为一个纯粹的图像处理问题,而是使用估计的表面布局线索,并使用条件随机场(CRF)模型应用格式塔分组原则。我们提出了一种基于聚集合并的分层分割过程,该过程在分割过程中重新估计边界强度。我们在Geometric Context数据集上的实验验证了我们对特征的选择、我们对分类器的迭代求精以及我们的CRF模型。在Berkeley Segmentation Dataset、PASCAL VOC 2008和LabelMe上的实验中,我们还表明,经过训练的算法可以推广到其他数据集,并且可以用作带有图形/地面标签的对象边界预测器。

MSC公司:

68T45型 机器视觉和场景理解
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Ahuja,N.(1996年)。通过集成边缘和区域检测实现多尺度图像分割的变换。IEEE模式分析和机器智能汇刊,18(12)。http://dx.doi.org/10.109/34.546258 .
[2] Alexe,B.、Deselaers,T.和;Ferrari,V.(2010年)。什么是物体?在CVPR 2010中。
[3] Amir,A.和;Lindenbaum,M.(1998年)。一种通用分组算法及其定量分析。IEEE模式分析和机器智能汇刊,20(2)。http://dx.doi.org/10.109/34.659934 .
[4] Arbelaez,P.(2006)。使用超等高线图提取自然图像中的边界。程序中。POCV公司。
[5] Arbelaez,P.、Maire,M.、Fowlkes,C.和;Malik,J.(2009)。从等高线到区域:实证评估。在CVPR中。
[6] Bakin,J.S.、Nakayama,K.和;吉尔伯特博士(2000年)。猴子区域v1和v2对三维表面结构的视觉反应。神经科学杂志。
[7] 布莱克、M.J.和;Fleet,D.J.(2000)。运动不连续性的概率检测和跟踪。国际计算机视觉杂志,38(3),231-245·Zbl 1012.68694号 ·doi:10.1023/A:1008195307933
[8] Canny,J.(1986年)。边缘检测的计算方法。IEEE模式分析和机器智能汇刊,8(6),679–698·doi:10.1109/TPAMI.1986.4767851
[9] 曹,L.,刘,J.,&;Tang,X.(2005)。从没有隐藏线的单个二维线条图重建三维对象。在ICCV中。
[10] Clowes,M.(1971)。看东西的时候。人工智能,2(1),79-116·doi:10.1016/0004-3702(71)90005-1
[11] Collins,M.、Schapire,R.和;辛格,Y.(2002)。Logistic回归、Adaboost和Bregman距离。机器学习,48(1-3)·Zbl 0998.68123号
[12] Cour,T.、Benezit,F.和;Shi,J.(2005)。用多尺度图分解进行光谱分割。在CVPR中。
[13] Draper,S.(1981)。在线条图解释中梯度和对偶空间的使用。人工智能,17461–508·doi:10.1016/0004-3702(81)90032-1
[14] Elder,J.和;Zucker,S.(1996)。计算轮廓闭合。在ECCV中。
[15] Endres,I.和;Hoiem,D.(2010年)。独立于类别的对象建议。在ECCV中。
[16] Everingham,M.、Van Gool,L.、Williams,C.K.I.、Winn,J.和;Zisserman,A.(2008)。PASCAL可视对象类挑战2008(VOC2008)结果。http://www.pascal-network.org/challenges/VOC/voc2008/workshop/index.html .
[17] Farhadi,A.、Endres,I.和;Hoiem,D.(2010年)。以属性为中心的跨类别综合识别。在CVPR中。
[18] Felzenszwalb,P.和;Huttenlocher,D.(2004)。高效的基于图形的图像分割。国际计算机视觉杂志,59(2)。http://dx.doi.org/10.1023/B:VISI.0000022288.19776.77 .
[19] Gibson,J.(1950)。对视觉世界的感知。波士顿:霍顿·米夫林。
[20] Gould,S.、Gao,T.和;Koller,D.(2009年)。基于区域的分割和对象检测。在NIPS中。
[21] 古兹曼(1968)。视觉场景中三维物体的计算机识别。技术报告MAC-TR-59。麻省理工学院。
[22] Herault,L.和;Horaud,R.(1993年)。图形-背景识别:一种组合优化方法。IEEE模式分析和机器智能汇刊,15。http://dx.doi.org/10.109/34.232076 .
[23] Heskes,T.、Albers,K.和;Kappen,B.(2003)。近似推理和约束优化。程序中。阿拉伯联合酋长国。
[24] Hoiem,D.,Efros,A.A;Hebert,M.(2005)。自动弹出照片。在ACM SIGGRAPH 2005中。
[25] Hoiem,D.,Efros,A.A;Hebert,M.(2007)。从图像恢复曲面布局。国际计算机视觉杂志,75(1),151-172·Zbl 1235.68268号 ·doi:10.1007/s11263-006-0031-y
[26] Hoiem,D.,Efros,A.A;Hebert,M.(2008)。结束现场解释循环。在CVPR中。
[27] Hoiem,D.、Stein,A.N.、Efros,A.A.和;Hebert,M.(2007)。从图像恢复遮挡边界。在ICCV中·Zbl 1235.68268号
[28] 霍夫曼博士(1971年)。不可能的宾语是无意义的句子。机器智能,6295–323。
[29] Huffman,D.(1977年)。多面体图片中线条的可实现配置。机器智能,8493–509。
[30] 雅各布斯·D(1993)。稳健有效的凸群检测。在CVPR中。
[31] Jain,R.和;Aggarwal,J.(1979)。曲面物体场景的计算机分析。IEEE会议录,67(5),805–812·doi:10.1109/PROC.1979.11329
[32] Jermyn,我,&石川浩(2001)。作为最小比率权重循环的全局最优区域和边界。IEEE模式分析和机器智能汇刊,23(10),1075-1088·Zbl 05112416号 ·doi:10.1109/34.954599
[33] Kanade,T.(1980)。折纸世界的理论。人工智能,13279–311·Zbl 0497.68059号 ·doi:10.1016/0004-3702(80)90004-1
[34] Kim,S.J.、Koh,K.、Lustig,M.、Boyd,S.和;Gorinevsky,D.(2007年)。大规模l1-正则logistic回归的内点方法。机器学习研究杂志,81519–1555·Zbl 1222.62092号
[35] 科瓦茨,I.,&;Julesz,B.(1993年)。闭合曲线远不止是不完整曲线:闭合对图形-背景识别的影响。程序中。美国国家科学院,90。
[36] Kumar,M.P.、Torr,P.和;Zisserman,A.(2010年)。直截了当:使用自上而下和自下而上的线索进行有效分割。IEEE模式分析和机器智能汇刊,32530-545·doi:10.1109/TPAMI.2009.16
[37] Lalonde,J.-F.、Hoiem,D.、Efros,A.A.、Rother,C.、Winn,J.和;克里米尼(2007)。照片剪辑艺术。ACM SIGGRAPH 2007。
[38] 勒克莱尔,Y.,&Fischler,M.(1992)。将单线图解释为三维线框的基于优化的方法。国际计算机视觉杂志,9(2)。http://dx.doi.org/10.1007/BF00129683 .
[39] Lee,S.-I.,Ganapathi,V.和;Koller,D.(2007)。使用L1正则化的马尔可夫网络的有效结构学习。在NIPS中。
[40] 莱希特,I.,&;Lindenbaum,M.(2009年)。边界所有权提升至2.1D。在NIPS中。
[41] Leung,T.和;Malik,J.(1998)。基于区域的图像分割中的轮廓连续性。在ECCV中。
[42] Li,F.、Carreira,J.和;Sminchisescu,C.(2010年)。物体识别作为排名整体图形背景假设。在CVPR中。
[43] Lipson,H.和;Shpitalni,M.(1996)。从单个手绘线条图中基于优化的三维对象重建。计算机辅助设计,28(8)。
[44] Lowe,D.(1985)。感知组织和视觉识别。Kluwer学术:诺威尔。
[45] Mahamud,S.、Williams,L.R.、Thornber,K.K.和;Xu,K.(2003)。从真实图像中分割多个显著的闭合轮廓。IEEE模式分析和机器智能汇刊,25(4)。http://dx.doi.org/10.1109/TPAMI.2003.1190570 .
[46] Maire,M.、Arbelaez,P.、Fowlkes,C.和;Malik,J.(2008)。使用轮廓检测和定位自然图像中的连接。在CVPR中。
[47] Malik,J.(1987)。解释弯曲物体的线条图。国际计算机视觉杂志,1(1),73-103·doi:10.1007/BF00128527
[48] Marill,T.(1991)。模拟线条图作为三维对象的人类解释。国际计算机视觉杂志,6(2)。http://dx.doi.org/10.1007/BF00128154 .
[49] Martin,D.、Fowlkes,C.和;Malik,J.(2002)。学习在自然图像中寻找亮度和纹理边界。在NIPS中。
[50] Martin,D.、Fowlkes,C.、Tal,D.和;Malik,J.(2001)。人类分割自然图像数据库及其在评估分割算法和测量生态统计中的应用。在ICCV中。
[51] Martin,D.R.、Fowlkes,C.C.和;Malik,J.(2004)。学习使用局部亮度、颜色和纹理线索检测自然图像边界。IEEE模式分析和机器智能汇刊,26(5),530-549·Zbl 05111303号 ·doi:10.1109/TPAMI.2004.1273918
[52] 麦克德莫特,J.(2004)。真实图像中有连接点的心理物理学。感知,33(9),1101–1127·doi:10.1068/p5265
[53] Ng,A.Y.(2004)。特征选择、L1与L2正则化以及旋转不变性。在ICML中。
[54] Nitzberg,M.和;Mumford,D.(1990年)。2.1-D草图。在ICCV中。
[55] 佩罗纳,P.,&;Freeman,W.(1998)。分组的因式分解方法。在ECCV中。
[56] Prasad,M.、Zisserman,A.、Fitzgibbon,A.、Kumar,M.和;Torr,P.(2006年)。学习用于对象检测和分割的类特定边缘。在ICCV中。
[57] Ren,X.、Fowlkes,C.C.和;Malik,J.(2006)。自然图像中的图形/地面指定。在ECCV中。
[58] Ren,X.和;Malik,J.(2003)。学习用于分割的分类模型。在ICCV中。
[59] 罗伯茨(1965)。三维实体的机器感知。在OEOIP中,第159-197页。
[60] Russell,B.C.,Efros,A.A.,Sivic,J.,Freeman,W.T.,&;Zisserman,A.(2006年)。使用多个分割来发现图像集合中的对象及其范围。在CVPR中。
[61] Sarkar,S.和;Soundararajan,P.(2000年)。大型感知组织的监督学习:图谱划分和学习自动机。IEEE模式分析和机器智能汇刊,22(5)。http://dx.doi.org/10.109/34.857006 .
[62] Saund,E.(2006)。用于标记闭塞和细化视觉轮廓的逻辑和MRF电路。在NIPS中。
[63] Saxena,A.、Chung,S.和;Ng,A.Y.(2005)。从单目图像学习深度。在NIPS中。
[64] Saxena,A.、Chung,S.H.和;Ng,A.Y.(2007)。从单个静止图像进行三维深度重建。《国际计算机视觉杂志》,76。http://dx.doi.org/10.1007/s11263-007-0071-y .
[65] Shi,J.和;Malik,J.(2000)。标准化切割和图像分割。IEEE模式分析和机器智能汇刊,22(8)。http://dx.doi.org/10.109/34.868688 .
[66] Shoji,K.、Kato,K.和;富山,F.(2001)。基于熵最小化原理的单线图三维解释。在ICCV中。
[67] Smith,P.、Drummond,T.和;Cipolla,R.(2004)。通过跟踪边缘进行分层运动分割和深度排序。IEEE模式分析和机器智能汇刊,26(4),479–494·Zbl 05111090号 ·doi:10.1109/TPAMI.2004.1265863
[68] 斯坦因,A.N.,&Hebert,M.(2006年a)。视频中遮挡边界的局部检测。在BMVC中。
[69] A.N.Stein,&;Hebert,M.(2006年b)。使用时空补丁同时估计边缘强度、方向和运动。CVPR的In Beyond补丁研讨会。
[70] Stein,A.N.、Hoiem,D.和;Hebert,M.(2007)。学习使用运动提示查找对象边界。在ICCV中。
[71] Sugihara,K.(1984年a)。形状-形状-图像问题的代数方法。人工智能,23,59-95·兹伯利0537.68092 ·doi:10.1016/0004-3702(84)90005-5
[72] Sugihara,K.(1984年b)。图片表示多面体场景的充分必要条件。IEEE模式分析和机器智能汇刊,6(5),578–586·doi:10.1109/TPAMI.1984.4767571
[73] Vaillant,R.和;Faugeras,O.(1992)。使用极值边界进行三维对象建模。IEEE模式分析和机器智能汇刊,14(2),157-173·Zbl 05110716号 ·doi:10.1109/34.121787
[74] 维奥拉·P·;Jones,M.J.(2004年)。强大的实时人脸检测。国际计算机视觉杂志,57(2)。http://dx.doi.org/10.1023/B:VISI.0000013087.49260.fb .
[75] Waltz,D.L.(1975)。了解带有阴影的场景的线条图。在P.Winston(Ed.),《计算机视觉心理学》(第19-91页)。McGraw-Hill,纽约。
[76] Wertheimer,M.(1938年)。感性形式的组织规律。在W.D.Ellis(Ed.),格式塔心理学的资料书中。伦敦劳特利奇。
[77] Yuille,A.L.(2002)。最小化Bethe和Kikuchi自由能的CCCP算法:信念传播的收敛替代方案。神经计算,14(7)·Zbl 1051.68121号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。