×

基于约束凸优化的2.1D草图单目提取。 (英语) Zbl 1398.68632号

小结:本文提出了一种从单目低水平视觉线索估计2.1D草图的方法。我们使用低层分割器将图像分割为多个区域,然后根据图形背景和相邻区域之间的相似性约束估计其2.1D草图。2.1D草图为预期与场景中的对象和曲面相对应的图像区域指定深度顺序。这是一个约束凸优化问题,并在优化传递框架内求解。优化目标考虑了区域边界部分的曲率和凸性、区域的外观和空间布局属性。我们的新优化传输算法允许对偶间隙的闭合形式表达式,从而允许显式计算所达到的精度。该算法在图像区域之间的约束数量上具有二次复杂度,是有效的。伯克利分割、几何上下文和斯坦福Make3D数据集富有挑战性的真实世界图像的定量和定性结果证明了我们的高准确性、高效性和鲁棒性。

MSC公司:

68单位10 图像处理的计算方法
90C25型 凸面编程
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Adelson,E.H.(1995)。视觉和视频的分层表示。在:IEEE视觉场景表示研讨会论文集.
[2] 阿方索,M;Bioucas Dias,J;Figueiredo,M,使用可变分割和约束优化的快速图像恢复,IEEE图像处理汇刊,192345-2356,(2010)·Zbl 1371.94018号 ·doi:10.1109/TIP.2010.2047910
[3] Ahuja,N.和Todorovic,S.(2008年)。连通分割树——区域布局和层次的联合表示。在:IEEE计算机视觉和模式识别会议记录.
[4] Alon,N,排名锦标赛,SIAM J.离散数学。,20, 137-142, (2006) ·Zbl 1112.05043号 ·doi:10.1137/050623905
[5] Amer,M.、Raich,R.和Todorovic,S.(2010年)。2.1D草图的单目提取。在:国际图像处理会议记录. ·Zbl 1398.68632号
[6] 阿贝莱兹,P;Maire,M;Fowlkes,C;Malik,J,轮廓检测和分层图像分割,IEEE TPAMI,33,898-916,(2011)·doi:10.1109/TPAMI.2010.161
[7] 巴诺伊,A;Naor,J,比赛中的排序、最小反馈集和Hamilton路径,SIAM离散数学杂志,3,7-20,(1990)·Zbl 0686.68052号 ·数字对象标识代码:10.1137/0403002
[8] Boyd,S.和Vandenberghe,L.(2004)。凸优化剑桥:剑桥大学出版社·Zbl 1058.90049号 ·doi:10.1017/CBO9780511804441
[9] 夏比特,P;托马斯,S;Yeo,A,最小反馈弧集问题是锦标赛的NP-hard,组合数学,概率与计算,16,1-4,(2007)·Zbl 1120.05038号 ·doi:10.1017/S0963548306007887
[10] 科马尼丘,D;Meer,P,Meanshift:一种稳健的特征空间分析方法,IEEE TPAMI,24,603-619,(2002)·doi:10.1109/34.1000236
[11] 达雷尔,T;Pentland,A,使用支持层的合作稳健估计,IEEE TPAMI,17,474-487,(1995)·数字对象标识代码:10.1109/34.391395
[12] Darrell,T.和Wohn,K.(1988年)。基于金字塔的焦点深度。在:CVPR’88计算机学会会议记录.
[13] Dimiccoli,M.和Salembier,P.(2009年)。基于层次区域的表示,用于分割和过滤单个图像中的深度。在:IEEE图像处理国际会议.
[14] Esedoglu,S;March,R,有深度但没有检测交叉点的分割,数学成像与视觉杂志,18,7-15,(2003)·Zbl 1033.68132号 ·doi:10.1023/A:1021837026373
[15] 法瓦罗,P;索托,S;汉堡,M;Osher,S,通过扩散散焦形成的形状,IEEE TPAMI,30,518-531,(2008)·doi:10.1109/TPAMI.2007.1175
[16] 福克斯,CC;Martin,DR;Malik,J,《局部图形地面线索对自然图像有效》,《视觉杂志》,7,2,(2007)·doi:10.1167/7.8.2
[17] Fragkiadaki,K.和Shi,J.(2010年)。图形-地面图像分割有助于弱化对象的监督学习。在:欧洲计算机视觉ECCV会议记录.
[18] Gao,R.,Wu,T.,Zhu,S.,&Sang,N.(2007)。混合马尔可夫随机场层表示的贝叶斯推断。在:欧洲计算机视觉会议论文集EMMCVPR.
[19] Gould,S.、Fulton,R.和Koller,D.(2009年)。将场景分解为几何和语义一致的区域。在:计算机视觉国际会议论文集,(第1-8页)。
[20] Gu,C.、Lim,J.J.、Arbelaez,P.和Malik,J.(2009)。使用区域进行识别。在:IEEE计算机视觉和模式识别会议记录.
[21] 郭,C;朱,S;Wu,Y,《原始素描:整合纹理和结构》,《计算机视觉和图像理解》,106,5-19,(2007)·doi:10.1016/j.cviu.2005.09.004
[22] He,K.、Sun,J.和Tang,X.(2009年)。使用暗通道去除单幅图像的雾霾。在:IEEE计算机视觉和模式识别会议记录.
[23] Hoiem,D.、Efros,A.和Hebert,M.(2008年)。在场景解释中关闭循环。在:IEEE计算机视觉和模式识别会议记录.
[24] 霍伊姆,D;埃弗罗斯,A;Hebert,M,从图像中恢复遮挡边界,IJCV,91,328-346,(2010)·Zbl 1235.68268号 ·doi:10.1007/s11263-010-0400-4
[25] 霍伊姆,D;埃弗罗斯,AA;Hebert,M,自动弹出照片,ACM图形事务,24577-584,(2005)·doi:10.1145/1073204.1073232
[26] Hoiem,D.、Efros,A.A.和Hebert,M.(2005)。单个图像的几何上下文。在:IEEE计算机视觉国际会议论文集(第654-661页)。
[27] 亨特,D;Lange,K,MM算法教程,《美国统计学家》,58,30-38,(2004)·doi:10.1198/0003130042836
[28] Hwang,T.、Clark,J.和Yuille,A.(1989)。使用离焦信息的深度恢复算法。在:IEEE计算机学会计算机视觉和模式识别会议论文集(第476-482页)。
[29] Jia,Z.、Gallagher,A.、Chang,Y.J.和Chen,T.(2012)。基于学习的深度排序框架“计算机视觉和模式识别ieee会议”。在:IEEE计算机视觉和模式识别会议记录.
[30] Kenyon-Mathieu,C.和Schudy,W.(2007年)。如何在很少出错的情况下进行排名。在:美国计算机学会计算理论研讨会论文集(STOC),第95-103页·Zbl 1232.68181号
[31] 克里希南,A;Ahuja,N,使用非正面成像相机从焦距估计距离,IJCV,20169-186,(1996)·doi:10.1007/BF00208718
[32] Leichter,I.和Lindenbaum,M.(2009年)。边界所有权提升至2.1d。在:计算机视觉国际会议论文集,(第9-16页)。
[33] Liu,B.、Gould,S.和Koller,D.(2010年)。基于预测语义标签的单幅图像深度估计。在:IEEE计算机视觉与模式识别会议论文集.
[34] Malik,J.和Maydan,D.(1989)。从弯曲对象的单个图像恢复三维形状。TPAMI公司,11(6), 555-566.
[35] Marr,D.(1979年)。视觉信息处理:视觉表现的结构和创造。在:国际人工智能联合会议记录.
[36] Martin,D.、Fowlkes,C.、Tal,D.和Malik,J.(2001)。人类分割自然图像数据库及其在评估分割算法和测量生态统计中的应用。在:IEEE计算机视觉国际会议论文集.
[37] Mathieu,C.和Schudy,W.(2011年)。如何以更少的错误排名:比赛中设置反馈弧的PTAS。美国计算机学会期刊, 95-103.
[38] Morel,J.和Salembier,P.(2008)。非线性扩散的单目深度。在:印度计算机视觉、图形和图像处理会议记录(第95-102页)。
[39] Nitzberg,M.和Mumford,D.(1990年)。2.1-D草图。在:计算机视觉国际会议论文集,(第138-144页)。
[40] 彭特兰,AP,《景深的新感觉》,IEEE TPAMI,9523-531,(1987)·doi:10.1109/TPAMI.1987.4767940
[41] 拉贾戈帕兰,A;Chaudhuri,S,从散焦图像恢复深度的变分方法,IEEE TPAMI,19,1158-1164,(1997)·doi:10.1109/34.625126
[42] Ren,X.、Fowlkes,C.C.和Malik,J.(2006)。自然图像中的图形/地面指定。在:欧洲计算机视觉ECCV会议记录(第614-627页)。
[43] Roy-Chowdhury,A.K.和Chellappa,R.(2005)。单目视频三维重建中的统计偏差。IEEE图像处理学报TIP 14(8), 1057-1062.
[44] Saund,E.(1999)。由不透明表面生成的遮挡轮廓的感知组织。在:IEEE计算机学会计算机视觉和模式识别会议记录(第2卷,第624-630页)。
[45] Saxena,A型;孙,M;Ng,AY,Make3D:从单个静态图像学习3D场景结构,IEEE TPAMI,31824-840,(2009)·doi:10.1109/TPAMI.2008.132
[46] Scharstein,D.和Pal,C.(2007年)。学习立体声的条件随机场。在:IEEE计算机视觉和模式识别会议记录. ·Zbl 1254.68280号
[47] Stamm,H.(1991)。平面有向图中的反馈问题柏林/海德堡:施普林格。
[48] Sun,M.、Bradski,G.R.、Xu,B.X.和Savarese,S.(2010年)。用于关节对象检测和形状恢复的深度编码Hough投票。在:欧洲计算机视觉ECCV会议记录(第658-671页)。
[49] Varma,M.和Garg,R.(2007年)。统计纹理分类的局部不变分形特征。在:计算机视觉国际会议论文集.
[50] Vecera,SP;沃格尔,EK;GF Woodman,Lower region:图形地面作业的新线索,《实验心理学杂志:总论》,131194-205,(2002)·doi:10.1037/0096-3445.131.2.194
[51] 赖特,S;诺瓦克,R;Figueiredo,M,通过可分离近似进行稀疏重构,IEEE信号处理汇刊,572479-2493,(2009)·Zbl 1391.94442号 ·doi:10.1109/TSP.2009.2016892
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。