×

兹马思-数学第一资源

基于场景理解的平面均匀纹理鲁棒检测与仿射校正。(英语) Zbl 1458.68223
摘要:人造环境往往具有丰富的平面均匀纹理,表现为沿平面有规律的重复场景元素。在这项工作中,我们建议利用这种结构来促进高层次的场景理解。通过将纹理投影模型鲁棒地拟合到图像块中的最优主频估计,我们得到了一种投影不变的方法来定位这些在多平面场景中具有语义意义的区域。恢复的投影参数还允许在真实世界的图像中进行仿射模糊校正,这些图像中存在异常值、房间杂波和光度严重性。综合的定性和定量评估表明,我们的方法在纠正和检测方面都优于现有的代表性工作。然后探讨了均匀纹理在两个场景理解任务中的潜力。首先,在消失点无法可靠检测或曼哈顿假设不满足的环境中,利用该方法检测到的均匀纹理为场景几何布局提供了替代线索。其次,对检测到的纹理进行仿射校正后提取的低层特征描述子不仅具有类区分性,而且与未经校正的特征互补,提高了室内场景67类MIT基准测试的识别性能。我们的一个包含deep ConvNet特性的配置在这个数据集上的性能超过了当前最先进的工作,实现了76.90%的分类准确率。此外,该方法在一组31个类别(主要是表现出规则的重复结构的室外人造环境)上进行了验证,这是大型场所2场景数据集的一个子集。
理学硕士:
68T45型 机器视觉与场景理解
PDF格式 BibTeX公司 XML 引用
全文: 内政部
参考文献:
[1] Ahmad,S.和Cheong,L.-F.(2016年)。促进和探索用于室内场景理解的平面均匀纹理。欧洲计算机视觉会议论文集(第35-51页)。
[2] Aiger,D.,Cohen Or,D.和Mitra,N.J.(2012年)。基于重复最大化的纹理矫正。计算机图形学论坛(EUROGRAPHICS),31(2.2),439-448。
[3] Arandjelovi,R.和Zisserman,A.(2012年)。为了改进对象检索,每个人都应该知道三件事。IEEE计算机视觉与模式识别会议论文集(第2911-2918页)。
[4] Bappy,J.H.和Roy Chowdhury,A.K.(2016年)。用于联合场景和目标识别的相互依赖的cnn。国际模式识别会议论文集。
[5] Boureau,Y.-L.,Bach,F.,LeCun,Y.和Ponce,J.(2010年)。学习中级特征以进行识别。在IEEE计算机视觉和模式识别会议论文集(第2559-2566页)。
[6] Boykov,Y.,Veksler,O.和Zabih,R.(2001年)。基于图割的快速近似能量最小化。IEEE模式分析与机器智能汇刊,23(11),1222-1239。
[7] Chang,C.-C.和Lin,C.-J.(2011年)。支持向量机库。智能系统与技术学术论文集,2:27:1-27:27。软件可在http://www.csie.ntu.edu.tw/cjlin/libsvm。
[8] Chatfield,K.,Lempitsky,V.,Vedaldi,A.和Zisserman,A.(2011年)。魔鬼在于细节:对最近特征编码方法的评估。英国机器视觉会议论文集(第76.1-76.12页)。
[9] Chum,O.和Matas,J.(2010年)。仿射尺度变化的平面校正。亚洲计算机视觉会议论文集(第347-360页)。
[10] Cimpoi,M.,Maji,S.,Kokkinos,I.,Mohamed,S.和Vedaldi,A.(2014年)。描述野外的纹理。IEEE计算机视觉与模式识别会议论文集(第3606-3613页)。
[11] Cimpoi,M.,Maji,S.和Vedaldi,A.(2015年)。用于纹理重建和分割的深层滤波器组。IEEE计算机视觉与模式识别会议论文集(第3828-3836页)。
[12] Collins,T.,Durou,J.,Gurdjos,P.和Bartoli,A.(2010年)。基于焦距估计的纹理单视点透视形状:一种分段仿射方法。三维数据处理、可视化与传输(3DPVT)论文集。
[13] Coughlan,J.M.和Yuille,A.L.(1999年)。曼哈顿世界:通过贝叶斯推断从单一图像的罗盘方向。IEEE国际计算机视觉会议论文集(第941-947页)。
[14] Criminsi,A.和Zisserman,A.(2000年)。从质地看形状:同质化。英国机器视觉会议论文集(第8291页)。
[15] Dalal,N.和Triggs,B.(2005年)。用于人体检测的定向梯度直方图。IEEE国际计算机视觉会议论文集(第886-893页)。
[16] Doersch,C.,Gupta,A.和Efros,A.A.(2013年)。中级视觉元素发现作为区分模式寻找。神经信息处理系统学报(第494-502页)。
[17] Donahue*,J.,Jia*,Y.,Vinyals,O.,Hoffman,J.,Zhang,N.,Tzeng,E.和Darrell,T.(2014年)。DeCAF:一种用于一般视觉识别的深卷积激活特征。国际机器学习会议论文集。(*=同等贡献)。
[18] Eigen,D.和Fergus,R.(2015年)。用一个通用的多尺度卷积结构预测深度、表面法线和语义标签。IEEE国际计算机视觉会议论文集。
[19] Everingham,M.,Eslami,S.M.A.,Gool,L.V.,Williams,C.K.I.,Winn,J.和Zisserman,A.(2014年)。PASCAL可视化对象类挑战:回顾。IJCV,111(1),98-136。
[20] Felzenszwalb,P.F.,Girshick,R.B.,McAllester,D.和Ramanan,D.(2010年)。基于区分训练的零件模型的目标检测。IEEE模式分析与机器智能汇刊,32(9),1627-1645。
[21] Fischler,M.A.和Bolles,R.C.(1981年)。随机样本一致性:一种模型拟合的范例,用于图像分析和自动制图。ACM通讯,24(6),381-395。
[22] Gong,Y.,Wang,L.,Guo,R.和Lazebnik,S.(2014年)。深卷积激活特征的多尺度无序池。欧洲计算机视觉会议论文集(第392-407页)。
[23] Hartley,R.I.和Zisserman,A.(2004年)。计算机视觉中的多视图几何(第二版)。剑桥:剑桥大学出版社。国际标准书号:0521540518·Zbl 1072.68104
[24] Havlicek,J.P.,Bovik,A.C.和Maragos,P.(1992年)。图像处理和基于小波的图像解调的调制模型。阿西洛玛信号、系统和计算机会议记录(第805-810页)。
[25] Hedau,V.,Hoiem,D.和Forsyth,D.(2009年)。恢复杂乱房间的空间布局。IEEE国际计算机视觉会议论文集(1849-1856页)。
[26] Hoiem,D.,Efros,A.A.和Hebert,M.(2007年)。从图像恢复曲面布局。国际计算机视觉杂志,75(1),151-172·Zbl 1235.68268
[27] Hong,W.,Yang,A.Y.,Huang,K.和Ma,Y.(2004年)。关于对称和多视图几何:结构,姿势,和从一个图像校准。国际计算机视觉杂志,60(3),241-265。
[28] Huang,Y.,Wu,Z.,Wang,L.,和Tan,T.(2014年)。图像分类中的特征编码:综合研究。IEEE模式分析与机器智能汇刊,36(3),493-506。
[29] Jia,Y.,Shelhamer,E.,Donahue,J.,Karayev,S.,Long,J.,Girshick,R.,Guadarrama,S.和Darrell,T.(2014年)。Caffe:快速特征嵌入的卷积体系结构。arXiv预印本arXiv:1408.5093。http://caffe.berkeleyvision.org/。
[30] Juneja,M.,Vedaldi,A.,Jawahar,C.V.和Zisserman,A.(2013年)。叫喊块:场景分类的独特部分。在IEEE计算机视觉和模式识别会议论文集(第923-930页)。
[31] Kosecka,J.和Zhang,W.(2003年)。基于优势矩形结构的特征提取、匹配和位姿恢复。在第一届IEEE国际研讨会上,关于3D建模和运动分析的高级知识(第83-91页)。
[32] Krizhevsky,A.,Sutskever,I.和Hinton,G.E.(2012年)。深卷积神经网络分类。神经信息处理系统学报(第1097-1105页)。
[33] Krumm,J.和Shafer,S.(1992年)。使用光谱图从周期性纹理中提取形状。在IEEE计算机视觉和模式识别会议论文集(第284-289页)。
[34] Kulkarni,P.,Jurie,F.,Zepeda,J.,Prez,P.和Chevallier,L.(2016年)。SPLeaP:用于图像分类的学习部件的软池。欧洲计算机视觉会议论文集(第329-345页)。
[35] Lazebnik,S.,Schmid,C.和Ponce,J.(2006年)。超越特征包:用于识别自然场景类别的空间金字塔匹配。在IEEE计算机视觉和模式识别会议论文集(第2169-2178页)。
[36] Leung,T.和Malik,J.(1996年)。从图像中检测、定位和分组重复的场景元素。欧洲计算机视觉会议论文集(第546-555页)。
[37] Lian,X.-C.,Li,Z.,Lu,B.-L.,和Zhang,L.(2010年)。多类图像分类的最大边缘字典学习。欧洲计算机视觉会议论文集(第157-170页)。
[38] Lin,D.,Lu,C.,Liao,R.和Jia,J.(2014年)。学习用于场景分类的重要空间集合区域。在IEEE计算机视觉和模式识别会议论文集(第3726-3733页)。
[39] Liu,X.,Veksler,O.和Samarabandu,J.(2010年)。基于图割优化的保序移动。IEEE模式分析与机器智能汇刊,32(7),1182-1196。
[40] Lowe,D.G.(2004年)。基于尺度不变关键点的图像特征。国际计算机视觉杂志,60(2),91-110。
[41] Mikolajczyk,K.,Tuytelaars,T.,Schmid,C.,Zisserman,A.,Matas,J.,Schafalitzky,F.等人(2005年)。仿射区域检测器的比较。国际计算机视觉杂志,65(1-2),43-72。
[42] Ojala,T.,Pietikinen,M.和Menp,T.(2002年)。基于局部二值模式的多分辨率灰度和旋转不变纹理分类。IEEE模式分析与机器智能汇刊,24(7),971-987。
[43] Oliva,A.和Torralba,A.(2001年)。场景形状建模:空间包络的整体表示。国际计算机视觉杂志,42(3),145-175·Zbl 0990.68601
[44] Pandey,M.和Lazebnik,S.(2011年)。基于可变形部件模型的场景识别和弱监督目标定位。IEEE国际计算机视觉会议论文集(第1307-1314页)。
[45] Patterson,G.,Xu,C.,Su,H.和Hays,J.(2014年)。太阳属性数据库:超越类别,以便更深入地了解场景。国际计算机视觉杂志,108(1),59-81。
[46] Petkov,N.和Kruizinga,P.(1997年)。专门检测周期性和非周期性视觉刺激的视觉神经元的计算模型:条形和光栅细胞。生物控制论,76(2),83-96·邮政编码:0866.92005
[47] 皮卡德,R.W.(2010年)。视频和图像库模型协会。IBM系统杂志,35(3.4),292-312。
[48] Pritts,J.,Chum,O.和Matas,J.(2014年)。共面重复图案的检测、校正和分割。在IEEE计算机视觉和模式识别会议论文集(第2973-2980页)。
[49] Qi,M.和Wang,Y.(2016年)。深度CSSR:使用具有深特征的类别特定显著区域的场景分类。国际图像处理会议论文集。
[50] Quan,Y.,Xu,Y.,Sun,Y.,和Luo,Y.(2014年)。纹理分类中图像模式的缺陷性分析。在IEEE计算机视觉和模式识别会议论文集(第160-167页)。
[51] Quattoni,A.和Torralba,A.(2009年)。识别室内场景。在IEEE计算机视觉和模式识别会议论文集(第413-420页)。
[52] Razavian,A.S.,Azizpour,H.,Sullivan,J.和Carlsson,S.(2014年)。美国有线电视新闻网(CNN)的特色是现成的:一个惊人的识别基线。IEEE计算机视觉与模式识别研讨会论文集(第512-519页)。
[53] Renninger,L.W.和Malik,J.(2004年)。什么时候场景识别只是纹理识别?视觉研究,44(19),2301-2311。
[54] Ribeiro,E.和Hancock,E.R.(2000年)。利用局部谱分析估计纹理平面的三维方向。图像与视觉计算,18(8),619-631。
[55] Rosenholtz,R.和Malik,J.(1997年)。表面取向:各向同性还是均质(或两者兼而有之)?视觉研究,37(16),2283-2293。
[56] (2000年,罗瑟)。建筑环境中消失点检测的一种新方法。英国机器视觉会议论文集(第382-391页)。
[57] Russakovsky*,O.,Deng*,J.,Su,H.,Krause,J.,Satheesh,S.,Ma,S.,Huang,Z.,Karpathy,A.,Khosla,A.,Bernstein,M.,Berg,A.C.和Fei Fei,L.(2015年)。Imagenet大规模视觉识别挑战。国际计算机视觉杂志,115(3),211-252。(*=同等贡献)。
[58] Schafalitzky,F.和Zisserman,A.(1998年)。图像中重复元素的几何分组。英国机器视觉会议论文集(第165-181页)。
[59] Sermanet,P.,Eigen,D.,Zhang,X.,Mathieu,M.,Fergus,R.和LeCun,Y.(2014年)。Overfeat:使用卷积网络集成识别、定位和检测。学习表征国际会议论文集。http://cilvr.nyu.edu/doku.php?id=software:overfeat:start。
[60] Shaw,D.和Barnes,N.(2006年)。透视矩形检测。欧洲计算机视觉会议论文集计算机视觉应用研讨会。
[61] Simonyan,K.和Zisserman,A.(2015年)。用于大规模图像识别的非常深的卷积网络。学习表征国际会议论文集。
[62] Singh,S.,Gupta,A.和Efros,A.A.(2012年)。在无监督的情况下发现中级鉴别补丁。欧洲计算机视觉会议论文集(第73-86页)。
[63] Stella,X.Y.,Zhang,H.和Malik,J.(2008年)。通过深度有序分组从单个图像推断空间布局。在IEEE计算机视觉和模式识别研讨会上(第1-7页)。
[64] Super,B.J.和Bovik,A.C.(1991年)。基于gabor小波的纹理三维定位。1991年《视觉通信与图像处理学报:图像处理》。
[65] Super,B.J.和Bovik,A.C.(1995a)。基于纹理空间频率的平面表面定向。模式识别,28(5),729-743。
[66] Super,B.J.和Bovik,A.C.(1995年B)。使用局部光谱矩从纹理中提取形状。IEEE模式分析与机器智能汇刊,17(4),333-343。
[67] Szegedy,C.,Liu,W.,Jia,Y.,Sermanet,P.,Reed,S.,Anguelov,D.,Erhan,D.,Vanhoucke,V.和Rabinovich,A.(2015年)。卷积得更深。IEEE计算机视觉与模式识别会议论文集(第1-9页)。
[68] Tuytelaars,T.,Tuytelaars,T.,Turina,A.和Gool,L.V.(2003年)。透视倾斜下规则重复的非二进制检测。IEEE模式分析与机器智能汇刊,25(4),418-432。
〔69〕 Varma,M.和Zisserman,A.(2002年)。材料图像分类:实现视点和光照独立性。欧洲计算机视觉会议论文集(第255-271页)·Zbl 1039.68738号
[70] Vedaldi,A.和Fulkerson,B.(2008年)。VLFeat:一个开放的可移植的计算机视觉算法库。http://www.vlfeat.org/。
[71] Vedaldi,A.和Lenc,K.(2015年)。MatConvNet卷积神经网络。国际多媒体会议论文集。http://www.vlfeat.org/matconvnet/。
[72] Wu,C.,Frahm,J.-M.和Pollefeys,M.(2010年)。检测具有显著边界的大型重复结构。欧洲计算机视觉会议论文集(第142-155页)。
[73] Wu,C.,Frahm,J.-M.和Pollefeys,M.(2011年)。基于重复的密集单视图重建。在IEEE计算机视觉和模式识别会议论文集(第3113-3120页)。
[74] Wu,J.和Rehg,J.M.(2011年)。中间人:用于场景分类的视觉描述符。IEEE模式分析与机器智能汇刊,33(8),1489-1501。
[75] Wu,R.,Wang,B.,Wang,W.和Yu,Y.(2015年)。获取具有深度CNN特征的区分元对象用于场景分类。IEEE国际计算机视觉会议论文集。
[76] Xiao,J.,Ehinger,K.A.,Hays,J.,Torralba,A.和Oliva,A.(2016年)。SUN数据库:探索大量场景类别集合。国际计算机视觉杂志,119,3-22。
[77] Xie,L.,Wang,J.,Guo,B.,Zhang,B.,和Tian,Q.(2014年)。面向金字塔匹配的室内场景识别。在IEEE计算机视觉和模式识别会议论文集(第3734-3741页)。
[78] Yang,J.,Yu,K.和Huang,T.(2010年)。监督平移不变稀疏编码。IEEE计算机视觉与模式识别会议论文集(3517-3524页)。
[79] 张涛,2003。纹理图像的仿射不变分类与检索。模式识别,36(3),657-664。
[80] Zhang,J.,Marszaek,M.,Lazebnik,S.和Schmid,C.(2007年)。纹理和物体分类的局部特征和核:综合研究。国际计算机视觉杂志,73(2),213-238。
[81] Zhang,Z.(1998年)。确定极线几何及其不确定度:综述。国际计算机视觉杂志,27(2),161-195。
[82] Zhang,Z.,Liang,X.,Ganesh,A.和Ma,Y.(2010年)。倾斜:变换不变的低阶纹理。亚洲计算机视觉会议论文集(第314-328页)·Zbl 1254.68290
[83] Zhou,B.,Lapedriza,A.,肖,J.,Torralba,A.和Oliva,A.(2014年)。利用Places数据库学习场景识别的深层特征。神经信息处理系统学报。
[84] Zhou,B.,Khosla,A.,Lapedriza,A.,Torralba,A.和Oliva,A.(2016年)。地点:一个用于深入了解场景的图像数据库。arXiv预印本。http://places2.csail.mit.edu/。
[85] Zuo,Z.,Wang,G.,Shuai,B.,Zhao,L.,Yang,Q.和Jiang,X.(2014年)。学习用于场景分类的区分和共享特征。欧洲计算机视觉会议论文集(第552-568页)。
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。