×

物体部分重要性的形状可重构性度量及其在物体检测和定位中的应用。 (英语) Zbl 1328.68271号

摘要:我们提出了一个计算二维物体形状部分重要性的计算模型,并将其应用于检测和定位有遮挡和无遮挡的物体。形状部分(局部轮廓碎片)的重要性是从其对物体整体形状感知和识别的贡献角度考虑的。因此,零件重要性度量是基于从局部零件估计/回忆对象全局形状的能力来定义的,即零件的“形状可重构性”。更准确地说,零件的形状可重构性由两个因素决定——零件变化和零件唯一性。(i) 零件变化衡量全局形状重建的精度,即重建的全局形状与真实物体形状的一致性;以及(ii)部件唯一性量化了部件与对象匹配的模糊性,即考虑到部件可以在多个不同位置与对象匹配。考虑到这两个因素,提出了一种信息论公式,用零件重构物体形状的条件熵来衡量零件的重要性。实验结果表明,该算法在目标检测中具有一定的优势,包括检测率、定位精度和检测效率的提高。在具有挑战性但常见的场景中,通过与其他心脏状态目标检测器(带遮挡的目标检测)进行比较,我们发现使用所提出的重要性度量可以显著改进,检测率提高了10%以上。在具有挑战性的PASCAL数据集的子集上,插值平均精度(如PASCAL VOC质询中使用的)提高了4-8%。此外,我们进行了一项心理学实验,该实验提供了证据,表明人类在感知和识别形状时,对部分重要性使用了类似的度量。

MSC公司:

68单位10 图像处理的计算方法
68T45型 机器视觉和场景理解
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Bai、X.和;Latecki,L.(2008)。路径相似性骨架图匹配。IEEE事务模式分析与机器智能,30(7),1282-1292·doi:10.1109/TPAMI.2007.70769
[2] Belongie,S.、Malik,J.和;Puzicha,J.(2002)。使用形状上下文进行形状匹配和对象识别。IEEE模式分析和机器智能汇刊(PAMI),24(4),509C522·doi:10.1009/34.993558
[3] Biederman,I.(1987)。成分识别:人类图像理解理论。《心理评论》,92,115–147·doi:10.1037/0033-295X.94.2.115
[4] 比德曼,I.,&;库珀,E.E.(1991)。启动轮廓删除图像:视觉对象识别中中间表示的证据。认知心理学,23393-419·doi:10.1016/0010-0285(91)90014-F
[5] Bouchard,G.和;Triggs,B.(2005年)。基于层次部件的视觉对象分类。在IEEE计算机视觉和模式识别会议上。
[6] Bower,G.H.和;Glass,A.L.(2011)。结构单元和图片碎片的再整合能力。实验心理学杂志,2456-466。
[7] 蔡海燕;Mikolajczyk,K.(2010年)。图像分类和检索中码本的学习权重。在IEEE计算机视觉和模式识别会议上。
[8] Chui,H.和;Rangarajan,A.(2003年)。一种新的非刚性配准点匹配算法。计算机视觉和图像理解,89(2-3),114-141·兹比尔1053.68123 ·doi:10.1016/S1077-3142(03)00009-2
[9] Cootes,T.F.、Taylor,C.J.、Cooper,D.H.和;Graham,J.(1995)。主动形状模型——它们的训练和应用。计算机视觉与图像理解,61(1),38-59。
[10] 克兰德尔·D·J;Huttenlocher,D.(2006年)。视觉对象识别中基于局部空间模型的弱监督学习。在欧洲计算机视觉会议上。
[11] A.杜宾斯基;朱S.C.(2003)。用于动画形状和零件的多尺度生成模型。IEEE计算机视觉国际会议论文集。
[12] Duchi,J.、Shalev-Shwartz,S.、Singer,Y.和;Chandra,T.(2008年)。高效投射到l1球上,用于高维学习。在机器学习国际会议上。
[13] Epshtein,B.和;Ullman,S.(2007)。用于识别对象和部件的语义层次结构。在IEEE计算机视觉和模式识别会议上。
[14] Everingham,M.、Gool,L.V.、Williams,C.K.I.、Winn,J.和;Zisserman,A.(2010年)。pascal可视对象类(voc)挑战。国际计算机视觉杂志(IJCV),88(2),303–338·doi:10.1007/s11263-009-0275-4
[15] Felzenszwalb,P.F.和;Huttenlocher,D.P.(2005)。用于物体识别的图形结构。国际计算机视觉杂志(IJCV),61(9),55–79。
[16] Felzenszwalb,P.F.、Girshick,R.B.、McAllester,D.和;Ramanan,D.(2009年)。视觉对象识别中基于局部空间模型的弱监督学习。计算机视觉和模式识别(CVPR)。
[17] 法拉利,V.,Tuytelaars,T.,&;Gool,L.V.(2006)。轮廓分段网络的目标检测。在欧洲计算机视觉会议(ECCV)中,数据集。www.vision.ee.ethz.ch/\(\sim\)calvin/datasets.html·Zbl 1098.68761号
[18] 法拉利,V.,费弗里尔,L.,朱莉,F;Schmid,C.(2008)。用于对象检测的相邻轮廓段的组。在IEEE模式分析和机器智能学报(PAMI)中。
[19] 法拉利,V.,Jurie,F.,&;Schmid,C.(2009)。从图像到物体检测的形状模型。国际计算机视觉杂志(IJCV)。104, 2–3.
[20] Freifeld,O.、Weiss,A.、Zuffi,S.和;布莱克,M.J.(2010)。轮廓人:二维关节人体形状的参数化模型。在IEEE会议上,计算机视觉和Patt识别。
[21] Gopalan,R.、Turaga,P.和;Chellappa,R.(2010年)。非平面形状的铰接不变表示。在欧洲计算机视觉会议上。
[22] 霍夫曼,D.D.,&;Richards,W.(1984)。识别的一部分。认知,18,65–96。
[23] 霍夫曼,D.D.,&;Singh,M.(1997)。视觉部分的显著性。认知,63,29–78·doi:10.1016/S0010-0277(96)00791-3
[24] Hubel,D.H.和;Wiesel,T.N.(1962年)。猫视觉皮层的感受野、双眼交互作用和功能结构。神经生理学杂志,160,106-154。
[25] Ion,A.、Artner,N.M.、Peyre,G.、Kropatsch,W.G.和;Cohen,L.D.(2011)。使用偏心变换匹配2d和3d铰接形状。实验心理学杂志,115(6),817-834。
[26] Jurie,F.和;Schmid,C.(2004年)。用于对象类别识别的缩放不变形状特征。在IEEE计算机视觉和模式识别会议上。数据集:lear.rialpes.fr/data。
[27] Siddiqi BK,K.和;Tresness,K.(1996年)。视觉形式的部分:心理物理方面。感知,25399-424。
[28] Kanizza,G.和;Gerbino,W.(1982)。性爱完成:看还是想?在J Beck(Ed)中。感知中的组织和表现。新泽西州希尔斯代尔:劳伦斯·埃尔鲍姆协会(Lawrence Erlbaum Associates),(第167-190页)。
[29] Kersten,D.、Mamassian,P.和;Yuille,A.(2004年)。作为贝叶斯推理的对象感知。《心理学年鉴》。
[30] Kimia,B.、Frankel,I.和;Popescu,A.(2003)。用于形状完成的Euler螺旋。国际计算机视觉杂志,54(1/2),157-180·Zbl 1076.68096号
[31] Kira,K.和;伦德尔,洛杉矶(1992)。一种实用的特征选择方法。在第九届机器学习国际会议上。
[32] Lin,L.,Wang,X.,Yang,W.,&;Lai,J.(2012)。使用与或树表示法学习基于轮廓碎片的形状模型。IEEE会议计算机视觉和模式识别。
[33] Liu,H.,Liu,W.和;Latecki,L.J.(2010)。凸形分解。在IEEE计算机视觉和模式识别会议上。
[34] Lu,C.,Latecki,L.J.,Adluru,N.,Yang,X.,&;Ling,H.(2009)。使用粒子过滤器的形状引导轮廓分组。在IEEE国际计算机视觉会议论文集上。
[35] 罗,P.,林,L.,&;Chao,H.(2010)。通过使用多个距离度量量化曲线段来学习形状检测器。在欧洲计算机视觉会议上。
[36] Ma,T.和;Latecki,L.J.(2011)。从局部变形的局部形状匹配到用于目标检测的鲁棒全局形状相似性。在IEEE计算机视觉和模式识别会议上。
[37] 马吉,S.,&;Malik,J.(2009)。用于对象检测的最大边缘霍夫变换。在IEEE计算机视觉和模式识别会议上。
[38] Martin,D.、Fowlkes,C.和;Malik,J.(2004)。学习使用局部亮度、颜色和纹理提示来检测自然图像边界。IEEE Patt分析和机器智能汇刊(PAMI),26(5),530-549·doi:10.1109/TPAMI.2004.1273918
[39] Mikolajczyk,K.、Schmid,C.和;Zisserman,A.(2004)。基于稳健零件检测器概率集合的人体检测。在欧洲计算机视觉会议上·Zbl 1098.68818号
[40] Ommer,B.和;Malik,J.(2009)。基于聚类线的多尺度目标检测。在计算机视觉国际会议上。
[41] Opelt,A.、Pinz,A.和;Zisserman,A.(2008)。学习多类对象检测的形状和外观字母表。国际计算机视觉杂志,80(1),45-57。
[42] Felzenszwalb,P.、McAllester,D.和;Girshick,R.(2010)。使用可变形零件模型进行级联对象检测。在IEEE计算机视觉和模式识别会议上。
[43] Ravishankar,S.、Jain,A.和;Mittal,A.(2008)。基于多阶段轮廓的可变形物体检测。在欧洲计算机视觉会议上。
[44] Renninger,L.K.、Verghese,P.和;Coughlan,J.(2007)。下一步该怎么办?眼球运动减少了局部的不确定性。《视觉杂志》,7(3),1-17·doi:10.1167/7.3.6
[45] Rensink,R.A.和;Enns,J.T.(1998)。提前完成遮挡对象。视觉研究,38,2489–2505·doi:10.1016/S0042-6989(98)00051-0
[46] Riemenschneider,H.、Donoser,M.和;Bischof,H.(2010)。使用部分边缘轮廓匹配进行有效的对象类别定位。在欧洲计算机视觉会议上。
[47] Sala,P.和;Dickinson,S.(2010)。使用简单零件模型进行轮廓分组和抽象。在欧洲计算机视觉会议上。
[48] Schneiderman,H.和;Kanade,T.(2004)。使用部件统计信息进行对象检测。国际计算机视觉杂志,60(2),135–164。
[49] Schnitzspan,P.、Roth,S.和;Schiele,B.(2010年)。使用潜在CRF自动发现有意义的对象部分。在IEEE计算机视觉和模式识别会议上。
[50] Sharvit,D.、Chan,J.、Tek,H.和;Kimia,B.B.(1998年)。基于对称的图像数据库索引。视觉传达与图像表征杂志,9(4),366–380·doi:10.1006/jvci.1998.0396
[51] Shawe-Taylor,J.和;克里斯蒂亚尼尼(2004)。模式分析的核心方法。剑桥:剑桥大学出版社·Zbl 0994.68074号
[52] Shotton,J.、Blake,A.和;Cipolla,R.(2008)。使用轮廓片段的多尺度分类对象识别。在IEEE模式分析和机器智能学报(PAMI)中。
[53] Srinivasan,P.、Zhu,Q.和;Shi,J.(2010)。多对一轮廓匹配用于描述和区分对象形状。在IEEE会议计算机视觉和模式识别。
[54] Sukumar,S.R.、Page,D.L.、Koschan,A.F.、Gribok,A.V.和;Abidi,M.A.(2006年)。用于识别三维对象的感知信息部分的形状度量。第三届三维数据处理、可视化和传输(3DPVT)国际研讨会论文集。
[55] Toshev,A.、Taskar,B.和;Danilidis,K.(2012年)。通过边界结构分割进行基于形状的目标检测。国际计算机视觉杂志(IJCV),99(2),123–146·Zbl 1254.68285号 ·doi:10.1007/s11263-012-0521-z
[56] Ullman,S.(2007)。通过基于片段的层次结构进行对象识别和分割。认知科学趋势,11,58-64·doi:10.1016/j.tics.2006.11.009
[57] 王,X,白,X,马,T,刘,W,&;Latecki,L.J.(2012)。用于对象检测的扇形模型。在IEEE计算机视觉和模式识别会议上。
[58] Yarlagadda,P.和;Ommer,B.(2012)。从有意义的轮廓到有区别的物体形状。在欧洲计算机视觉会议上。
[59] Yarlagadda,P.、Monroy,A.和;Ommer,B.(2010年)。通过将相关部分分组进行投票。在欧洲计算机视觉会议上。
[60] Zhu,L.,Chen,Y.,Yuille,A.,&;Freeman,W.(2010年)。用于对象检测的潜在层次结构学习。在IEEE计算机视觉和模式识别会议上。
[61] Zhu,Q.,Wang,L.,Wu,Y.,&Shi,J.(2008)。用于对象检测的轮廓上下文选择:一种集对集的轮廓匹配方法。在欧洲计算机视觉会议上。
[62] Zhu,S.C.,Wu,Y.N.,&;Mumford,D.B.(1998年)。过滤器、随机场和最大熵(帧):走向纹理建模的统一理论。IEEE模式分析和机器智能汇刊(PAMI)。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。