×

使用二进制和单类分类器级联的视觉对象检测。 (英语) 兹比尔1455.68219

摘要:我们描述了一种有效的视觉对象检测方法,该方法使用短级联的非对称“一类”分类器在滑动窗口框架内快速拒绝否定(窗口不以所需类的对象为中心)。电流检测器通常使用二进制鉴别器,如支持向量机或Boosting来实现级联的每个阶段。它们对称地对待积极类和消极类。我们认为这是次优的,因为目标探测器通常会看到大量内容极其多样的负窗口,而只有少数内容相对一致的正窗口。我们表明,侧重于对罕见的、连贯的正类的范围进行紧密建模的不对称表示可以导致更简单的分类器和更快的拒绝。我们的级联使用基于简单凸模型的非对称分类器来逐步收紧正类的界。它们通常首先使用传统的线性SVM进行初始修剪,然后使用级联的线性距离到超平面和超球面内部分类器,最后使用核化超球面分类器。我们表明,生成的检测器在Wild数据集中的标签人脸上具有竞争力,在FDDB人脸检测、ESOGU人脸检测和INRIA Person数据集上具有最先进的性能。PASCAL VOC 2007数据集的结果也很好,因为它们既不使用对象部分,也不使用上下文。与相应的两类公式相比,一类公式显著降低了分类器的复杂度,使其适合于实际应用。

MSC公司:

68T45型 机器视觉和场景理解
68T05型 人工智能中的学习和自适应系统
68吨10 模式识别、语音识别
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Ahonen,T.、Hadid,A.和Pietikainen,M.(2006)。局部二进制模式人脸描述:在人脸识别中的应用。IEEE T-PAMI,28(12),2037-2041·Zbl 1098.68717号 ·doi:10.1109/TPAMI.2006.244
[2] Aldavert,D.、Ramisa,A.、Mantaras,R.L.和Toledo,R.(2010年)。使用积分线性分类器进行快速且鲁棒的对象分割。在CVPR中。
[3] Amit,Y.和Geman,D.(1999)。视觉选择的计算模型。神经计算,11691-1715·数字对象标识代码:10.1162/08997669900016197
[4] Angelova,A.、Krizhevsky,A.、Vanhoucke,V.、Ogale,A.和Ferguson,D.(2015)。采用深层网络级联的实时行人检测。在BMVC中。
[5] Bay,H.、Ess,A.、Tuytelaars,T.和Van Gool,L.(2008)。冲浪:加速强大功能。CVIU,110(3),346-359。
[6] Belongie,S.、Malik,J.和Puzicha,J.(2002)。使用形状上下文的形状匹配和对象识别。IEEE T-PAMI,24(24),509-521·doi:10.1109/34.993558
[7] Benenson,R.、Mathias,M.、Timofte,R.和Van Gool,L.(2010年)。每秒100帧的行人检测。在CVPR中。
[8] Burges,C.J.C.(1996年)。简化支持向量决策。在机器学习国际会议上。
[9] Cevikalp,H.和Triggs,B.(2008年)。用于高维分类的最近超磁盘方法。在机器学习国际会议上·Zbl 1264.68125号
[10] Cevikalp,H.和Triggs,B.(2012年)。使用最近凸模型分类器级联的高效目标检测。在CVPR中。
[11] Cevikalp,H.、Triggs,B.和Franc,V.(2013)。使用级联分类器进行人脸和地标检测。在IEEE自动人脸和手势识别国际会议上。
[12] Cevikalp,H.、Larlus,D.、Neamtu,M.、Triggs,B.和Jurie,F.(2010年)。基于流形的局部分类器:线性和非线性方法。《信号处理系统杂志》,61,61-73·doi:10.1007/s11265-008-0313-4
[13] Cortes,C.和Vapnik,V.(1995年)。支持向量网络。机器学习,20,273-297·Zbl 0831.68098号
[14] Dallal,N.和Triggs,B.(2005年)。人体检测定向梯度直方图。在CVPR中。
[15] Felzenszwalb,P.F.,&Girshick,R.B.,&McAllester,D.(2010a)。使用可变形零件模型进行级联对象检测。在CVPR中。
[16] Felzenszwalb,P.、McAllester,D.和Ramanan,D.(2008)。经过区分训练的多尺度可变形零件模型。在CVPR中。
[17] Felzenszwalb,P.、Girshick,R.B.、McAllester,D.和Ramanan,D.(2010年B)。使用经过区分训练的基于零件的模型进行目标检测。IEEE T-PAMI,32(9),1627-1645。
[18] Gasimov,R.N.和Ozturk,G.(2006)。通过多面体二次曲线函数进行分离。优化方法和软件,21527-540·兹比尔1113.90095 ·doi:10.1080/10556780600723252
[19] Girshick,R.、Donahue,J.、Darrell,T.和Malik,J.(2014)。丰富的特征层次用于准确的对象检测和语义分割。在CVPR4中。
[20] Harzallah,H.、Jurie,F.和Schmid,C.(2009年)。将有效的目标定位和图像分类相结合。在ICCV中。
[21] Huang,G.、Ramesh,M.、Berg,T.和Learnd-Miller,E.(2007年)。野外标记人脸:研究无约束环境中人脸识别的数据库。技术报告07-49,马萨诸塞大学,阿默斯特,10月。
[22] Hussain,S.(2011年)。视觉对象检测的机器学习方法。Jean Kuntzmann实验室博士论文。
[23] Hussain,S.和Triggs,B.(2010年)。用于视觉对象检测的特征集和降维。在BMVC中。
[24] Jain,V.和Learnd-Miller,E.(2010年)。Fddb:在不受约束的环境中进行人脸检测的基准。技术报告UM-CS-2010-009,马萨诸塞大学阿默斯特分校。
[25] Jin,H.、Liu,Q.和Lu,H.(2004)。使用基于单类的支持向量进行人脸检测。在自动人脸和手势识别国际会议上。
[26] Kalal,Z.、Matas,J.和Mikolajczyk,K.(2008年)。大规模增压的加权采样。在BMVC中。
[27] Lampert,C.H.、Blaschko,M.B.和Hofmann,T.(2008年)。超越滑动窗口:通过高效的子窗口搜索进行对象定位。在CVPR中。
[28] Levi,K.和Weiss,Y.(2004)。从少量示例中学习对象检测:良好特征的重要性。在CVPR中。
[29] Li,H.、Lin,Z.、Shen,X.、Brandt,J.和Hua,G.(2015)。用于人脸检测的卷积神经网络级联。在CVPR中。
[30] Lowe,D.G.(2004)。具有与缩放不变关键点不同的图像特征。IJCV,第60页,第91-110页·doi:10.1023/B:VISI.0000029664.99615.94
[31] Malisiewicz,T.、Gupta,A.和Efros,A.(2011年)。用于对象检测和其他的示例SVTS集成。在ICCV中。
[32] Mangasarian,O.L.和Wild,E.W.(2006年)。基于广义特征值的多曲面近端支持向量机分类。IEEE T-PAMI,28,69-74·doi:10.10109/TPAMI.2006.17
[33] Mika,S.、Schölkopf,B.、Smola,A.、Müller,K.-R、Scholz,M.和Ratsch,G.(1999)。核主成分分析和特征空间去噪。在神经信息处理系统(NIPS)中。
[34] Murat Dundar,M.、Wolf,M.,Lakare,S.、Salmanchinoff,M.和Raykar,V.C.(2008)。用于目标检测的多面体裂解器案例研究:结直肠癌。在机器学习国际会议上。
[35] Murty,S.K.、Kasif,S.和Salzberg,S.(1994年)。倾斜决策树的归纳系统。人工智能研究杂志,2,1-32·Zbl 0900.68335号
[36] Orozco,J.、Martinez,B.和Pantic,M.(2015)。多视角人脸检测级联变形模型的实证分析。图像和视觉计算,42,47-61·doi:10.1016/j.imavis.2015.07.002
[37] Papageorgiou,C.和Poggio,T.(2000)。一种可训练的物体检测系统。IJCV,第38页,第15-33页·Zbl 1012.68680号 ·doi:10.1023/A:1008162616689
[38] Perrotton,X.、Sturzel,M.和Roux,M.(2010年)。用于多视图对象检测的隐式层次增强。在CVPR中。
[39] Platt,J.C.,(1998年)。使用序列最小优化快速训练支持向量机。核方法的进展——支持向量学习。马萨诸塞州剑桥:麻省理工学院出版社。
[40] Porikli,F.(2005)。积分直方图:在笛卡尔空间中提取直方图的快速方法。在CVPR中。
[41] Rowley,H.A.、Baluja,S.和Kanade,T.(1998年)。基于神经网络的人脸检测。IEEE T-PAMI,第20、23-38页·数字对象标识代码:10.1109/34.655647
[42] Scheire,W.J.、Rocha,A.、Sapkota,A.和Boult,T.E.(2013)。朝向开放集识别。IEEE PAMI汇刊,351757-1772。
[43] Schölkopf,B.、Mika,S.、Burges,C.J.C.、Knirsch,P.、Müller,K.R.、Ratsch,G.等人(1999年)。基于内核的方法中的输入空间与特征空间。IEEE神经网络汇刊,101000-1017·doi:10.1109/72.788641
[44] Schölkopf,B.、Platt,J.、Smola,A.和Williamson,R.(2001)。估计高维分布的支持度。神经计算,13,1443-1471·Zbl 1009.62029号 ·doi:10.1162/089976601750264965
[45] Shams,L.和Speslstra,J.(1996)。学习基于Gabor的人脸检测特征。在世界神经网络大会上。
[46] Sizintsev,M.、Derpanis,K.G.和Hogue,A.(2010年)。基于直方图的搜索:一项比较研究。在CVPR中。
[47] Tan,X.和Triggs,B.(2010年)。增强的局部纹理特征集用于困难照明条件下的人脸识别。IEEE图像处理汇刊,191635-1650·Zbl 1371.94364号 ·doi:10.1109/TIP.2009.2033625
[48] Tax,D.M.J.和Duin,R.P.W.(2004)。支持矢量数据描述。机器学习,54,45-66·Zbl 1078.68728号 ·doi:10.1023/B:MACH.0000008084.60811.49
[49] Tenmoto,H.、Kudo,M.和Shimbo,M.(1998)。具有适当数量超平面的分段线性分类器。模式识别,311627-1634·兹比尔1274.68395 ·doi:10.1016/S0031-3203(98)00016-8
[50] Ullman,S.和Sali,E.(2000年)。使用基于碎片的表示进行对象分类。在IEEE第一届生物驱动计算机视觉国际研讨会的会议记录中,BMVC’00,第73-87页。伦敦。斯普林格。
[51] Varma,M.和Ray,D.(2007年)。在ICCV中学习有区别的力量-方差权衡。
[52] Vedaldi,A.、Gulshan,V.、Varma,M.和Zisserman,A.(2009年)。用于对象检测的多个内核。在ICCV中。
[53] Vedaldi,A.和Zisserman,A.(2012年)。通过显式特征映射实现高效的加性核。IEEE PAMI汇刊,34480-492·doi:10.1109/TPAMI.2011.153
[54] Viola,P.和Jones,M.J.(2004年)。强大的实时人脸检测。IJCV,57(2),137-154·doi:10.1023/B:VISI.0000013087.49260.fb
[55] Wang,X.、Han,T.X.和Yan,S.(2009)。具有部分遮挡处理功能的HOG-LBP人体探测器。在ICCV中。
[56] Wei,Y.和Tao,L.(2010)。高效的基于直方图的滑动窗口。在CVPR中。
[57] Zhu,X.和Ramanan,D.(2012)。人脸检测、姿势估计和野外地标定位。在CVPR中。
[58] Zhu,L.、Chen,Y.、Yuille,A.和Freeman,W.(2010年)。用于对象检测的潜在层次结构学习。在CVPR中。
[59] Zhu,X.、Vondrick,C.、Ramanan,D.和Fowlkes,C.(2012)。我们需要更多的训练数据还是更好的模型来进行物体检测。在BMVC中。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。