×

训练有效的节点分类器进行级联分类。 (英语) Zbl 1270.68259号

摘要:级联分类器广泛应用于实时目标检测。与设计用于低总体分类错误率的传统分类器不同,级联的每个节点都需要一个分类器来实现极高的检测率和中等的误报率。尽管有一些报道的方法在对象检测的背景下解决了这一要求,但没有明确考虑这种非对称节点学习目标的原则性特征选择方法。我们在这里提供了这样的算法。我们证明了有偏极大极小概率机的一个特殊情况与Wu等人的线性非对称分类器(LAC)具有相同的公式。然后,我们设计了一种新的boosting算法,直接优化LAC的成本函数。通过凸优化中的列生成技术来实现由此产生的完全校正提升算法。目标检测的实验结果验证了所提出的boosting算法作为级联目标检测中的节点分类器的有效性,并显示出优于当前最新技术的性能。

MSC公司:

68吨10 模式识别、语音识别
68单位10 图像处理的计算方法
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Agarwal,S.、Awan,A.和;Roth,D.(2004)。学习通过稀疏、基于部分的表示检测图像中的对象。IEEE模式分析和机器智能汇刊,26(11),1475-1490·doi:10.1109/TPAMI.2004.108
[2] Aldavert,D.、Ramisa,A.、Toledo,R.和;Lopez de Mantaras,R.(2010年)。使用积分线性分类器进行快速且鲁棒的对象分割。IEEE计算机学会计算机视觉和模式识别会议论文集。美国旧金山:IEEE。
[3] A.贝克;Teboulle,M.(2003)。凸优化的镜像下降和非线性投影次梯度方法。《运营研究快报》,31(3),167–175·Zbl 1046.90057号 ·doi:10.1016/S0167-6377(02)00231-6
[4] Bi,J.、Periaswamy,S.、Okada,K.、Kubota,T.、Fung,G.和;Salganicoff,M.等人(2006年)。通过稀疏超平面分类器的非对称级联进行计算机辅助检测。ACM国际会议论文集;数据挖掘(第837–844页)。宾夕法尼亚州费城:ACM出版社。
[5] Boudev,L.和;Brandt,J.(2005)。通过软级联实现稳健的目标检测。IEEE计算机学会计算机视觉和模式识别会议记录(第236-243页)。加利福尼亚州圣地亚哥:IEEE。
[6] Boyd,S.和;Vandenberghe,L.(2004)。凸优化。剑桥:剑桥大学出版社·Zbl 1058.90049号
[7] Brubaker,S.C.、Wu,J.、Sun,J.和Mullin,M.D;Rehg,J.M.(2008)。人脸检测中增强信号群级联的设计。国际计算机视觉杂志,77(1-3),65-86·doi:10.1007/s11263-007-0060-1
[8] Collins,M.、Globerson,A.、Koo,T.、Carreras,X.和;Bartlett,P.L.(2008)。条件随机场和最大边际马尔可夫网络的指数梯度算法。机器学习研究杂志,9,1775-1822·Zbl 1225.68167号
[9] Dallal,N.和;Triggs,B.(2005年)。人体检测定向梯度直方图。《IEEE计算机学会计算机视觉和模式识别会议论文集》(第1卷,第886-893页)。加利福尼亚州圣地亚哥:IEEE。
[10] Demiriz,A.、Bennett,K.P.和;Shawe-Taylor,J.(2002)。通过列生成进行线性编程增强。机器学习,46(1-3),225-254·Zbl 0998.68105号 ·doi:10.1023/A:1012470815092
[11] Dollár,P.(2012)。Piotr的图像和视频Matlab工具箱。2012年12月14日检索自http://vision.ucsd.edu/pdollar/toolbox/doc/ .
[12] Dollár,P.、Babenko,B.、Belongie,S.、Perona,P.和;涂政(2008)。用于目标检测的多分量学习。《欧洲计算机视觉会议记录》(第211-224页)。法国马赛:ECCV。
[13] Dollár,P.、Wojek,C.、Schiele,B.和;Perona,P.(2012)。行人检测:对最新技术的评估。IEEE模式分析和机器智能汇刊,34(4),743-761。
[14] Dundar,M.和;Bi,J.(2007)。用于计算机辅助检测的级联分类器的联合优化。IEEE计算机学会计算机视觉和模式识别会议论文集。明尼阿波利斯,明尼苏达州:IEEE。
[15] Enzweiler,M.、Eigenstetter,A.、Schiele,B.和;Gavrila,D.M.(2010年)。具有部分遮挡处理的多通道行人分类。IEEE计算机学会计算机视觉和模式识别会议论文集。美国旧金山:IEEE。
[16] Ess,A.、Leibe,B.和;Van Gool,L.(2007)。用于移动场景分析的深度和外观。计算机视觉国际会议论文集。里约热内卢:ICCV。
[17] Felzenszwalb,P.、Girshick,R.、McAllester,D.和;Ramanan,D.(2010年)。使用经过区分训练的基于零件的模型进行目标检测。IEEE模式分析和机器智能汇刊,32(9),1627-1645·doi:10.1109/TPAMI.2009.167
[18] Gehler,P.和;Nowozin,S.(2009年)。关于多类对象分类的特征组合。计算机视觉国际会议论文集。里约热内卢:ICCV。
[19] Huang,K.,Yang,H.,King,I.,Lyu,M.和;Chan,L.(2004)。最小误差最小最大概率机。机器学习研究杂志,51253–1286·Zbl 1222.62071号
[20] Lanckriet,G.R.G.、El Ghaoui,L.、Bhattacharyya,C.和;Jordan,M.I.(2002)。一种稳健的极小极大分类方法。机器学习研究杂志,3555–582·Zbl 1084.68657号
[21] Lazebnik,S.、Schmid,C.和;Ponce,J.(2006)。除了一袋袋的特征:用于识别自然场景类别的空间金字塔匹配。IEEE计算机学会计算机视觉和模式识别会议论文集。纽约:IEEE。
[22] Lefakis,L.和;Fleuret,F.(2010年)。使用增强分类器的乘积进行联合级联优化。神经信息处理系统进展。温哥华:NIPS。
[23] Li,S.Z.和;Zhang,Z.(2004)。FloatBoost学习和统计人脸检测。IEEE模式分析和机器智能汇刊,26(9),1112-1123·doi:10.1109/TPAMI.2004.68
[24] Lin,Z.,Hua,G.和;Davis,L.S.(2009)。用于鲁棒的基于零件的对象检测的多实例特征。IEEE计算机学会计算机视觉和模式识别会议记录(第405-412页)。IEEE:佛罗里达州迈阿密。
[25] Liu,C.和;Shum,H.-Y.(2003)Kullback-Leibler助推。《IEEE计算机学会计算机视觉和模式识别会议论文集》(第1卷,第587-594页)。威斯康星州麦迪逊:IEEE。
[26] 马吉(Maji,S.)、伯格(Berg,A.C.)和;Malik,J.(2008)。使用交叉核支持向量机进行分类是有效的。IEEE计算机学会计算机视觉和模式识别会议论文集。安克雷奇,阿拉斯加州:IEEE。
[27] Masnadi-Shirazi,H.和;Vasconcelos,N.(2007年)。不对称增压。《机器学习国际会议论文集》(第609-619页)。IMLS:俄勒冈州科尔瓦利斯。
[28] Masnadi-Shirazi,H.和;Vasconcelos,N.(2011年)。成本敏感型提升。IEEE模式分析和机器智能汇刊,33(2),294–309·doi:10.1109/TPAMI.2010.71
[29] 莫斯科。(2010). 用于matlab的MOSEK优化工具箱手册,6.0版,93版。2010年5月25日检索自网址:http://www.mosek.com/ .
[30] Mu,Y.,Yan,S.,Liu,Y.、Huang,T.和;周斌(2008)。个人相册中用于人类检测的判别性局部二进制模式。IEEE计算机学会计算机视觉和模式识别会议论文集。阿拉斯加州安克雷奇:IEEE。
[31] Munder,S.和;Gavrila,D.M.(2006)。行人分类的实验研究。IEEE模式分析和机器智能汇刊,28(11),1863-1868·doi:10.1109/TPAMI.2006.217
[32] Paisitkriangkrai,S.、Shen,C.和;张杰(2008)。使用级联增强的协方差特征进行快速行人检测。IEEE视频技术电路和系统汇刊,18(8),1140–1151。
[33] Paisitkriangkrai,S.、Shen,C.和;张杰(2009)。使用稀疏特征向量有效地训练更好的视觉检测器。IEEE计算机学会计算机视觉和模式识别会议论文集。佛罗里达州迈阿密:IEEE。
[34] Pham、M.-T和;Cham,T.-J.(2007a)。在基于增强的人脸检测中使用统计信息快速训练和选择Haar特征。计算机视觉国际会议论文集。巴西里约热内卢:ICCV。
[35] Pham、M.-T和;Cham,T.-J.(2007b)。在线学习非对称增强分类器用于对象检测。IEEE计算机学会计算机视觉和模式识别会议论文集。明尼阿波利斯,明尼苏达州:IEEE。
[36] Pham,M.-T.,Hoang,V.-D.D.,&;Cham,T.-J.(2008)。多出口非对称增压检测。IEEE计算机学会计算机视觉和模式识别会议论文集。阿拉斯加安克雷奇:IEEE。
[37] Rätsch,G.、Mika,S.、Schölkopf,B.和;Müller,K.-R.(2002)。从SVM构造boosting算法:一个应用于单类分类。IEEE模式分析和机器智能汇刊,24(9),1184–1199·doi:10.1109/TPAMI.2002.1033211
[38] Saberian,M.和;Vasconcelos,N.(2012年)。学习最佳嵌入式级联。在IEEE模式分析和机器智能汇刊中。科罗拉多州:TPAMI·Zbl 1319.62131号
[39] Saberian,M.J.和;Vasconcelos,N.(2010年)。提升分级级联。神经信息处理系统进展。温哥华:NIPS。
[40] 沈,C.,&;Li,H.(2010年a)。通过优化利润分配来推动增长。IEEE神经网络泛函,21(4),659–666·doi:10.1109/TNN.2010.10484
[41] 沈,C.,&;Li,H.(2010年b)。关于boosting算法的对偶公式。IEEE模式分析和机器智能汇刊,32(12):2216–2231。IEEE计算机学会数字图书馆。http://dx.doi.org/10.1109/TPAMI.2010.47 .
[42] Shen,C.、Paisitkriangkrai,S.和;张杰(2008)。少数训练示例中的人脸检测。《图像处理国际会议记录》(第2764-2767页)。IEEE:加利福尼亚州圣地亚哥。
[43] 沈,C.,王,P.,&;Li,H.(2010)。LACBoost和FisherBoost:最佳构建级联分类器。《欧洲计算机视觉会议论文集》,LNCS 6312。(第2卷,第608-621页)。希腊克里特岛:斯普林格。
[44] Shen,C.,Paisitkriangkrai,S.,Zhang,J.(2011)。使用稀疏特征向量有效学习检测级联。IEEE图像处理汇刊,20(1):22–35。http://dx.doi.org/10.109/TIP.2010.2055880 . ·Zbl 1372.94356号
[45] Sochman,J.和;Matas,J.(2005年)。时间约束序列检测的Waldboost学习。在IEEE计算机学会计算机视觉和模式识别会议论文集上。圣地亚哥:IEEE。
[46] Torralba,A.、Murphy,K.P.和;Freeman,W.T.(2007)。共享多类和多视图对象检测的视觉功能。IEEE模式分析和机器智能汇刊,29(5),854-869·doi:10.1109/TPAMI.2007.1055
[47] Tu、H.-H.和;Lin,H.-T.(2010)。用于多类成本敏感分类的单侧支持向量回归。机器学习国际会议论文集。以色列海法:ICML。
[48] Tuzel,O.、Porikli,F.和;Meer,P.(2008)。通过黎曼流形分类检测行人。IEEE模式分析和机器智能汇刊,30(10),1713-1727·doi:10.1109/TPAMI.2008.75
[49] 维奥拉·P·;Jones,M.(2002)。使用非对称AdaBoost和检测器级联进行快速而稳健的分类。《神经信息处理系统进展》(第1311-1318页)。剑桥:麻省理工学院出版社。
[50] 维奥拉·P·;Jones,M.J.(2004)。强大的实时人脸检测。国际计算机视觉杂志,57(2),137-154·doi:10.1023/B:VISI.0000013087.49260.fb
[51] Viola,P.、Platt,J.C.和;Zhang,C.(2005)。用于对象检测的多实例增强。《神经信息处理系统进展》(第1417-1424页)。加拿大温哥华:NIPS。
[52] Walk,S.、Majer,N.、Schindler,K.和;Schiele,B.(2010年)。行人检测的新功能和见解。IEEE计算机学会计算机视觉和模式识别会议论文集。美国旧金山:IEEE。
[53] Wang,P.,Shen,C.,Barnes,N.和;Zheng,H.(2012)。使用非对称全面校正增强进行快速而稳健的目标检测。IEEE神经网络和学习系统汇刊,23(1),33-46·doi:10.10109/TNNLS.2011.2178324
[54] Wang,W.、Zhang,J.和;沈C.(2010)。改进了热图像中的人体检测和分类。图像处理国际会议论文集。香港:ICIP。
[55] Wang,X.,Han,T.X.,&Yan,S.(2007)。具有部分遮挡处理功能的HOG-LBP人体探测器。计算机视觉国际会议论文集。巴西里约热内卢:ICCV。
[56] Wojek,C.、Walk,S.和;Schiele,B.(2009年)。多通道车载行人检测。IEEE计算机学会计算机视觉和模式识别会议论文集。迈阿密:IEEE。
[57] Wu,B.和;Nevatia,R.(2008年)。在集成异构局部特征进行目标检测时,优化鉴别效率权衡。IEEE计算机学会计算机视觉和模式识别会议论文集。安克雷奇,阿拉斯加州:IEEE。
[58] Wu,J.和;Rehg,J.M.(2011)。CENTRIST:用于场景分类的视觉描述符。IEEE模式分析和机器智能汇刊,33(8),1489-1501·doi:10.1109/TPAMI.2010.224
[59] Wu,J.、Rehg,J.M.和;Mullin,M.D.(2003年)。通过直接特征选择学习罕见事件检测级联。在S.Thrun、L.Saul和;B.Schölkopf(编辑),《神经信息处理系统进展学报》。内华达山脉:NIPS。
[60] Wu,J.、Mullin,医学博士;Rehg,J.M.(2005)。级联检测器的线性非对称分类器。《国际机器学习会议记录》(第988–995页)。德国波恩:IMLS。
[61] Wu,J.、Brubaker,S.C.、Mullin,M.D.和;Rehg,J.M.(2008年)。级联人脸检测的快速非对称学习。IEEE模式分析和机器智能汇刊,30(3),369–382·doi:10.1109/TPAMI.2007.1181
[62] Xiao,R.、Zhu,L.和;张海杰(2003)。用于对象检测的增强链学习。《计算机视觉国际会议论文集》(第709–715页)。法国尼斯:ICCV。
[63] Xiao,R.,Zhu,H.,Sun,H.和;Tang,X.(2007)。用于人脸检测的动态级联。计算机视觉国际会议论文集。巴西里约热内卢:ICCV。
[64] Yu,Y.-L.,Li,Y.,Schuurmans,D.,&;Szepesvári,C.(2009)。分布族的常规投影属性。在Y.Bengio、D.Schuurmans、J.Lafferty、C.K.I.Williams和;A.Culotta(编辑),《神经信息处理系统进展》(第2232–2240页)。加拿大温哥华:NIPS。
[65] Zheng,Y.、Shen,C.、Hartley,R.和;Huang,X.(2010)。金字塔中心对称局部二元、三元模式用于有效的行人检测。《亚洲计算机视觉会议论文集》。新西兰皇后镇:ACCV。
[66] Zhu,Q.,Avidan,S.,Yeh,M.-C.,&Cheng,K.-T.(2006)。使用一系列定向梯度直方图进行快速人体检测。《IEEE计算机学会计算机视觉和模式识别会议论文集》(第1491-1498页)。纽约:IEEE。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。