×

Viola-Jones物体检测方法的演变:一项调查。 (英语) 兹比尔1524.68341

小结:维奥拉和琼斯算法是数字图像中最著名的目标检测方法之一。自第一次出版以来的20多年来,该方法得到了广泛的研究,研究人员和工程师对原始算法及其各个部分提出了许多修改。保罗·维奥拉(Paul Viola)和迈克尔·琼斯(Michael Jones)推广的一些想法成为了许多其他图像对象定位算法的基础。本文介绍了Viola和Jones算法,它在图像中目标定位各种问题背景下的发展和修改历史,以及当前情况的描述:该方法在卷积神经网络广泛应用的时代中的地位。

MSC公司:

68吨10 模式识别、语音识别
68T05型 人工智能中的学习和自适应系统
68T45型 机器视觉和场景理解
PDF格式BibTeX公司 XML格式引用
全文: 内政部 MNR公司

参考文献:

[1] Henderson C.,《打击犯罪:拒绝犯罪分子使用道路》
[2] 2021年中国守望眼
[3] Du S.等人,“自动车牌识别:最新综述”,IEEE视频技术电路和系统汇刊,23:2(2012),311-325
[4] 执法部门对人脸识别技术的使用
[5] Sung K.K.,Poggio T.,“基于示例的人脸检测学习”,IEEE模式分析和机器智能汇刊,20:1(1998),39-51·doi:10.1009/34.655648
[6] Schneiderman H.,Kanade T.,“应用于人脸和汽车的三维物体检测的统计方法”,IEEE计算机视觉和模式识别会议论文集,2000年,第1期,746-751
[7] Viola P.,Jones M.,“鲁棒实时目标检测”,《国际计算机视觉杂志》,2001年,第4期,第34-47页
[8] Freund Y.,Schapire R.E.,“在线学习的决策理论推广及其应用”,《计算机与系统科学杂志》,55:1(1997),119-139·Zbl 0880.68103号 ·doi:10.1006/jcss.1997.1504
[9] Papageorgiou C.P.,Oren M.,Poggio T.,“物体检测的一般框架”,第六届计算机视觉国际会议,1998年,555-562
[10] Lienhart R.,Maydt J.,“用于快速目标检测的Haar-Like特征扩展集”,《图像处理国际会议论文集》,2002年第1期,I-I
[11] 黄C.C.,蔡C.Y.,杨H.C.,“基于AdaBoost的鸟类检测类Haar特征扩展集”,信号处理、图像处理和模式识别国际会议,2011,160-169
[12] Wen X.等人,“车辆分类的快速学习算法”,信息科学,295(2015),395-406·doi:10.1016/j.ins.2014.0040
[13] Gaszczak A.、Breckon T.P.、Han J.,“从无人机图像中实时检测人和车辆”,智能机器人和计算机视觉XXVIII:算法和技术,Proc。SPIE,78782011,78780B·数字对象标识代码:10.1117/12.876663
[14] 李世忠等,“多视角人脸检测的统计学习”,欧洲计算机视觉会议,2002,67-81·Zbl 1039.68673号
[15] Jones M.,Viola P.,《快速多视角人脸检测》,TR-20003-96,三菱电机研究实验室,2003年,11页。
[16] Viola P.、Jones M.J.、Snow D.,“利用运动和外观模式检测行人”,《国际计算机视觉杂志》,63:2(2005),153-161·doi:10.1007/s11263-005-6644-8
[17] Messom C.,Barczak A.,“使用旋转积分图像快速高效地旋转Haar-Like特征”,澳大利亚机器人与自动化会议,2006年,1-6
[18] Ramirez G.A.,Fuentes O.,“具有非对称Haar特征的多糖人脸检测”,2008年IEEE计算机视觉应用研讨会,2008年,1-6
[19] Pavani S.K.,Delgado D.,Frangi A.F.,“具有最佳加权矩形的Haar-Like特征用于快速目标检测”,模式识别,43:1(2010),160-172·Zbl 1191.68598号 ·doi:10.1016/j.patcog.2009.05.011
[20] Pham M.T.等人,“快速多边形积分及其在扩展类Haar特征以改进目标检测中的应用”,2010年IEEE计算机学会计算机视觉和模式识别会议,2010年,942-949
[21] Ojala T.,Pietikainen M.,Harwood D.,“基于特征分布分类的纹理度量的比较研究”,模式识别,29:1(1996),51-59·doi:10.1016/0031-3203(95)00067-4
[22] 张磊等,“基于多块Lbp表示的人脸检测”,国际生物统计学会议,2007年11月18日
[23] Nikisins O.,Greitans M.,“基于局部二进制模式和神经网络的鲁棒人脸检测和定位技术”,2012年BIOSIG-国际生物计量学特别兴趣小组会议论文集,2012年,1-6
[24] Suri P.K.,Verma E.A.,“使用圆形多块局部二进制模式和积分Haar特征的鲁棒人脸检测”,《高级计算机科学与应用国际期刊》,2011年,人工智能专刊,67-71
[25] Jammoussi A.Y.,Masmoudi D.S.,“基于联合积分直方图的Adaboost人脸检测系统”,《国际计算机应用杂志》,23:5(2011)
[26] Lowe D.G.,“从局部尺度不变特征识别物体”,第七届IEEE计算机视觉国际会议论文集,v.2,1999,1150-1157·doi:10.1109/ICCV.1999.790410
[27] Dalal N.,Triggs B.,“人类检测定向梯度直方图”,2005年IEEE计算机学会计算机视觉和模式识别会议,v.12005,886-893·doi:10.1109/CVPR.2005.177
[28] 张伟,孙杰,唐霞,“猫头检测——如何有效利用形状和纹理特征”,欧洲计算机视觉会议,2008,802-816
[29] Dollar P.等人,“整体通道特性”,《英国机器视觉会议论文集》,2009年,91.1-91.11
[30] Dollar P.、Belongie S.、Perona P.,“西方最快的行人探测器”,《英国机器视觉会议论文集》,2010年,68.1-68.11
[31] Bourdev L.,Brandt J.,“通过软级联进行鲁棒对象检测”,2005年IEEE计算机学会计算机视觉和模式识别会议,CVPR’05,v.2,2005,236-243·doi:10.1010/CVPR.2005.310
[32] 肖瑞,朱磊,张海杰,“促进物体检测的链学习”,第九届IEEE计算机视觉国际会议论文集,2003,709-715·doi:10.1109/ICCV.2003.1238417
[33] Wu B.等人,“基于Real AdaBoost的快速旋转不变多视图人脸检测”,第六届IEEE自动人脸和手势识别国际会议,2004,79-84
[34] Zhang C.,Viola P.,“学习高效级联检测器的多实例修剪”,《神经信息处理系统的进展》,20(2007),1681-1688
[35] Friedman J.,Hastie T.,Tibshirani R.,“加性Logistic回归:提升的统计观点(作者进行讨论和重新加入)”,《统计年鉴》,28:2(2000),337-407·Zbl 1106.62323号 ·doi:10.1214/aos/1016218223
[36] Minkina A.等人,“将Viola-Jones方法推广为视频流中实时对象识别的强分类器决策树”,第七届机器视觉国际会议,Proc。斯皮,2015年9月5日,944517·数字对象标识代码:10.1117/12.2180941
[37] Mason L.等人,“作为函数空间梯度下降的推进算法”,《神经信息处理系统的进展》,1999年,第12期,512-518
[38] Friedman J.H.,“贪婪函数近似:梯度推进机器”,《统计年鉴》,2001年,1189-1232·Zbl 1043.62034号
[39] Schapire R.E.,Singer Y.,“使用置信预测改进的推进算法”,机器学习,37:3(1999),297-336·Zbl 0945.68194号 ·doi:10.1023/A:1007614523901
[40] Huang C.等人,“旋转不变多视图人脸检测的矢量增强”,第十届IEEE计算机视觉国际会议,v.1,2005,446-453
[41] 段S.、王旭、万伟,“基于联合特征的人脸检测Logitboost”,2013年第七届国际图像与图形会议,2013,483-488
[42] Gualdi G.,Prati A.,Cucchiara R.,“用于图像和视频中行人检测的多级采样和升压级联”,欧洲计算机视觉会议,2010196-209
[43] 王磊,张忠,“基于无人机拍摄图像的风力涡轮机叶片表面裂纹自动检测”,IEEE工业电子学报,64:9(2017),7293-7303·doi:10.1109/TIE.2017.2682037
[44] Poljakov I.V.等人,“使用贪婪算法训练最优Viola-Jones检测器,以选择控制参数,并在每个级别进行中间验证”,《感官系统》,30:3(2016),241-248(俄语)
[45] Li H.等人,“用于人脸检测的卷积神经网络级联”,IEEE计算机视觉和模式识别会议论文集,2015,5325-5334
[46] Owusu E.,Abdulai J.D.,Zhan Y.,“基于多层前馈神经网络和Haar特征的人脸检测”,软件:实践与经验,49:1(2019),120-129·doi:10.1002/spe.2646
[47] Cai Z.,Vasconcelos N.,“级联r-cnn:探索高质量目标检测”,IEEE计算机视觉和模式识别会议论文集,2018,6154-6162
[48] Krizhevsky A.、Sutskever I.、Hinton G.E.,“基于深度卷积神经网络的图像元分类”,神经信息处理系统进展,25(2012),1097-1105
[49] Everingham M.等人,“Pascal可视对象类(VOC)挑战”,《国际计算机视觉杂志》,88:2(2010),303-338·doi:10.1007/s11263-009-0275-4
[50] Girshick R.等人,“用于精确目标检测和语义分割的丰富特征层次”,IEEE计算机视觉和模式识别会议论文集,2014年,580-587
[51] Redmon J.等人,“You Only Look Once:Unified,Real Time Object Detection”,《IEEE计算机视觉和模式识别会议论文集》,2016年,779-788
[52] 刘伟等,“SSD:单点多盒探测器”,欧洲计算机视觉会议,2016,21-37
[53] Lin T.Y.等人,“用于目标检测的特征金字塔网络”,IEEE计算机视觉和模式识别会议论文集,2017年,2117-2125
[54] Jiao L.等人,“基于深度学习的目标检测综述”,IEEE Access,7(2019),128837-128868·doi:10.10109/ACCESS.2019.22939201
[55] Zou Z.等人,《20年来的目标检测:一项调查》,arXiv:
[56] Granger E.等人,“基于Cnn的人脸和头部检测器在实时视频监控应用中的比较”,2017年第七届图像处理理论、工具和应用国际会议,2017年,1-7
[57] Jain V.,Learnd-Miller E.,FDDB:无约束环境下人脸检测的基准,麻省大学阿默斯特校区技术报告UM-CS-2010-0092010,11页。
[58] Yan J.等人,“用于野外人脸检测的实时高性能可变形模型”,2013国际生物识别会议,2013,1-6
[59] Felzenszwalb P.,McAllester D.,Ramanan D.,“一个经过鉴别训练的多尺度可变形零件模型”,2008年IEEE计算机视觉和模式识别会议,2008年,1-8
[60] Usilin S.A.、Slavin O.A.、Arlazarov V.V.,“用于遥感应用的Viola-Jones目标检测方法的内存消耗和计算效率改进”,模式识别和图像分析,31:3(2021),571-579·doi:10.1007/978-3-030-68821-9_23
[61] Xu Y.等人,“基于Viola-Jones和HOG+SVM的无人机图像混合车辆检测方法”,传感器,16:8(2016),1325·Zbl 1382.65023号 ·doi:10.3390/s16081325
[62] Irgens P.等人,“基于Fpga的高效且经济高效的Viola-Jones人脸检测算法实现”,HardwareX,2017年,第1期,68-75·doi:10.1016/j.ohx.2017.03.002
[63] Skoryukina N.,Arlazarov V.,Nikolaev D.,“移动和服务器应用程序ID文档定位和类型识别的快速方法”,2019国际文档分析和识别会议,2019,850-857·doi:10.1109/ICDAR.2019.00141
[64] Usilin S.等人,“基于视觉外观的文档图像分类”,2010 IEEE国际图像处理会议,2010,2133-2136
[65] Tropin D.V.等人,“在具有复杂射影畸变结构的图像上定位平面物体”,Informatsionnye Protsessy,19:2(2019),208-229(俄语)
[66] Matalov D.P.、Usilin S.A.、Arlazarov V.V.,“修改Viola-Jones方法检测俄罗斯联邦政府印章”,第十一届机器视觉国际会议,Proc。SPIE,11041,2019,110411Y·doi:10.1117/12.2522793
[67] Polevoy D.等人,“使用小型数码相机进行文档识别的关键方面”,RFBR Journal,4:92(2016),98-105(俄语)·doi:10.22204/2410-4639-2016-092-04-97-108
[68] Limonova E.E.等人,“以Elbrush平台为例的VLIW体系结构识别系统效率评估”,《编程与计算机软件》,45:1(2019),15-21(俄语)·doi:10.1134/S0132347419010047
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。