弗拉基米尔·维克托洛维奇·阿尔拉扎罗夫;尤利娅·谢尔盖维奇(Yuliya Sergeevich)·沃塞亚特(Voĭsyat);达尼尔·巴甫洛维奇;德米特里·彼得罗维奇·尼古拉耶夫;谢尔盖·乌西林(Serge Usilin,Aleksandrovich) 维奥拉·琼斯物体检测方法的发展:一项调查。 (英语) Zbl 1524.68341号 维斯特。尤日诺乌拉尔。戈斯。州立大学。材料模型。程序。 14,第4号,5-23(2021)。 小结:维奥拉和琼斯算法是数字图像中最著名的目标检测方法之一。自第一次出版以来的20多年来,该方法得到了广泛的研究,研究人员和工程师对原始算法及其各个部分提出了许多修改。保罗·维奥拉(Paul Viola)和迈克尔·琼斯(Michael Jones)推广的一些想法成为了许多其他图像对象定位算法的基础。本文介绍了Viola和Jones算法,它在图像中目标定位各种问题背景下的发展和修改历史,以及当前情况的描述:该方法在卷积神经网络广泛应用的时代中的地位。 引用于1文件 MSC公司: 68吨10 模式识别、语音识别 68T05型 人工智能中的学习和自适应系统 68T45型 机器视觉和场景理解 关键词:Viola-Jones算法;模式识别;机器学习;对象分类;对象定位;目标检测 软件:阿达·布斯特。MH公司;PASCAL挥发性有机化合物;ImageNet公司;固态硬盘;AlexNet公司;联邦开发银行 PDF格式BibTeX公司 XML格式引用 \textit{V.V.Arlazarov}等人,Vestn。尤日诺乌拉尔。戈斯。州立大学。材料模型。程序。14、第4号、第5--23号(2021年;Zbl 1524.68341) 全文: 内政部 MNR公司 参考文献: [1] Henderson C.,《打击犯罪:拒绝犯罪分子使用道路》 [2] 2021年中国守望眼 [3] Du S.等人,“自动车牌识别:最新综述”,IEEE视频技术电路和系统汇刊,23:2(2012),311-325 [4] 执法部门对人脸识别技术的使用 [5] Sung K.K.,Poggio T.,“基于示例的人脸检测学习”,IEEE模式分析和机器智能汇刊,20:1(1998),39-51·数字对象标识代码:10.1109/34.655648 [6] Schneiderman H.,Kanade T.,“应用于人脸和汽车的三维物体检测的统计方法”,IEEE计算机视觉和模式识别会议论文集,2000年,第1期,746-751 [7] Viola P.,Jones M.,“鲁棒实时目标检测”,《国际计算机视觉杂志》,2001年,第4期,第34-47页 [8] Freund Y.,Schapire R.E.,“在线学习的决策理论推广及其应用”,《计算机与系统科学杂志》,55:1(1997),119-139·Zbl 0880.68103号 ·doi:10.1006/jcss.1997.1504 [9] Papageorgiou C.P.,Oren M.,Poggio T.,“物体检测的一般框架”,第六届计算机视觉国际会议,1998年,555-562 [10] Lienhart R.,Maydt J.,“用于快速目标检测的Haar-Like特征扩展集”,《图像处理国际会议论文集》,2002年第1期,I-I [11] 黄C.C.,蔡C.Y.,杨H.C.,“基于AdaBoost的鸟类检测类Haar特征扩展集”,信号处理、图像处理和模式识别国际会议,2011,160-169 [12] Wen X.等人,“车辆分类的快速学习算法”,信息科学,295(2015),395-406·doi:10.1016/j.ins.2014.10.040 [13] Gaszczak A.、Breckon T.P.、Han J.,“从无人机图像中实时检测人和车辆”,智能机器人和计算机视觉XXVIII:算法和技术,Proc。斯皮,78782011,78780B·数字对象标识代码:10.1117/12.876663 [14] 李世忠等,“多视角人脸检测的统计学习”,欧洲计算机视觉会议,2002,67-81·Zbl 1039.68673号 [15] Jones M.,Viola P.,《快速多视角人脸检测》,TR-20003-96,三菱电机研究实验室,2003年,11页。 [16] Viola P.,Jones M.J.,Snow D.,“使用运动和外观模式检测行人”,国际计算机视觉杂志,63:2(2005),153-161·doi:10.1007/s11263-005-6644-8 [17] Messom C.,Barczak A.,“使用旋转积分图像快速高效地旋转Haar-Like特征”,澳大利亚机器人与自动化会议,2006年,1-6 [18] Ramirez G.A.,Fuentes O.,“具有非对称Haar特征的多糖人脸检测”,2008年IEEE计算机视觉应用研讨会,2008年,1-6 [19] Pavani S.K.,Delgado D.,Frangi A.F.,“具有最佳加权矩形的Haar-Like特征用于快速目标检测”,模式识别,43:1(2010),160-172·Zbl 1191.68598号 ·doi:10.1016/j.patcog.2009.05.011 [20] Pham M.T.等人,“快速多边形积分及其在扩展类Haar特征以改进目标检测中的应用”,2010年IEEE计算机学会计算机视觉和模式识别会议,2010年,942-949 [21] Ojala T.,Pietikainen M.,Harwood D.,“基于特征分布分类的纹理度量的比较研究”,模式识别,29:1(1996),51-59·doi:10.1016/0031-3203(95)00067-4 [22] 张磊等,“基于多块Lbp表示的人脸检测”,国际生物统计学会议,2007年11月18日 [23] Nikisins O.,Greitans M.,“基于局部二进制模式和神经网络的鲁棒人脸检测和定位技术”,2012年BIOSIG-国际生物计量学特别兴趣小组会议论文集,2012年,1-6 [24] Suri P.K.,Verma E.A.,“使用圆形多块局部二进制模式和积分Haar特征的鲁棒人脸检测”,《高级计算机科学与应用国际期刊》,2011年,人工智能专刊,67-71 [25] Jammoussi A.Y.,Masmoudi D.S.,“基于联合积分直方图的Adaboost人脸检测系统”,《国际计算机应用杂志》,23:5(2011) [26] Lowe D.G.,“从局部尺度不变特征识别物体”,第七届IEEE计算机视觉国际会议论文集,v.2,1999,1150-1157·doi:10.1109/ICCV.1999.790410 [27] Dalal N.,Triggs B.,“人类检测定向梯度直方图”,2005年IEEE计算机学会计算机视觉和模式识别会议,v.12005,886-893·doi:10.1109/CVPR.2005.177 [28] 张伟,孙杰,唐霞,“猫头检测——如何有效利用形状和纹理特征”,欧洲计算机视觉会议,2008,802-816 [29] Dollar P.等人,“整体通道特性”,《英国机器视觉会议论文集》,2009年,91.1-91.11 [30] Dollar P.、Belongie S.、Perona P.,“西方最快的行人探测器”,《英国机器视觉会议论文集》,2010年,68.1-68.11 [31] Bourdev L.,Brandt J.,“通过软级联进行鲁棒对象检测”,2005年IEEE计算机学会计算机视觉和模式识别会议,CVPR’05,v.2,2005,236-243·doi:10.1109/CVPR.2005.310 [32] 肖瑞,朱磊,张海杰,“促进物体检测的链学习”,第九届IEEE计算机视觉国际会议论文集,2003,709-715·doi:10.1109/ICCV.2003.1238417 [33] Wu B.等人,“基于Real AdaBoost的快速旋转不变多视图人脸检测”,第六届IEEE自动人脸和手势识别国际会议,2004,79-84 [34] Zhang C.,Viola P.,“学习高效级联检测器的多实例修剪”,《神经信息处理系统的进展》,20(2007),1681-1688 [35] Friedman J.,Hastie T.,Tibshirani R.,“加性Logistic回归:提升的统计观点(作者进行讨论和重新加入)”,《统计年鉴》,28:2(2000),337-407·Zbl 1106.62323号 ·doi:10.1214/aos/1016218223 [36] Minkina A.等人,“将Viola-Jones方法推广为视频流中实时对象识别的强分类器决策树”,第七届机器视觉国际会议,Proc。SPIE,9445,2015,944517·数字对象标识代码:10.1117/12.2180941 [37] Mason L.等人,“函数空间中梯度下降的助推算法”,《神经信息处理系统进展》,1999年,第12期,512-518页 [38] Friedman J.H.,“贪婪函数近似:梯度推进机器”,《统计年鉴》,2001年,1189-1232·Zbl 1043.62034号 [39] Schapire R.E.,Singer Y.,“使用置信预测改进的推进算法”,机器学习,37:3(1999),297-336·Zbl 0945.68194号 ·doi:10.1023/A:1007614523901 [40] Huang C.等人,“用于旋转不变多视图人脸检测的矢量增强”,第十届IEEE国际计算机视觉会议,2005年第1期,446-453 [41] 段S.、王旭、万伟,“基于联合特征的人脸检测Logitboost”,2013年第七届国际图像与图形会议,2013,483-488 [42] Gualdi G.,Prati A.,Cucchiara R.,“图像和视频中行人检测的多级级联采样”,欧洲计算机视觉会议,2010年,196-209年 [43] 王磊,张忠,“基于无人机拍摄图像的风力涡轮机叶片表面裂纹自动检测”,IEEE工业电子学报,64:9(2017),7293-7303·doi:10.1109/TIE.2017.2682037 [44] Poljakov I.V.等人,“使用贪婪算法训练最佳Viola-Jones检测器,以选择控制参数,并在每个级别进行中间验证”,《感官系统》,30:3(2016),241-248(俄语) [45] Li H.等人,“用于人脸检测的卷积神经网络级联”,IEEE计算机视觉和模式识别会议论文集,2015,5325-5334 [46] Owusu E.,Abdulai J.D.,Zhan Y.,“基于多层前馈神经网络和Haar特征的人脸检测”,软件:实践与经验,49:1(2019),120-129·doi:10.1002/spe.2646 [47] Cai Z.,Vasconcelos N.,“级联r-cnn:探索高质量目标检测”,IEEE计算机视觉和模式识别会议论文集,2018,6154-6162 [48] Krizhevsky A.、Sutskever I.、Hinton G.E.,“基于深度卷积神经网络的图像元分类”,神经信息处理系统进展,25(2012),1097-1105 [49] Everingham M.等人,“Pascal可视对象类(VOC)挑战”,《国际计算机视觉杂志》,88:2(2010),303-338·doi:10.1007/s11263-009-0275-4 [50] Girshick R.等人,“用于精确目标检测和语义分割的丰富特征层次”,IEEE计算机视觉和模式识别会议论文集,2014年,580-587 [51] Redmon J.等人,“You Only Look Once:Unified,Real Time Object Detection”,《IEEE计算机视觉和模式识别会议论文集》,2016年,779-788 [52] 刘伟等,“SSD:单点多盒探测器”,欧洲计算机视觉会议,2016,21-37 [53] Lin T.Y.等人,“用于目标检测的特征金字塔网络”,IEEE计算机视觉和模式识别会议论文集,2017年,2117-2125 [54] Jiao L.等人,“基于深度学习的目标检测综述”,IEEE Access,7(2019),128837-128868·doi:10.1109/ACCESS.2019.2939201 [55] Zou Z.等人,《20年来的目标检测:一项调查》,arXiv: [56] Granger E.等人,“基于Cnn的人脸和头部检测器在实时视频监控应用中的比较”,2017年第七届图像处理理论、工具和应用国际会议,2017年,1-7 [57] Jain V.,Learnd-Miller E.,FDDB:无约束环境下人脸检测的基准,麻省大学阿默斯特校区技术报告UM-CS-2010-0092010,11页。 [58] Yan J.等人,“野外人脸检测的实时高性能变形模型”,2013年国际生物计量会议,2013年,1-6 [59] Felzenszwalb P.,McAllester D.,Ramanan D.,“一个经过鉴别训练的多尺度可变形零件模型”,2008年IEEE计算机视觉和模式识别会议,2008年,1-8 [60] Usilin S.A.、Slavin O.A.、Arlazarov V.V.,“用于遥感应用的Viola-Jones目标检测方法的内存消耗和计算效率改进”,模式识别和图像分析,31:3(2021),571-579·doi:10.1007/978-3-030-68821-9_23 [61] Xu Y.等人,“基于Viola-Jones和HOG+SVM的无人机图像混合车辆检测方法”,传感器,16:8(2016),1325·Zbl 1382.65023号 ·doi:10.3390/s16081325 [62] Irgens P.等人,“基于Fpga的高效且经济高效的Viola-Jones人脸检测算法实现”,HardwareX,2017年,第1期,68-75·doi:10.1016/j.ohx.2017.03.002 [63] Skoryukina N.、Arlazarov V.、Nikolaev D.,“移动和服务器应用中ID文件位置和类型识别的快速方法”,2019年国际文件分析和识别会议,2019,850-857·doi:10.1109/ICDAR.2019.00141 [64] Usilin S.等人,“基于视觉外观的文档图像分类”,2010 IEEE国际图像处理会议,2010,2133-2136 [65] Tropin D.V.等人,“具有复杂投影畸变结构的图像上平面物体的定位”,Informatsionnye Protessey,19:2(2019),208-229(俄语) [66] Matalov D.P.、Usilin S.A.、Arlazarov V.V.,“修改Viola-Jones方法检测俄罗斯联邦政府印章”,第十一届机器视觉国际会议,Proc。SPIE,11041,2019,110411Y·doi:10.1117/12.2522793 [67] Polevoy D.等人,“使用小型数码相机进行文档识别的关键方面”,RFBR Journal,4:92(2016),98-105(俄语)·doi:10.22204/2410-4639-2016-092-04-97-108 [68] Limonova E.E.等人,“以Elbrush平台为例的VLIW体系结构识别系统效率评估”,《编程与计算机软件》,45:1(2019),15-21(俄语)·doi:10.1134/S0132347419010047 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。