×

一种基于DFT和DCT域二维HOG特征的车辆检测方案。 (英语) Zbl 1435.94038号

摘要:定向梯度直方图(HOG)通常被用作图像中目标检测的特征,因为它们对光照和环境条件的变化具有鲁棒性。然而,这些特征对于输入图像的分辨率的变化并不是一成不变的。这些特征的二维表示被称为2DHOG特征,因为它保留了相邻像素或单元之间的关系。本文提出了一种新的基于变换域2DHOG特征的车辆检测方案。该方法基于从输入图像中提取二维HOG特征,并将其应用于二维离散傅里叶变换或余弦变换。随后是一个截断过程,通过该过程,仅保留低频系数,即变换域2DHOG(TD2DHOG)特征。结果表明,从原始分辨率的图像获得的TD2DHOG特征和从同一图像获得的下采样版本在乘法因子内大致相同。然后,在我们的方案中利用此特性,使用单个分类器而不是多个分辨率特定分类器检测各种分辨率的车辆。实验结果表明,与使用分类器金字塔相比,在所提出的检测方案中使用单个分类器大大降低了训练和存储成本,但提供的检测精度与使用带有分类器金字塔的TD2DHOG特征获得的检测精度类似。此外,所提出的方法提供的检测精度与最新技术提供的检测精确度相似,甚至更好。

MSC公司:

94A08型 信息与通信理论中的图像处理(压缩、重建等)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Agarwal,S.、Awan,A.和Roth,D.(2004)。学习通过稀疏、基于部分的表示检测图像中的对象。IEEE模式分析和机器智能学报(PAMI),26(11),1475-1490。http://cogcomp.org/page/resource_view/13/。2018年11月1日查阅。
[2] Ahmed,N.、Natarajan,T.和Rao,K.(1974年)。离散余弦变换。IEEE计算机汇刊,C-23(1),90-93·Zbl 0273.65097号 ·doi:10.1109/T-C.1974.223784
[3] Appel,R.、Fuchs,T.、DolláR,P.和Perona,P.(2013)。快速提升决策树—尽早运行未实现的功能。《机器学习国际会议论文集》(第594-602页)。
[4] Benenson,R.、Mathias,M.、Timofte,R.和Gool,L.V.(2012年)。每秒100帧的行人检测。《IEEE计算机视觉和模式识别会议论文集》(第2903-2910页)。
[5] Bi,G.和Mitra,S.(2011年)。频域中的采样率转换[dsp提示和技巧]。IEEE信号处理杂志,28(3),140-144·doi:10.10109/MSP.2011.904113
[6] Bileschi,S.(2006)。街道场景:在静止图像中实现场景理解。麻省理工学院博士论文。CBCL数据集链接:http://cbcl.mit.edu/software-datasets/streetscenes。2018年11月1日查阅。
[7] Buch,N.、Velastin,S.A.和Orwell,J.(2011年)。城市交通分析中的计算机视觉技术综述。IEEE智能交通系统(ITS)汇刊,12(3),920-939·doi:10.1009/TITS.2011.2119372
[8] Dalal,N.(2006)。在图像和视频中查找人。格勒诺布尔国立理工学院博士论文。
[9] Dallal,N.和Triggs,B.(2005年)。人体检测定向梯度直方图。《IEEE计算机视觉和模式识别会议论文集》(第1卷,第886-893页)。
[10] Dollár,P.(2016)。Piotr的图像和视频Matlab工具箱(PMT)。http://vision.ucsd.edu/pdollar/toolbox/doc/index.html。2018年11月1日检索。
[11] Dollár,P.、Appel,r.、Belongie,S.和Perona,P.(2014)。用于目标检测的快速特征金字塔。IEEE模式分析和机器智能汇刊(PAMI),36(8),1532-1545·doi:10.1109/TPAMI.2014.2300479
[12] Dollár,P.、Belongie,S.和Perona,P.(2010年)。西部最快的行人探测器。《英国机器视觉会议论文集》(BMVC)(第68.1-68.11页)。
[13] Dollár,P.、Tu,Z.、Perona,P.和Belongie,S.(2009年)。整体通道功能。《英国机器视觉会议论文集》(BMVC)(第91.1-91.11页)。
[14] Dollár,P.、Wojek,C.、Schiele,B.和Perona,P.(2012)。行人检测:最新技术评估。IEEE模式分析和机器智能交易(PAMI),34(4),743-761·doi:10.1109/TPAMI.2011.155
[15] Dubout,C.和Fleuret,F.(2012年)。线性目标探测器的精确加速度。《欧洲计算机视觉会议记录》(第301-311页)。
[16] Everingham,M.、Gool,L.V.、Williams,C.K.、Winn,J.和Zisserman,A.(2010年)。Pascal可视对象类(VOC)挑战。国际计算机视觉杂志,88(2),303-338·doi:10.1007/s11263-009-0275-4
[17] Everingham,M.、Gool,L.V.、Williams,C.K.I.、Winn,J.和Zisserman,A.(2016)。Pascal视觉对象类挑战2007(VOC2007)结果。http://host.robots.ox.ac.uk/pascal/VOC/voc2007/index.html。2018年11月1日检索。
[18] Felzenszwalb,P.F.、Girshick,R.B.、McAllester,D.和Ramanan,D.(2010年)。使用经过区分训练的基于零件的模型进行目标检测。IEEE模式分析和机器智能汇刊(PAMI),32(9),1627-1645·doi:10.10109/TPAMI.2009.167
[19] Gall,J.和Lempitsky,V.(2009年)。用于目标检测的特定类别hough森林。《IEEE计算机视觉和模式识别会议论文集》(第1022-1029页)。
[20] Geiger,A.、Lenz,P.和Urtasun,R.(2012)。我们准备好自动驾驶了吗?KITTI愿景基准套件。《计算机视觉和模式识别会议论文集》(第3354-3361页)。
[21] Gepperth,A.、Rebhan,S.、Hasler,S.和Fritsch,J.(2011年)。视觉处理层次中的有偏见竞争:一种使用多种线索的学习方法。认知计算,3(1),146-166·数字对象标识码:10.1007/s12559-010-9092-x
[22] Huang,J.和Mumford,D.(1999)。自然图像和模型的统计。《IEEE计算机视觉和模式识别会议论文集》(第1卷,第541-547页)。
[23] Kuo,C.H.和Nevatia,R.(2009年)。使用无监督子分类的鲁棒多视图汽车检测。IEEE计算机视觉应用研讨会论文集(第1-8页)。
[24] Lampert,C.H.、Blaschko,M.和Hofmann,T.(2008)。超越滑动窗口:通过高效的子窗口搜索进行对象定位。《IEEE计算机视觉和模式识别会议论文集》(第1-8页)。
[25] Leibe,B.、Leonardis,A.和Schiele,B.(2008)。具有交错分类和分割的鲁棒对象检测。国际计算机视觉杂志,77(1),259-289·文件编号:10.1007/s11263-007-0095-3
[26] Li,B.、Wu,T.和Zhu,S.C.(2014)。通过层次和or模型集成上下文和遮挡以进行车辆检测。《欧洲计算机视觉会议论文集》(第652-667页)。
[27] Maji,S.、Berg,A.C.和Malik,J.(2008年)。使用交叉核支持向量机进行分类是有效的。《IEEE计算机视觉和模式识别会议论文集》(第1-8页)。
[28] Maji,S.、Berg,A.C.和Malik,J.(2013)。加性核SVM的有效分类。IEEE模式分析和机器智能汇刊(PAMI),35(1),66-77·doi:10.1109/TPAMI.2012.62
[29] Mutch,J.和Lowe,D.G.(2008年)。使用具有有限接受域的稀疏特征进行对象类识别和定位。国际计算机视觉杂志,80(1),45-57·doi:10.1007/s11263-007-0118-0
[30] Naiel,M.A.、Ahmad,M.O.和Swamy,M.(2015)。使用DFT域中特征金字塔近似的车辆检测。图像分析和识别国际会议论文集。(ICIAR)(第429-436页)。斯普林格。
[31] Naiel,M.A.、Ahmad,M.O.和Swamy,M.N.S.(2014)。使用TD2DHOG功能检测车辆。《新电路与系统会议论文集》(NewCAS)(第389-392页)。
[32] Ohn-Bar,E.和Trivedi,M.M.(2015)。学习通过聚类外观模式来检测车辆。IEEE智能交通系统(ITS)汇刊,16(5),2511-2521·doi:10.1109/TITS.2015.2409889
[33] Papageorgiou,C.P.、Oren,M.和Poggio,T.(1998年)。目标检测的通用框架。第六届IEEE计算机视觉国际会议(ICCV)论文集(第555-562页)。
[34] Pepikj,B.、Stark,M.、Gehler,P.和Schiele,B.(2013)。对象类检测的遮挡模式。《IEEE计算机视觉和模式识别会议论文集》(第3286-3293页)。
[35] Ruderman,D.L.(1994)。自然图像的统计。网络:神经系统中的计算,5517-548·Zbl 0824.92030号 ·doi:10.1088/0954-898X_5_4_006
[36] Sivaraman,S.和Trivedi,M.(2010年)。用于道路车辆识别和跟踪的通用主动学习框架。IEEE智能交通系统(ITS),11(2),267-276·doi:10.1109/TITS.2010.2040177
[37] Sivaraman,S.和Trivedi,M.(2013a)。观察道路上的车辆:基于视觉的车辆检测、跟踪和行为分析的调查。IEEE智能交通系统(ITS),14(4),1773-1795·doi:10.1109/TITS.2013.2266661
[38] Sivaraman,S.和Trivedi,M.(2013b)。通过独立部件进行车辆检测,以帮助城市驾驶员。IEEE智能交通系统(ITS),14(4),1597-1608·doi:10.1109/TITS.2013.2264314
[39] Smith,J.O.(2007)。离散傅里叶变换数学(DFT)(第二版)。W3K发布。
[40] Takeuchi,A.、Mita,S.和McAllester,D.(2010年)。使用可变形对象模型和具有集成可能性的粒子滤波器进行车载车辆跟踪。IEEE智能车辆研讨会论文集(IV)(第1014-1021页)。
[41] Wang,C.、Fang,Y.、Zhao,H.、Guo,C.、Mita,S.和Zha,H.(2016)。遮挡和多视角道路车辆检测的概率推理。IEEE智能交通系统汇刊(ITS)17(1)。
[42] Wang,X.、Han,T.X.和Yan,S.(2009)。具有部分遮挡处理功能的HOG-LBP人体探测器。IEEE计算机视觉国际会议(ICCV)论文集(第32-39页)。
[43] Wang,X.,Yang,M.,Zhu,S.,&Lin,Y.(2015)。通用对象检测的区域集。IEEE模式分析和机器智能汇刊(PAMI),37(10),2071-2084·doi:10.1109/TPAMI.2015.2389830
[44] Wu,B.和Nevatia,R.(2007年)。用于多视图、多糖对象检测的聚类增强树分类器。IEEE计算机视觉国际会议(ICCV)论文集(第1-8页)。
[45] Wu,B.F.、Kao,C.C.、Jen,C.L.、Li,Y.F.、Chen,Y.H.和Juang,J.H.(2014)。一种用于车辆遮挡处理和跟踪的基于相对鉴别的面向纹理的粒子滤波方法。IEEE工业电子学报,614228-4237·doi:10.1109/TIE.2013.2284131
[46] Wu,J.、Liu,N.、Geyer,C.和Rehg,J.(2013)\[\text{C}^\text{4}\]C4:实时对象检测框架。IEEE图像处理学报,22(10),4096-4107·Zbl 1373.94820号 ·doi:10.1109/TIP.2013.2270111
[47] Xiang,Y.、Choi,W.、Lin,Y.和Savarese,S.(2015)。用于对象类别识别的数据驱动三维体素模式。《IEEE计算机视觉和模式识别会议论文集》(1903-1911页)。
[48] Yang,J.、Zhang,D.、Frangi,A.F.和Yang,J·Y.(2004)。二维主成分分析:一种基于外观的人脸表示和识别的新方法。IEEE模式分析和机器智能汇刊(PAMI),26(1),131-137·doi:10.1109/TPAMI.2004.1261097
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。