×

通用对象检测的深度学习:一项调查。 (英语) Zbl 1477.68393

摘要:目标检测是计算机视觉中最基本和最具挑战性的问题之一,它寻求从自然图像中大量预定义的类别中定位对象实例。深度学习技术已成为直接从数据中学习特征表示的有力策略,并在通用对象检测领域取得了显著突破。鉴于这一快速发展的时期,本文的目标是提供一个全面的调查,在这一领域的最新成就,由深度学习技术。本次调查共有300多篇研究成果,涵盖了通用对象检测的许多方面:检测框架、对象特征表示、对象建议生成、上下文建模、训练策略和评估指标。我们通过确定未来研究的方向来完成调查。

理学硕士:

68T45型 机器视觉与场景理解
68T07型 人工神经网络与深度学习
68-02年 与计算机科学有关的研究展览会(专著、调查文章)
PDF格式 BibTeX公司 XML 引用

参考文献:

[1] Agrawal,P.,Girshick,R.和Malik,J.(2014年)。分析了多层神经网络在目标识别中的性能。在ECCV中(第329-344页)。
[2] Alexe,B.,Deselaers,T.和Ferrari,V.(2010年)。什么是对象?在CVPR中(第73-80页)。
[3] 亚历克赛,B。;德斯莱尔斯,T。;Ferrari,V.,测量图像窗口的对象性,IEEE TPAMI,34,11,2189-2202(2012)
[4] Alvarez,J.和Salzmann,M.(2016年)。学习深层网络中神经元的数量。在夹(2270-2278页)。
[5] 安德烈奥普洛斯,A。;Tsotsos,J.,50年物体识别:前进方向,计算机视觉和图像理解,117827-891(2013)
[6] Arbeláez,P.,Hariharan,B.,Gu,C.,Gupta,S.,Bourdev,L.和Malik,J.(2012年)。使用区域和部分进行语义分割。在CVPR中(第3378-3385页)。
[7] Arbeláez,P.,Pont Tuset,J.,Barron,J.,Marques,F.和Malik,J.(2014年)。多尺度组合分组。在CVPR中(第328-335页)。
[8] 阿齐兹普尔。;拉扎维奇,A。;沙利文,J。;马基,A。;Carlsson,S.,通用convnet表示的可转让性因素,IEEE TPAMI,38,9,1790-1802(2016)
[9] Bansal,A.,Sikka,K.,Sharma,G.,Chellappa,R.和Divakaran,A.(2018年)。零射击目标检测。在ECCV。
[10] Bar,M.,《语境中的视觉对象》,《自然评论神经科学》,5,8,617-629(2004)
[11] Bell,S.,Lawrence,Z.,Bala,K.和Girshick,R.(2016年)。内外网:用跳转池和递归神经网络检测上下文中的对象。在CVPR中(第2874-2883页)。
[12] 贝隆吉,S。;马里克,J。;Puzicha,J.,使用形状上下文的形状匹配和对象识别,IEEE TPAMI,24,4,509-522(2002)
[13] 本吉奥,Y。;库维尔,A。;Vincent,P.,表征学习:回顾与新视角,IEEE TPAMI,35,8,1798-1828(2013)
[14] 比德曼,我,感知现实世界的场景。IJCV,177、7、77-80(1972年)
[15] Biederman,I.,《成分识别:人类图像理解的理论》,心理学评论,94,2115(1987)
[16] Biederman,I.,《成分识别:人类图像理解的理论》,心理学评论,94,2115(1987)
[17] Bilen,H.和Vedaldi,A.(2016年)。弱监督深度检测网络。在CVPR中(第2846-2854页)。
[18] Bodla,N.,Singh,B.,Chellappa,R.和Davis L.S.(2017年)。用一行代码改进目标检测。ICCV(第5562-5570页)。
[19] Borji,A.,Cheng,M.,Jiang,H.和Li,J.(2014年)。显著目标检测:调查,1,1-26。arXiv:1411.5878v1·Zbl 1408.94882
[20] 博尔德夫,L。;Brandt,J.,《通过软级联实现鲁棒目标检测》,CVPR,2236-243(2005)
[21] 布鲁纳,J。;Mallat,S.,不变散射卷积网络。IEEE TPAMI,35,81872-1886(2013年)
[22] Cai,Z.和Vasconcelos,N.(2018年)。级联RCNN:对高质量目标检测的深入研究。在CVPR中。
[23] Cai,Z.,Fan,Q.,Feris,R.和Vasconcelos,N.(2016年)。一种用于快速目标检测的统一多尺度深卷积神经网络。在ECCV中(第354-370页)。
[24] Cai,H.,Yang,J.,Zhang,W.,Han,S.和Yu,Y.等人(2018年),《高效架构搜索的路径级网络转换》。在ICML中。
[25] 卡拉拉,J。;Sminchisescu,C.,CMPC:使用约束参数最小割集的自动对象分割,IEEE TPAMI,34,7,1312-1328(2012)
[26] Chatfield,K.,Simonyan,K.,Vedaldi,A.和Zisserman,A.(2014年)。细节中的魔鬼归来:深入研究卷积网。在BMVC中。
[27] Chavali,N.,Agrawal,H.,Mahendru,A.和Batra,D.(2016年)。对象建议评估协议是可博弈的。在CVPR中(第835-844页)。
[28] Chellappa,R.,模式识别和计算机视觉、图像和视觉计算的不断变化的命运,55,3-5(2016)
[29] Chen,G.,Choi,W.,Yu,X.,Han,T.和Chandraker M.(2017a)。利用知识蒸馏学习有效的目标检测模型。在夹缝里。
[30] Chen,H.,Wang,Y.,Wang,G.和Qiao,Y.(2018a)。LSTD:一种用于目标检测的低镜头传输检测器。在AAAI。
[31] 陈K、彭杰、王杰、熊玉英、李小X、孙S、冯W、刘Z、施杰、欧阳伟等(2019a)。混合任务级联实例分割。在CVPR中。
[32] Chen,L.,Papandreou,G.,Kokkinos,I.,Murphy,K.和Yuille,A.(2015a),《使用深卷积网络和完全连接的CRF的语义图像分割》。在ICLR。
[33] 陈,L。;帕潘德里欧,G。;科基诺斯一世。;墨菲,K。;Yuille,A.,DeepLab:语义图像分割与深卷积网、阿托鲁斯卷积和完全连接的CRF,IEEE TPAMI,40,4834-848(2018)
[34] 陈,Q。;宋,Z。;东,J。;黄,Z。;华,Y。;Yan,S.,背景化目标检测和分类,IEEE TPAMI,37,1,13-27(2015)
[35] Chen,X.和Gupta,A.(2017年)。目标检测中上下文推理的空间记忆。在ICCV中。
[36] Chen,X.,Kundu,K.,Zhu,Y.,Berneshawi,A.G.,Ma,H.,Fidler,S.和Urtasun,R.(2015c)用于精确对象类检测的3d对象建议。在NIPS(第424-432页)。
[37] Chen,Y.,Li,J.,Xiao,H.,Jin,X.,Yan,S.,和Feng J.(2017b)。双路径网络。(第4467-4475页)。
[38] Chen,Y.,Rohrbach,M.,Yan,Z.,Yan,S.,Feng,J.和Kalantis,Y.(2019b),基于图的全局推理网络。在CVPR中。
[39] Chen,Y.,Yang,T.,Zhang,X.,Meng,G.,Pan,C.和Sun,J.(2019年)。目标检测的神经结构搜索。arXiv:1903.10979。
[40] Cheng,B.,Wei,Y.,Shi,H.,Feris,R.,Xiong,J.和Huang,T.(2018a)。解耦分类精化:用于目标检测的硬误报抑制。arXiv:1810.04002。
[41] Cheng,B.,Wei,Y.,Shi,H.,Feris,R.,Xiong,J.和Huang,T.(2018b)。重温RCNN:关于唤醒快速RCNN分类能力的思考。在ECCV。
[42] Cheng,G.,Zhou,P.,和Han,J.(2016年)。riffcnn:用于目标检测的旋转不变和fisher判别卷积神经网络。在CVPR中(第2884-2893页)。
[43] Cheng,M.,Zhang,Z.,Lin,W.和Torr,P.(2014年)。BING:以300fps的速度进行目标度估计的二值化标准梯度。在CVPR中(第3286-3293页)。
[44] 程,Y。;王博士。;周,P。;Zhang,T.,深层神经网络的模型压缩和加速:原理、进展和挑战,IEEE信号处理杂志,35,1126-136(2018)
[45] Chollet,F.(2017年)。例外:深度学习与深度分离卷积。在CVPR(第1800-1807页)。
[46] 辛比斯,R。;韦贝克,J。;Schmid,C.,《基于多重多实例学习的弱监督目标定位》,IEEE TPAMI,39,1199-203(2017)
[47] Csurka,G.,Dance,C.,Fan,L.,Willamowski,J.和Bray,C.(2004年)。视觉分类与袋的关键点。在ECCV计算机视觉统计学习研讨会上。
[48] Dai,J.,He,K.,Li,Y.,Ren,S.,和Sun,J.(2016a)。实例敏感的完全卷积网络。在ECCV中(第534-549页)。
[49] Dai,J.,He,K.和Sun J.(2016b)。通过多任务网络级联实现实例感知语义分割。在CVPR中(第3150-3158页)。
[50] Dai,J.,Li,Y.,He,K.和Sun,J.(2016c)。RFCN:基于区域的全卷积网络的目标检测。在尼普斯(第379-387页)。
[51] Dai,J.,Qi,H.,Xiong,Y.,Li,Y.,Zhang,G.,Hu,H.和Wei,Y.(2017年)。可变形卷积网络。在ICCV中。
[52] 达拉尔,N。;Triggs,B.,《人类检测定向梯度直方图》,CVPR,1886-893(2005)
[53] Demirel,B.,Cinbis,R.G.和Ikizler Cinbis,N.(2018年)。基于混合区域嵌入的零镜头目标检测。在BMVC中。
[54] Deng,J.,Dong,W.,Socher,R.,Li,L.,Li,K.和Li,F.(2009年)。ImageNet:一个大规模的层次图像数据库。在CVPR中(第248-255页)。
[55] Diba,A.,Sharma,V.,Pazandeh,A.M.,Pirsiavash,H.和Van Gool L.(2017年)。弱监督级联卷积网络。在CVPR中(第3卷,第9页)。
[56] 狄金森。;莱昂纳迪丝,A。;斯基尔,B。;Tarr,M.,《对象分类中对象分类的进化和图像抽象的挑战:计算机和人类视觉透视》(2009),剑桥:剑桥大学出版社,剑桥
[57] Ding,J.,Xue,N.,Long,Y.,Xia,G.和Lu,Q.(2018年)。学习RoI变换器用于航空图像中定向目标的检测。在CVPR中。
[58] Divvala,S.,Hoiem,D.,Hays,J.,Efros,A.和Hebert,M.(2009年)。目标检测中语境的实证研究。在CVPR中(第1271-1278页)。
[59] 美元,P。;沃杰克,C。;斯基尔,B。;Perona,P.,《行人检测:对技术现状的评估》,IEEE TPAMI,34,4,743-761(2012)
[60] 多纳休,J。;贾,Y。;葡萄酒,哦。;霍夫曼,J。;张,N。;Tzeng,E.,DeCAF:通用视觉识别的深度卷积激活特征,ICML,32647-655(2014)
[61] 东,X。;郑,L。;文学硕士,女。;杨,Y。;Meng,D.,用模型通信进行的少数示例对象检测,IEEE模式分析与机器智能汇刊,41,7,1641-1654(2018)
[62] Duan,K.,Bai,S.,Xie,L.,Qi,H.,Huang,Q.,和Tian,Q.(2019年)。CenterNet:用于目标检测的Keypoint三元组。arXiv:1904.08189。
[63] Dvornik,N.,Mairal,J.和Schmid,C.(2018年)。可视化上下文建模是扩充目标检测数据集的关键。在ECCV中(第364-380页)。
[64] Dwibedi,D.,Misra,I.和Hebert,M.(2017年)。剪切,粘贴和学习:令人惊讶的简单合成,例如检测。在ICCV(第1301-1310页)。
〔65〕 恩德斯,I。;你好,D。;丹尼利迪斯,K。;马拉戈斯,P。;Paragios,N.,类别独立对象提案,欧洲计算机视觉会议,575-588(2010),柏林:斯普林格,柏林
[66] 恩兹韦勒,M。;Gavrila,Dm,《单目行人检测:调查与实验》,IEEE TPAMI,31,12,2179-2195(2009)
[67] Erhan,D.,Szegedy,C.,Toshev,A.和Anguelov,D.(2014年)。使用深度神经网络的可伸缩目标检测。在CVPR中(第2147-2154页)。
[68] Everingham,M。;埃斯拉米。;古尔,吕;威廉姆斯,C。;维恩,J。;Zisserman,A.,《pascal可视化对象类挑战:回顾》,IJCV,111,1198-136(2015)
〔69〕 Everingham,M。;古尔,吕;威廉姆斯,C。;维恩,J。;Zisserman,A.,pascal可视化对象类(voc)挑战,IJCV,88,22303-338(2010)
[70] Feichtenhofer,C.,Pinz,A.和Zisserman,A.(2017年)。检测跟踪和跟踪检测。在ICCV中(第918-927页)。
[71] 菲菲,L。;弗格斯,R。;Perona,P.,一次性学习对象类别,IEEE TPAMI,28,4,594-611(2006)
[72] Felzenszwalb,P.,Girshick,R.和McAllester,D.(2010a)。基于可变形零件模型的级联目标检测。在CVPR中(第2241-2248页)。
[73] 费尔岑斯瓦尔布,P。;吉尔希克,R。;麦卡莱斯特,D。;Ramanan,D.,《基于区分训练的零件模型的目标检测》,IEEE TPAMI,32,9,1627-1645(2010)
[74] Felzenszwalb,P.,McAllester,D.和Ramanan,D.(2008年)。一个有区别的训练,多尺度,可变形的零件模型。在CVPR中(第1-8页)。
[75] Finn,C.,Abbeel,P.和Levine,S.(2017年)。模型不可知元学习快速适应深层网络。在ICML中(第1126-1135页)。
[76] 费什勒,M。;《图形结构的表示与匹配》,IEEE计算机汇刊,100,167-92(1973)
[77] 傅,C.-Y。,Liu,W.,Ranga,A.,Tyagi,A.和Berg,A.C.(2017年)。DSSD:反褶积单炮探测器。arXiv:1701.06659。
[78] 加勒基洛斯,C。;Belongie,S.,基于上下文的对象分类:关键调查,计算机视觉和图像理解,114712-722(2010)
[79] 杰罗尼莫,D。;洛佩兹,Am;萨帕,公元前;Graf,T.,高级驾驶员辅助系统行人检测调查,IEEE TPAMI,32,7,1239-1258(2010)
[80] Ghiasi,G.,Lin,T.,Pang,R.和Le,Q.(2019年)。NASFPN:学习用于目标检测的可伸缩特征金字塔结构。arXiv:1904.07392。
[81] Ghodrati,A.,Diba,A.,Pedersoli,M.,Tuytelaars,T.和Van Gool,L.(2015年)。深度建议:通过级联深层卷积层来寻找目标。ICCV(第2578-2586页)。
[82] Gidaris,S.和Komodakis,N.(2015年)。通过多区域和语义分割感知CNN模型进行目标检测。在ICCV中(1134-1142页)。
[83] Gidaris,S.和Komodakis,N.(2016年)。参与细化重复:通过输入输出本地化生成活动框建议。在BMVC中。
[84] Girshick,R.(2015年)。快速R-CNN。在ICCV中(1440-1448页)。
[85] Girshick,R.,Donahue,J.,Darrell,T.和Malik,J.(2014年)。丰富的特征层次结构用于精确的对象检测和语义分割。在CVPR中(第580-587页)。
[86] 吉尔希克,R。;多纳休,J。;达雷尔,T。;Malik,J.,《用于精确目标检测和分割的基于区域的卷积网络》,IEEE TPAMI,38,11942-158(2016)
[87] Girshick,R.,Iandola,F.,Darrell,T.和Malik,J.(2015年)。可变形零件模型是卷积神经网络。在CVPR中(第437-446页)。
[88] 古德费罗,我。;本吉奥,Y。;Courville,A.,深度学习(2016),剑桥:麻省理工学院出版社,剑桥·Zbl 1373.68009
[89] Goodfello,I.,Shlens,J.和Szegedy,C.(2015年)。解释和利用对手的例子。在ICLR。
[90] 格拉曼,K。;《金字塔匹配核:基于图像特征集的判别分类》,ICCV,21458-1465(2005)
[91] 格拉曼,K。;Leibe,B.,视觉对象识别,人工智能和机器学习综合讲座,5,2,1-181(2011)
[92] 顾,J。;王,Z。;Kuen,J。;文学硕士。;沙鲁迪,A。;Shuai,B.,卷积神经网络的最新进展,模式识别,77354-377(2018)
[93] 纪尧明,M。;Küttel,D。;Ferrari,V.,带分割传播的Imagenet自动注释,国际计算机视觉杂志,110,3,328-348(2014)
[94] Gupta,A.,Vedaldi,A.和Zisserman,A.(2016年)。自然图像中文本定位的合成数据。在CVPR中(第2315-2324页)。
[95] Han,S.,Dally,W.J.和Mao,H.(2016年)。深度压缩:用剪枝、训练量化和哈夫曼编码对深层神经网络进行压缩。在ICLR。
[96] Hariharan,B.,Arbeláez,P.,Girshick,R.和Malik,J.(2014年)。同时检测和分割。在ECCV中(第297-312页)。
[97] 哈里哈兰,B。;阿尔贝雷斯,P。;吉尔希克,R。;Malik,J.,使用超列的对象实例分割和细粒度定位,IEEE模式分析和机器智能事务,39,4627-639(2016)
[98] Hariharan,B.和Girshick R.B.(2017年)。通过收缩和幻觉特征进行低镜头视觉识别。ICCV(第3037-3046页)。
[99] Harzallah,H.,Jurie,F.和Schmid,C.(2009年)。结合有效的目标定位和图像分类。ICCV(第237-244页)。
[100] He,K.,Gkioxari,G.,Dollár,P.和Girshick,r.(2017年)。屏蔽RCNN。在ICCV中。
[101] He,K.,Zhang,X.,Ren,S.,和Sun,J.(2014年)。用于视觉识别的深卷积网络中的空间金字塔池。在ECCV中(第346-361页)。
[102] He,K.,Zhang,X.,Ren,S.,和Sun,J.(2015年)。深入研究整流器:在ImageNet分类上超越人类水平的性能。在ICCV中(第1026-1034页)。
[103] He,K.,Zhang,X.,Ren,S.,和Sun,J.(2016年)。图像识别的深度残差学习。在CVPR中(第770-778页)。
[104] He,T.,Tian,Z.,Huang,W.,Shen,C.,Qiao,Y.,和Sun,C.(2018年)。一个具有明确对齐和注意力的端到端文本识别器。在CVPR中(第5020-5029页)。
[105] He,Y.,Zhu,C.,Wang,J.,Savvides,M.和Zhang,X.(2019年)。具有不确定性的边界盒回归用于精确目标检测。在CVPR中。
[106] 辛顿,G。;Salakhutdinov,R.,用神经网络降低数据的维数,科学,313,5786,504-507(2006)·Zbl 1226.68083
[107号] Hinton,G.,Vinyals,O.和Dean,J.(2015年)。在神经网络中提取知识。arXiv:1503.02531。
[108] Hoffman,J.,Guadarrama,S.,Tzeng,E.S.,Hu,R.,Donahue,J.,Girshick,R.,Darrell,T.和Saenko,K.(2014年)。LSDA:通过自适应进行大规模检测。(第3536-3544页)。
[109号] Hoiem,D.,Chodpathumwan,Y.和Dai,Q.(2012年)。目标探测器的诊断错误。在ECCV中(第340-353页)。
[110] 何桑,J。;贝内森,R。;多拉,P。;Schiele,B.,什么是有效的检测建议?,IEEE TPAMI,38,4814-829(2016年)
[111] Hosang,J.,Benenson,R.和Schiele,B.(2017年)。学习非最大抑制。在ICCV中。
[112] Hosang,J.,Omran,M.,Benenson,R.和Schiele,B.(2015年)。深入观察行人。在IEEE计算机视觉和模式识别会议论文集(第4073-4082页)。
[113] Howard,A.,Zhu,M.,Chen,B.,Kalenichenko,D.,Wang,W.,Weyand,T.,Andreetto,M.和Adam,H.(2017年)。Mobilenets:用于移动视觉应用的有效卷积神经网络。在CVPR中。
[114] Hu,H.,Gu,J.,Zhang,Z.,Dai,J.和Wei,Y.(2018a)。用于目标检测的关系网络。在CVPR中。
[115] Hu,H.,Lan,S.,Jiang,Y.,Cao,Z.和Sha,F.(2017年)。快速掩模:一次分割多尺度候选对象。在CVPR中(第991-999页)。
[116] Hu,J.,Shen,L.和Sun,G.(2018b)。挤压和激励网络。在CVPR中。
[117] Hu,P.和Ramanan,D.(2017年)。找到小脸蛋。在CVPR中(第1522-1530页)。
[118] Hu,R.,DolláR,P.,He,K.,Darrell,T.和Girshick,R.(2018年c)。学会把每件事都分割开来。在CVPR中。
[119] Huang,G.,Liu,S.,van der Maaten,L.,和Weinberger,K.(2018年)。CondenseNet:一个使用学习群卷积的有效densenet。在CVPR中。
[120] Huang,G.,Liu,Z.,Weinberger,K.Q.和van der Maaten,L.(2017a)。密集连接的卷积网络。在CVPR中。
〔121〕 Huang,J.,Rathod,V.,Sun,C.,Zhu,M.,Koratikara,A.,Fathi,A.,Fischer,I.,Wojna,Z.,Song,Y.,Guadarrama,S.和Murphy,K.(2017b)。现代卷积目标探测器的速度/精度权衡。在CVPR中。
[122号] Huang,Z.,Huang,L.,Gong,Y.,Huang,C.和Wang,X.(2019年)。掩模评分rcnn。在CVPR中。
[123号] Hubara,I.,Courbariaux,M.,Soudry,D.,ElYaniv,R.和Bengio,Y.(2016年)。二值化神经网络。(第4107-4115页)。
[124] Iandola,F.,Han,S.,Moskewicz,M.,Ashraf,K.,Dally,W.和Keutzer,K.(2016年)。挤压网:亚历克斯内特级精度与50倍以下的参数和0.5 mb模型大小。arXiv:1602.07360。
[125] ILSVRC检测挑战结果。(2018年)。http://www.image-net.org/challenges/LSVRC/。
[126] Ioffe,S.和Szegedy,C.(2015年)。批量规范化:通过减少内部协变量的偏移来加速深度网络训练。在国际机器学习会议(第448-456页)。
[127号] Jaderberg,M.,Simonyan,K.,Zisserman,A.等人(2015年)。空间变压器网络。NIPS(第2017-2025页)。
[128] Jia,Y.,Shelhamer,E.,Donahue,J.,Karayev,S.,Long,J.,Girshick,R.,Guadarrama,S.和Darrell,T.(2014年)。Caffe:快速特征嵌入的卷积体系结构。用ACM毫米制成(第675-678页)。
[129] Jiang,B.,Luo,R.,Mao,J.,Xiao,T.和Jiang,Y.(2018年)。精确目标检测的定位置信度获取。在ECCV中(第784-799页)。
[130] Kang,B.,Liu,Z.,Wang,X.,Yu,F.,Feng,J.,和Darrell,T.(2018年)。基于特征重权的少镜头目标检测。arXiv:1812.01866。
[131号] Kang,K.,Ouyang,W.,Li,H.和Wang,X.(2016年)。基于卷积神经网络的视频管目标检测。在CVPR(第817-825页)。
[132] Kim,A.,Sharma,A.和Jacobs,D.(2014年)。局部尺度不变卷积神经网络。在夹缝里。
[133] Kim,K.,Hong,S.,Roh,B.,Cheon,Y.和Park,M.(2016年)。PVANet:用于实时目标检测的深度但轻量级的神经网络。在NIPSW。
[134号] Kim,Y,Kang,B.-N.和Kim,D.(2018年)。SAN:用于多尺度目标检测的卷积特征之间的学习关系。在ECCV中(第316-331页)。
[135] Kirillov,A.,He,K.,Girshick,R.,Rother,C.和DolláR,P.(2018年)。全景分割。arXiv:1801.00868。
[136] Kong,T.,Sun,F.,Tan,C.,Liu,H.和Huang,W.(2018年)。用于目标检测的深度特征金字塔重构。在ECCV中(第169-185页)。
[137] Kong,T.,Sun,F.,Yao,A.,Liu,H.,Lu,M.和Chen,Y.(2017年)。罗恩:反向连接物体检测的先验网络。在CVPR中。
[138] Kong,T.,Yao,A.,Chen,Y.,和Sun,F.(2016年)。HyperNet:实现精确的区域建议生成和联合目标检测。在CVPR(第845-853页)。
[139号] Krähenbühl,P.和Koltun,V.(2014),测地物体提案。在ECCV。
[140] Krasin,I.,Duerig,T.,Alldrin,N.,Ferrari,V.,AbuElHaija,S.,Kuznetsova,A.等人(2017年)。OpenImages:用于大规模多标签和多类图像分类的公共数据集。数据集可从https://storage.googleapis.com/openimages/web/index.html。
[141] Krizhevsky,A.,Sutskever,I.和Hinton,G.(2012年A)。用深卷积神经网络进行图像网络分类。(第1097-1105页)。
[142号] Krizhevsky,A.、Sutskever,I.和Hinton,G.(2012b)。用深卷积神经网络进行图像网络分类。(第1097-1105页)。
[143] Kuo,W.,Hariharan,B.和Malik,J.(2015年)。DeepBox:用卷积网络学习对象性。ICCV(第2479-2487页)。
[144] Kuznetsova,A.,Rom,H.,Alldrin,N.,Uijlings,J.,Krasin,I.,Pontuset,J.等人(2018年)。openimagesdataset v4:统一图像分类、对象检测和可视关系检测。arXiv:1811.00982。
[145] 莱克,B。;萨拉胡特迪诺夫,R。;Tenenbaum,J.,《通过概率程序归纳法进行人类层面的概念学习》,科学,350,6266,1332-1338(2015)·Zbl 1355.68230
[146号] Lampert,C.H.,Blaschko,M.B.和Hofmann,T.(2008年)。超越滑动窗口:通过有效的子窗口搜索进行对象定位。在CVPR中(第1-8页)。
[147] Law,H.和Deng,J.(2018年)。CornerNet:将对象作为成对的关键点进行检测。在ECCV。
[148] 拉泽布尼克。;施密德,C。;Ponce,J.,Beyond bags of features:用于识别自然场景类别的空间金字塔匹配,CVPR,2169-2178(2006)
[149号] 莱昆,Y。;本吉奥,Y。;Hinton,G.,深度学习,自然,521436-444(2015)
[150] 莱昆,Y。;洛城博图。;本吉奥,Y。;Haffner,P.,基于梯度的学习应用于文档识别,IEEE论文集,86,11,2278-2324(1998)
[151] Lee,C.,Xie,S.,Gallagher,P.,Zhang,Z.,和Tu,Z.(2015年)。严密监管的网络。《人工智能与统计学》(第562-570页)。
[152] Lenc,K.和Vedaldi,A.(2015年)。R-CNN减去BMVC15中的R。
[153] Lenc,K.和Vedaldi,A.(2018年)。通过测量图像的等变性和等价性来理解图像表示。在IJCV。
[154] Li,B.,Liu,Y.和Wang,X.(2019a年)。梯度协调单级检测器。在AAAI。
[155] Li,H.,Kadav,A.,Durdanovic,I.,Samet,H.和Graf,H.P.(2017a)。修剪过滤器以实现高效的转换。在ICLR。
[156] Li,H.,Lin,Z.,Shen,X.,Brandt,J.和Hua,G.(2015a)。一种用于人脸检测的卷积神经网络级联。在CVPR中(第5325-5334页)。
[157] Li,H.,Liu,Y.,Ouyang,W.和Wang,X.(2018a)。具有地图注意决策的缩小和网络内的区域建议和目标检测。在IJCV。
[158] 李,J。;魏,Y。;梁某。;东,J。;徐,T。;Feng,J.,目标检测的注意上下文,IEEE多媒体事务,19,5944-954(2017)
[159] Li,Q.,Jin,S.和Yan,J.(2017c)。模仿非常有效的网络目标检测。在CVPR中(第7341-7349页)。
[160] 李,Sz;Zhang,Z.,Floatboost学习和统计人脸检测,IEEE TPAMI,26,9,1112-1123(2004)
[161] Li,Y.,Chen,Y.,Wang,N.和Zhang,Z.(2019b年)。用于目标检测的比例感知三叉戟网络。arXiv:1901.01892。
[162] Li,Y.,Ouyang,W.,Zhou,B.,Wang,K.和Wang,X.(2017d)。从对象、短语和区域标题生成场景图。在ICCV(第1261-1270页)。
[163] Li,Y.,Qi,H.,Dai,J.,Ji,X.和Wei,Y.(2017e.)。完全卷积的实例感知语义分割。在CVPR中(第4438-4446页)。
[164] 李,Y。;王,S。;田,Q。;Ding,X.,基于统计学习的目标检测的特征表示:综述,模式识别,48,11,3542-3559(2015)
[165] Li,Z.,Peng,C.,Yu,G.,Zhang,X.,Deng,Y.,和Sun,J.(2018b)。DetNet:一个用于目标检测的主干网。在ECCV。
[166号] Li,Z.,Peng,C.,Yu,G.,Zhang,X.,Deng,Y.,和Sun,J.(2018c)。光头RCNN:用于防御两级目标探测器。在CVPR中。
[167] Lin,T.,Dollár,P.,Girshick,r.,He,K.,Hariharan,B.和Belongie,S.(2017a)。用于目标检测的特征金字塔网络。在CVPR中。
[168号] Lin,T.,Goyal,P.,Girshick,R.,He,K.和DolláR,P.(2017b)。密集目标探测的焦距损失。在ICCV中。
[169] Lin,T.,Maire,M.,Belongie,S.,Hays,J.,Perona,P.,Ramanan,D.,Dollár,P.和Zitnick,L.(2014年)。microsoftcoco:上下文中的公共对象。在ECCV中(第740-755页)。
[170] Lin,X.,Zhao,C.和Pan,W.(2017c)。二元卷积神经网络。(第344-352页)。
[171] 利特延斯,G。;古伊,T。;比约诺迪。;塞蒂奥,A。;乔姆皮,F。;Ghafoorian,M.,医学图像分析深度学习调查,医学图像分析,42,60-88(2017)
[172] Liu,C.,Zoph,B.,Neumann,M.,Shlens,J.,Hua,W.,Li,L.,FeiFei,L.,Yuille,A.,Huang,J.和Murphy,K.(2018a)。渐进神经结构搜索。在ECCV中(第19-34页)。
[173] 刘,L。;菲古斯,P。;郭,Y。;王,X。;Pietikäinen,M.,纹理分类的局部二元特征:分类和实验研究,模式识别,62135-160(2017)
[174] Liu,S.,Huang,D.和Wang,Y.(2018b)。接收场阻断网,用于准确和快速的目标检测。在ECCV。
[175] Liu,S.,Qi,L.,Qin,H.,Shi,J.和Jia,J.(2018c)。实例分段的路径聚合网络。在CVPR中(第8759-8768页)。
[176] Liu,W.,Anguelov,D.,Erhan,D.,Szegedy,C.,Reed,S.,Fu,C.和Berg,A.(2016年)。SSD:单发多盒探测器。在ECCV中(第21-37页)。
[177] Liu,Y.,Wang,R.,Shan,S.和Chen,X.(2018d)。结构推理网:使用场景级上下文和实例级关系进行对象检测。在CVPR中(第6985-6994页)。
[178] Long,J.,Shelhamer,E.和Darrell,T.(2015年)。用于语义分割的完全卷积网络。在IEEE计算机视觉和模式识别会议论文集(第3431-3440页)。
[179] Lowe,D.,局部尺度不变特征的目标识别,ICCV,21150-1157(1999)
[180度] Lowe,D.,《尺度不变关键点的独特图像特征》,IJCV,60,2,91-110(2004)
[181号] Loy,C.,Lin,D.,欧阳,W.,Xiong,Y.,Yang,S.,Huang,Q.等人(2019年)。2018年更广泛的面孔和行人挑战:方法和结果。arXiv:1902.06854。
[182号] Lu,Y.,Javidi,T.和Lazebnik,S.(2016年)。基于邻接和缩放预测的自适应目标检测。在CVPR中(第2351-2359页)。
[183] Luo,P.,Wang,X.,Shao,W.,和Peng,Z.(2018年)。对批量规范化中正则化的理解。在ICLR。
[184] Luo,P.,Zhang,R.,Ren,J.,Peng,Z.,和Li,J.(2019年)。用于学习规范化深层表示的可切换规范化。IEEE模式分析与机器智能汇刊。10.1109/TPAMI.2019.2932062。
[185] Malisiewicz,T.和Efros,A.(2009年)。超越范畴:用于推理对象关系的可视化memex模型。在夹缝里。
[186] 文学硕士、法学硕士。;邵伟。;叶,H。;王,L。;王,H。;Zheng,Y.,《通过旋转方案进行任意定向场景文本检测》,IEEE TMM,20,11,3111-3122(2018)
[187] Manen,S.,Guillaumin,M.和Van Gool,L.(2013年)。用随机prim算法提出素数目标。在CVPR中(第2536-2543页)。
[188] Mikolajczyk,K。;Schmid,C.,局部描述符的性能评估,IEEE TPAMI,27,10,1615-1630(2005)
[189] Mordan,T.,Thome,N.,Henaff,G.和Cord,M.(2018年)。基于潜在可变形零件的目标检测表示的端到端学习。在IJCV(第1-21页)。
[190号] 微软COCO检测排行榜。(2018年)。http://cocodataset.org/#检测-排行榜。
[191] 蒙迪,J。;庞塞,J。;赫伯特,M。;施密德,C。;Zisserman,A.,《几何时代的对象识别:回顾》,面向类别级对象识别的书籍,3-28(2006),柏林:斯普林格,柏林
[192号] 穆拉泽,H。;Nayar,S.,《从外观看3D物体的视觉学习和识别》,IJCV,14,1,5-24(1995)
[193] 穆拉泽,H。;Nayar,S.,《从外观看3d物体的视觉学习和识别》,IJCV,14,1,5-24(1995)
[194号] Murphy,K.,Torralba,A.和Freeman,W.(2003年)。利用森林看树:一个与特征、物体和场景相关的图形模型。在夹缝里。
[195] Newell,A.,Huang,Z.,和Deng,J.(2017年)。联合嵌入:用于联合检测和分组的端到端学习。在尼普斯(2277-2287页)。
[196] Newell,A.,Yang,K.和Deng,J.(2016年)。用于人体姿态估计的堆叠沙漏网络。在ECCV中(第483-499页)。
[197] 奥贾拉,T。;皮提克伊宁,M。;Maenpä,T.,具有局部二元模式的多分辨率灰度和旋转不变纹理分类,IEEE TPAMI,24,7,971-987(2002)
[198] 奥利瓦,A。;Torralba,A.,背景在物体识别中的作用,认知科学趋势,11,12,520-527(2007)
[199] 欧佩尔特,A。;平茨,A。;富森格尔,M。;Auer,P.,带boosting的通用对象识别,IEEE TPAMI,28,3,416-431(2006)
[200] Oquab,M.,Bottou,L.,Laptev,I.和Sivic,J.(2014年)。使用卷积神经网络学习和传输中层图像表示。在CVPR(第1717-1724页)。
[201] Oquab,M.,Bottou,L.,Laptev,I.和Sivic,J.(2015年)。对象本地化是免费的吗?卷积神经网络弱监督学习。在CVPR中(第685-694页)。
[202] Osuna,E.,Freund,R.和Girosit,F.(1997年)。训练支持向量机:在人脸检测中的应用。在CVPR中(第130-136页)。
[203] Ouyang,W.和Wang,X.(2013年)。用于行人检测的联合深度学习。在ICCV中(第2056-2063页)。
[204] 欧阳,W.,王,X.,曾,X.,邱,S.,罗,P.,田,Y.,李H.,杨,S.,王,Z.,洛伊,C.-C。,等人(2015年)。DeepIDNet:用于目标检测的可变形深卷积神经网络。在CVPR中(第2403-2412页)。
[205] Ouyang,W.,Wang,X.,Zhang,C.和Yang,X.(2016年)。长尾分布目标检测的精细调整深度模型的影响因素。在CVPR中(第864-873页)。
[206] Ouyang,W.,Wang,K.,Zhu,X.和Wang,X.(2017a)。用于目标检测的链式级联网络。在ICCV中。
[207] 欧阳W。;曾某。;王,X。;邱,S。;罗,P。;Tian,Y.,DeepIDNet:基于可变形部件的卷积神经网络目标检测,IEEE TPAMI,39,7,1320-1334(2017)
[208号] 帕里克,D。;齐特尼克,C。;陈,T.,《探索微小图像:机器和人类物体识别中的外观和上下文信息的作用》,IEEE TPAMI,34,10,1978-1991(2012)
[209] PASCAL VOC检测排行榜。(2018年)。http://host.robots.ox.ac.uk:8080/leaderboard/main_bootstrap.php
[210] Peng,C.,Xiao,T.,Li,Z.,Jiang,Y.,Zhang,X.,Jia,K.,Yu,G.,和Sun,J.(2018年)。MegDet:一种大型的小型批量对象检测器。在CVPR中。
[211] Peng,X.,Sun,B.,Ali,K.和Saenko,K.(2015年)。从三维模型学习深部物体探测器。ICCV(第1278-1286页)。
[212] Pepik,B.,Benenson,R.,Ritschel,T.和Schiele,B.(2015年)。是什么阻碍了convnets的检测?德国模式识别会议(第517-528页)。
[213] Perronnin,F.,Sánchez,J.和Mensink,T.(2010年)。改进了fisher核的大尺度图像分类方法。在ECCV中(第143-156页)。
[214] Pinheiro,P.,Collobert,R.和Dollar,P.(2015年)。学习分割候选对象。在NIPS(1990-1998页)。
[215] Pinheiro,P.,Lin,T.,Collobert,R.和DolláR,P.(2016年)。学习细化对象段。在ECCV中(第75-91页)。
[216] 庞塞,J。;赫伯特,M。;施密德,C。;Zisserman,A.,面向类别级对象识别(2007),柏林:斯普林格,柏林
[217] 普扬法尔,萨米拉;萨迪克,萨阿德;燕,依林;田海曼;陶玉东;雷耶斯,玛丽亚·普雷莎;施玉、梅玲;陈树青;Iyengar,S.S.,深度学习调查,ACM计算调查,51,5,1-36(2018)
[218] Qi,C.R.,Liu,W.,Wu,C.,Su,H.和Guibas,L.J.(2018年)。用于从RGBD数据中检测3D对象的视锥点网。在CVPR中(第918-927页)。
[219] Qi,C.R.,Su,H.,Mo,K.和Guibas,L.J.(2017年)。点网:对三维分类和分割的点集的深入学习。在CVPR中(第652-660页)。
[220] Quanming,Y.,Mengshou,W.,Hugo,J.E.,Isabelle,G.,Yiqi,H.,Yufeng,L.,等(2018年)。将人从学习应用中剔除:自动化机器学习综述。arXiv:1810.13306。
[221] Rabinovich,A.,Vedaldi,A.,Galleguillos,C.,Wiewiora,E.和Belongie,S.(2007年)。上下文中的对象。在ICCV中。
[222号] Rahman,S.,Khan,S.和Barnes,N.(2018a)。零炮目标检测的极性损失。arXiv:1811.08982。
[223] Rahman,S.,Khan,S.和Porikli,F.(2018b)。零射击目标检测:学习同时识别和定位新概念。在ACCV。
[224] Razavian,R.,Azizpour,H.,Sullivan,J.和Carlsson,S.(2014年)。美国有线电视新闻网(CNN)的特色是现成的:一个惊人的识别基线。在CVPR研讨会(第806-813页)。
[225] Reffi,S.,Bilen,H.和Vedaldi,A.(2017年)。使用剩余适配器学习多个可视域。神经信息处理系统进展(第506-516页)。
[226] Reffi,S.,Bilen,H.和Vedaldi A.(2018年)。多域深度神经网络的有效参数化。在CVPR中(第8119-8127页)。
[227号] Redmon,J.,Divvala,S.,Girshick,R.和Farhadi,A.(2016年)。你只看一次:统一的、实时的对象检测。在CVPR中(第779-788页)。
[228] Redmon,J.和Farhadi,A.(2017年)。尤洛9000:更好,更快,更强。在CVPR中。
[229] Ren,M.,Triantafillou,E.,Ravi,S.,Snell,J.,Swersky,K.,Tenenbaum,J.B.,Larochelle,H.和Zemel R.S.(2018年)。半监督少镜头分类的元学习。在ICLR。
[230] Ren,S.,He,K.,Girshick,R.和Sun,J.(2015年)。更快的R-CNN:用区域建议网络实现实时目标检测。(第91-99页)。
[231] 任,S。;他,K。;吉尔希克,R。;Sun,J.,更快的RCNN:用区域建议网络实现实时目标检测,IEEE TPAMI,39,6,1137-1149(2017)
[232] 任,S。;他,K。;吉尔希克,R。;张,X。;Sun,J.,卷积特征映射上的目标检测网络,模式分析和机器智能IEEE交易,39,7,1476-1481(2016)
[233] Rezatofighi,H.,Tsoi,N.,Gwak,J.,Sadeghian,A.,Reid,I.,和Savarese,S.(2019年)。并上的广义交:边界盒回归的度量和损失。在CVPR中。
[234] 罗利,H。;巴鲁贾,S。;Kanade,T.,基于神经网络的人脸检测,IEEE TPAMI,20,1,23-38(1998)
[235] 俄罗斯卡夫斯基。;邓,J。;苏,H。;克劳斯,J。;萨希什,S。;Ma,S.,ImageNet大规模视觉识别挑战赛,IJCV,115,3,211-252(2015)
[236] 拉塞尔,B。;托拉尔巴,A。;墨菲,K。;Freeman,W.,LabelMe:用于图像注释的数据库和基于web的工具,IJCV,77,1-3,157-173(2008)
[237] 施密德,C。;Mohr,R.,图像检索的局部灰度不变量,IEEE TPAMI,19,5,530-535(1997)
[238] Schwartz,E.,Karlinsky,L.,Shtok,J.,Harary,S.,Marder,M.,Pankanti,S.,Feris,R.,Kumar,A.,Giries,R.和Bronstein,A.(2019年)。RepMet:基于代表性的度量学习,用于分类和一次性目标检测。在CVPR中。
[239] Sermanet,P.,Eigen,D.,Zhang,X.,Mathieu,M.,Fergus,R.和LeCun,Y.(2014年)。OverFeat:使用卷积网络集成识别、定位和检测。在ICLR。
[240] Sermanet,P.,Kavukcuoglu,K.,Chintala,S.和LeCun,Y.(2013年)。基于无监督多阶段特征学习的行人检测。在CVPR中(第3626-3633页)。
[241] Shang,W.,Sohn,K.,Almeida,D.和Lee,H.(2016年)。通过串联整流线性单元理解和改进卷积神经网络。在ICML中(第2217-2225页)。
[242号] Shelhamer,E.,Long,J.和Darrell,T.(2017年)。用于语义分割的完全卷积网络。IEEE TPAMI。
[243] Shen,Z.,Liu,Z.,Li,J.,Jiang,Y.,Chen,Y.,和Xue,X.(2017年)。DSOD:从零开始学习深度监督对象检测器。在ICCV中。
[244] Shi,X.,Shan,S.,Kan,M.,Wu,S.,和Chen,X.(2018年)。基于渐进校正网络的实时旋转不变人脸检测。在CVPR中。
[245] 施、Z。;杨,Y。;霍斯佩多尔斯,T。;Xiang,T.,具有对象和属性的弱监督图像注释和分割,IEEE TPAMI,39,12,2525-2538(2017)
[246] Shrivastava,A.和Gupta A A.(2016年),《更快的RCNN的背景启动和反馈》。在ECCV中(第330-348页)。
[247] Shrivastava,A.,Gupta,A.和Girshick,R.(2016年)。基于区域的目标检测器在线硬样本挖掘训练。在CVPR中(第761-769页)。
[248] Shrivastava,A.,Sukhankar,R.,Malik,J.和Gupta,A.(2017年)。超越跳转连接:自上而下的目标检测调制。在CVPR中。
[249] Simonyan,K.和Zisserman,A.(2015年)。用于大规模图像识别的非常深的卷积网络。在ICLR。
[250] Singh,B.和Davis,L.(2018年)。目标检测中尺度不变性分析。在CVPR中。
[251] Singh,B.,Li,H.,Sharma,A.和Davis,L.S.(2018a)。RFCN 3000,每秒30帧:去耦检测和分类。在CVPR中。
[252] 辛格,B.,纳吉比,M.和戴维斯,L.S.(2018b)。狙击手:高效的多尺度训练。arXiv:1805.09300。
[253] 西维茨,J。;Zisserman,A.,视频谷歌:视频对象匹配的文本检索方法,国际计算机视觉会议(ICCV),21470-1477(2003)
[254] Sun,C.,Shrivastava,A.,Singh,S.和Gupta,A.(2017年)。再论深度学习时代数据的不合理有效性。在ICCV(第843-852页)。
[255] Sun,K.,Xiao,B.,Liu,D.和Wang,J.(2019a年)。用于人体姿态估计的深度高分辨率表示学习。在CVPR中。
[256] 孙K,赵,Y,江,B,程,T,肖,B,刘,D.等(2019b)。用于标记像素和区域的高分辨率表示。更正。,。arXiv:1904.04514。
[257] Sun,S.,Pang,J.,Shi,J.,Yi,S.,和Ouyang,W.(2018年)。鱼网:图像、区域和像素级预测的通用主干网。(第754-764页)。
[258] 太阳,Z。;贝比斯,G。;Miller,R.,《道路车辆检测:综述》,IEEE TPAMI,28,5,694-711(2006)
[259] Sung,K.和Poggio,T.(1994年)。对象和模式检测的学习和实例选择。麻省理工学院人工智能备忘录(1521)。
[260] 斯温,M。;巴拉德,D.,颜色索引。IJCV,第7、1、11-32页(1991年)
[261] Szegedy,C.,Liu,W.,Jia,Y.,Sermanet,P.,Reed,S.,Anguelov,D.,Erhan,D.,Vanhoucke,V.和Rabinovich,A.(2015年)。卷积得更深。在CVPR中(第1-9页)。
[262] Szegedy,C.,Ioffe,S.,Vanhoucke,V.和Alemi,A.(2017年)。Inception v4、Inception resnet和残余连接对学习的影响。在AAAI(第4278-4284页)。
[263] Szegedy,C.,Reed,S.,Erhan,D.,Anguelov,D.和Ioffe,S.(2014年)。可扩展,高质量的目标检测。arXiv:1412.1441。
[264] Szegedy,C.,Toshev,A.和Erhan,D.(2013年)。用于目标检测的深层神经网络。(第2553-2561页)。
[265] Szegedy,C.,Vanhoucke,V.,Ioffe,S.,Shlens,J.和Wojna,Z.(2016年)。重新思考计算机视觉的初始架构。在CVPR中(第2818-2826页)。
[266] Torralba,A.,物体探测的背景启动。IJCV,53,2199-191(2003年)
[267] Turk,M.A.和Pentland,A.(1991年)。利用特征脸进行人脸识别。在CVPR中(第586-591页)。
[268] Tuzel,O.,Porikli,F.和Meer P.(2006年)。区域协方差:一种用于检测和分类的快速描述符。在ECCV中(第589-600页)。
[269] TychsenSmith,L.和Petersson,L.(2017年)。DeNet:具有定向稀疏采样的可伸缩实时对象检测。在ICCV中。
[270] TychsenSmith,L.和Petersson,L.(2018年)。利用适应度nms和有界iou损失改进目标定位。在CVPR中。
[271] 尤林斯,J。;范德桑德,K。;杰弗斯,T。;史密德斯,A.,选择性搜索物体识别。IJCV,104,2154-171(2013年)
[272] 维兰特,R。;蒙罗克,C。;Lecun,Y.,《图像中物体定位的原始方法》,《视觉,图像和信号处理》,1414245-250(1994)
[273] Van de Sande,K.,Uijlings,J.,Gevers,T.和Smelders,A.(2011年)。分割作为目标识别的选择性搜索。在ICCV(第1879-1886页)。
[274] 瓦斯瓦尼,A.,沙泽尔,N.,帕尔玛,N.,乌兹科雷特,J.,琼斯,L.,戈麦斯,A.N.,凯撒,ŁPolosukhin,I.(2017年)。你只需要专心。在NIPS(第6000-6010页)。
[275] Vedaldi,A.,Gulshan,V.,Varma,M.和Zisserman,A.(2009年)。多核目标检测。在ICCV(第606-613页)。
[276] 维奥拉,P。;Jones,M.,《使用简单特征的增强级联快速目标检测》,CVPR,1,1-8(2001)
[277] Wan,L.,Eigen,D.和Fergus,R.(2015年)。卷积网络、可变形零件模型和非最大抑制的端到端集成。在CVPR中(第851-859页)。
[278] Wang,H.,Wang,Q.,Gao,M.,Li,P.和Zuo,W.(2018年)。目标检测的多尺度位置感知核表示。在CVPR中。
[279] Wang,X.,Cai,Z.,Gao,D.,和Vasconcelos,N.(2019年)。面向领域关注的通用目标检测。arXiv:1904.04402。
[280] Wang,X.,Han,T.和Yan,S.(2009年)。一种具有部分遮挡处理的HOG-LBP人体探测器。国际计算机视觉会议(第32-39页)。
[281] Wang,X.,Shrivastava,A.和Gupta,A.(2017年)。一种快速的RCNN:目标检测的敌方硬正生成。在CVPR中。
[282] Wei,Y.,Pan,X.,Qin,H.,Ouyang,W.,和Yan,J.(2018年)。量子化模拟:用于目标检测的非常小的CNN。在ECCV中(第267-283页)。
[283] Woo,S.,Hwang,S.和Kwoon,I.(2018年)。StairNet:自上而下的语义聚合,用于精确的一次性检测。在《瓦卡》(第1093-1102页)。
[284] Worrall,D.E.,Garbin,S.J.,Turmukhambetov,D.和Brostow,G.J.(2017年)。谐波网络:深度平移和旋转等变。在CVPR(第2卷)中。
[285] Wu,Y.和He,K.(2018年)。组规范化。在ECCV中(第3-19页)。
[286] Wu,Z.,Pan,S.,Chen,F.,Long,G.,Zhang,C.,和Yu,P.S.(2019年)。图神经网络综述。arXiv:1901.00596。
[287] Wu,Z.,Song,S.,Khosla,A.,Yu,F.,Zhang,L.,Tang,X.,和Xiao,J.(2015年)。三维图形:三维图形的深层表示。在CVPR中(1912-1920页)。
[288] Xia,G.,Bai,X.,Ding,J.,Zhu,Z.,Belongie,S.,Luo,J.,Datcu,M.,Pelillo,M.和Zhang,L.(2018年)。DOTA:用于航空图像中目标检测的大规模数据集。在CVPR中(第3974-3983页)。
[289] Xiang,Y.,Mottaghi,R.和Savarese,S.(2014年)。Beyond PASCAL:野外三维物体检测的基准。以瓦夫夫语(第75-82页)。
[290] Xiao,R.,Zhu,L.和Zhang,H.(2003年)。增强链学习用于目标检测。在ICCV(第709-715页)。
[291] Xie,S.,Girshick,R.,DolláR,P.,Tu,Z.,和He,K.(2017年)。深层神经网络的聚集残差变换。在CVPR中。
[292] Yang,B.,Yan,J.,Lei,Z.和Li,S.(2016a)。从图像中制造物体。在CVPR中(第6043-6051页)。
[293] Yang,F.,Choi,W.和Lin,Y.(2016b)。利用所有层:快速和准确的CNN对象检测器与规模相关池和级联拒绝分类器。在CVPR中(第2129-2137页)。
[294] 杨,M。;克里格曼,D。;Ahuja,N.,在图像中检测人脸:调查,IEEE TPAMI,24,1,34-58(2002)
[295] 叶,Q。;Doermann,D.,《图像中的文本检测和识别:调查》,IEEE TPAMI,37,7,1480-1500(2015)
[296] Yosinski,J.,Clune,J.,Bengio,Y.和Lipson,H.(2014年)。深层神经网络中的特征有多大的可转移性?(第3320-3328页)。
[297] 杨,T。;哈扎里卡,D。;波里亚,S。;Cambria,E.,基于深度学习的自然语言处理的最新趋势,IEEE计算智能杂志,13,3,55-75(2018)
[298] Yu,F.和Koltun,V.(2015年)。基于扩展卷积的多尺度上下文聚合。arXiv预印本arXiv:1511.07122。
[299] Yu,F.,Koltun,V.和Funkhouser,T.(2017年)。扩张剩余网络。在CVPR中(第2卷,第3页)。
[300] 俞,R,Li,A.,Chen,C.,Lai,J.等人(2018年)。NISP:使用神经元重要性评分传播的修剪网络。在CVPR中。
[301] 扎菲里奥,S。;张,C。;张志军,野外人脸检测研究:过去、现在和未来,计算机视觉与图像理解,138,1-24(2015)
[302] Zagoruyko,S.,Lerer,A.,Lin,T.,Pinheiro,P.,Gross,S.,Chintala,S.和Dollár,P.(2016年)。用于目标检测的多路径网络。在BMVC中。
[303] Zeiler,M.和Fergus,R.(2014年)。可视化和理解卷积网络。在ECCV中(第818-833页)。
[304号] 曾某。;欧阳W。;严,J。;李,H。;肖,T。;Wang,K.,Crafting gbd net for object detection,IEEE模式分析与机器智能汇刊,40,9,2109-2123(2017)
[305] Zeng,X.,Ouyang,W.,Yang,B.,Yan,J.和Wang,X.(2016年)。门控双向cnn目标检测。在ECCV中(第354-369页)。
[306] 张克。;张,Z。;李,Z。;乔伊,Y.,使用多任务级联卷积网络进行联合人脸检测和对齐,IEEE SPL,23,10,1499-1503(2016)
[307] Zhang,L.,Lin,L.,Liang,X.,和He,K.(2016b)。更快的RCNN在行人检测方面做得好吗?在ECCV中(第443-457页)。
[308] Zhang,S.,Wen,L.,边,X.,Lei,Z.,和Li,S.(2018a)。目标检测的单次细化神经网络。在CVPR中。
[309] Zhang,S.,Yang,J.和Schiele,B.(2018b)。基于引导注意的CNNs行人遮挡检测。在CVPR中(第2056-2063页)。
[310] Zhang,X.,Li,Z.,Change Loy,C.和Lin,D.(2017年)。PolyNet:在非常深的网络中追求结构多样性。在CVPR中(第718-726页)。
[311] Zhang,X.,Yang,Y.,Han,Z.,Wang,H.和Gao,C.(2013年)。对象类检测:综述。ACM计算调查,46(1),10:1-10:53。
[312] Zhang,X.,Zhou,X.,Lin,M.,和Sun,J.(2018c)。ShuffleNet:一种用于移动设备的高效卷积神经网络。在CVPR中。
[313] Zhang,Z.,Geiger,J.,Pohjalainen,J.,Mousa,A.E.,Jin,W.和Schuller,B.(2018d)。环境鲁棒语音识别的深度学习:最新发展概况。智能系统与技术学报,9(5),49:1-49:28。
[314] Zhang,Z.,Qiao,S.,Xie,C.,Shen,W.,Wang,B.和Yuille,A.(2018e.)。具有丰富语义的单次目标检测。在CVPR中。
[315] Zhao,Q.,Sheng,T.,Wang,Y.,Tang,Z.,Chen,Y.,Cai,L.和Ling,H.(2019年)。M2Det:一种基于多级特征金字塔网络的单次目标探测器。在AAAI。
[316号] Zheng,S.,Jayasumana,S.,Romera Paredes,B.,Vineet,V.,Su,Z.,Du,D.,Huang,C.,和Torr,P.(2015年)。条件随机场作为递归神经网络。在ICCV(第1529-1537页)。
[317] Zhou,B.,Khosla,A.,Lapedriza,A.,Oliva,A.和Torralba,A.(2015年)。目标探测器出现在深景物cnn中。在ICLR。
[318] Zhou,B.,Khosla,A.,Lapedriza,A.,Oliva,A.和Torralba,A.(2016a)。学习区分性本地化的深层特征。在CVPR中(第2921-2929页)。
[319] 周,B。;拉佩德里扎,A。;科斯拉,A。;奥利瓦,A。;Torralba,A.,Places:用于场景识别的1000万图像数据库,IEEE模式分析和机器智能事务,40,61452-1464(2017)
[320号] Zhou,J.,Cui,G.,Zhang,Z.,Yang,C.,Liu,Z.,和Sun,M.(2018a)。图神经网络:方法与应用综述。arXiv:1812.08434。
[321] Zhou,P.,Ni,B.,Geng,C.,Hu,J.和Xu,Y.(2018b)。尺度可转移目标检测。在CVPR中。
[322] Zhou,Y.,Liu,L.,Shao,L.,和Mellor,M.(2016b)。DAVE:一个用于快速车辆检测和注释的统一框架。在ECCV中(第278-293页)。
[323号] Zhou,Y.,Ye,Q.,Qu,Q.和Jiao,J.(2017b)。面向响应网络。在CVPR中(第4961-4970页)。
[324] 朱,X。;图伊亚,D。;谅解备忘录。;夏,G。;张,L。;Xu,F.,遥感深度学习:综合回顾和资源清单,IEEE地球科学与遥感杂志,5,4,8-36(2017)
[325] 朱,X。;冯德里克,C。;福克斯,C。;Ramanan,D.,我们需要更多的培训数据吗?,IJCV,119,1,76-92(2016年)
[326] Zhu,Y.,Urtasun,R.,Salakhutdinov,R.,和Fidler,S.(2015年)。segdepm:利用深度神经网络中的分割和上下文进行目标检测。在CVPR中(第4703-4711页)。
[327] Zhu,Y.,Zhao,C.,Wang,J.,Zhao,X.,Wu,Y.,和Lu,H.(2017a)。耦合网:将全局结构与局部部分耦合起来进行目标检测。在ICCV中。
[328] Zhu,Y.,Zhou,Y.,Ye,Q.,Qu,Q.和Jiao,J.(2017b)。弱监督目标定位的软提议网络。在ICCV(1841-1850页)。
[329] Zhu,Z.,Liang,D.,Zhang,S.,Huang,X.,Li,B.和Hu,S.(2016b)。野外交通标志检测与分类。在CVPR中(第2110-2118页)。
[330号] Zitnick,C.和Dollár,P.(2014年)。边框:从边定位对象方案。在ECCV中(第391-405页)。
[331] Zoph,B.和Le,Q.(2016年)。强化学习的神经结构搜索。arXiv预印本arXiv:1611.01578。
[332] Zoph,B.,Vasudevan,V.,Shlens,J.和Le,Q.(2018年)。学习可扩展图像识别的可转换体系结构。在CVPR中(第8697-8710页)。
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。