张丁文;韩俊伟;赵龙;孟德玉 在协作式自定进度课程学习框架下,利用先验知识进行弱监督对象检测。 (英语) Zbl 1458.68259号 国际期刊计算。视觉。 127,第4期,363-380(2019). 摘要:弱监督目标检测是计算机视觉领域一个有趣而又富有挑战性的研究课题,其目的是学习对象模型,在图像级注释的监督下定位和检测相应的感兴趣对象。为了解决这个问题,本文建立了一个新的弱监督学习框架,在一种新的协作式自定进度课程学习(C-SPCL)机制的基础上,利用实例级的先验知识和图像级的先例知识。在弱监督下,C-SPCL可以在整个学习过程中利用有用的先验知识,并以稳健的方式将实例级置信推理与图像级置信推理协作。在基准数据集上进行的综合实验表明,与沿着该研究路线的最新方法相比,所提议的C-SPCL机制和所提议的整个框架具有优越的能力。 MSC公司: 68T45型 机器视觉和场景理解 68T05型 人工智能中的学习和自适应系统 关键词:机器学习;目标检测;自定步长拉网 软件:更快的R-CNN;AlexNet公司;MS-COCO公司;ImageNet公司;PASCAL挥发性有机化合物 PDF格式BibTeX公司 XML格式引用 \textit{D.Zhang}等人,国际计算机杂志。视觉。127,第4号,363--380(2019;Zbl 1458.68259) 全文: 内政部 参考文献: [1] Alexe,B.、Deselaers,T.和Ferrari,V.(2010年)。什么是对象?在CVPR中。 [2] Bengio,Y.、Louradour,J.、Collobert,R.和Weston,J.(2009)。课程学习。在ICML中。 [3] Bilen,H.、Pedersoli,M.和Tuytelaars,T.(2014)。基于后验正则化的弱监督目标检测。在BMVC中。 [4] Bilen,H.、Pedersoli,M.和Tuytelaars,T.(2015)。基于凸聚类的弱监督目标检测。CVPR。 [5] Bilen,H.和Vedaldi,A.(2016)。监管薄弱的深度检测网络。在CVPR中。 [6] Chen,X.和Gupta,A.(2015)。卷积网络的网络监督学习。在ICCV中。 [7] Cinbis,R.G.、Verbeek,J.和Schmid,C.(2017年)。基于多折叠多实例学习的弱监督对象定位。IEEE模式分析和机器智能汇刊,39(1),189-203·doi:10.1109/TPAMI.2016.2535231 [8] Deselaers,T.、Alexe,B.和Ferrari,V.(2010年)。在学习对象外观的同时定位对象。在ECCV中。 [9] Deselaers,T.、Alexe,B.和Ferrari,V.(2012年)。缺乏监督的本地化和通用知识学习。国际计算机视觉杂志,100(3),275-293·文件编号:10.1007/s11263-012-0538-3 [10] Diba,A.、Sharma,V.、Pazandeh,A.、Pirsiavash,H.和Van Gool,L.(2017)。弱监督级联卷积网络。在CVPR中。 [11] Everingham,M.、Van Gool,L.、Williams,C.K.、Winn,J.和Zisserman,A.(2010年)。pascal可视对象类(voc)挑战。国际计算机视觉杂志,88(2),303-338·doi:10.1007/s11263-009-0275-4 [12] Everingham,M.、Zisserman,A.、Williams,C.K.、Van Gool,L.、Allan,M.,Bishop,C.M.、Chapelle,O.、Dalal,N.、Deselaers,T.、Dorkó,G.等人(2007年)。pascal可视对象类挑战2007(voc2007)结果。 [13] Girshick,R.(2015)。快速r-cnn。在ICCV中。 [14] Girshick,R.、Donahue,J.、Darrell,T.和Malik,J.(2014)。丰富的特征层次用于准确的对象检测和语义分割。在CVPR中。 [15] Gokberk Cinbis,R.、Verbeek,J.和Schmid,C.(2014)。用于弱监督对象定位的多倍mil训练。在CVPR中。 [16] Han,J.,Quan,R.,Zhang,D.,&Nie,F.(2018a)。使用背景先验的鲁棒对象联合分割。IEEE图像处理汇刊,27(4),1639-1651·doi:10.1109/TIP.2017.2781424 [17] Han,J.、Zhang,D.、Cheng,G.、Liu,N.和Xu,D.(2018b)。用于显著和特定类别目标检测的高级深度学习技术:一项调查。IEEE信号处理杂志,35(1),84-100·doi:10.1109/MSP.2017.2749125 [18] Han,L.、Zhang,D.、Huang,D.、Chang,X.、Ren,J.、Luo,S.和Han,J.(2017)。自定步调的回归混合。在IJCAI。 [19] Jiang,L.、Meng,D.、Mitamura,T.和Hauptmann,A.G.(2014a)。简单示例优先:为零示例多媒体搜索进行自定步调的重新存储。采用ACM-MM。 [20] Jiang,L.,Meng,D.,Yu,S.-I.,Lan,Z.,Shan,S.,&Hauptmann,A.(2014b)。多样化的自主学习。以NIPS为单位。 [21] Jiang,L.、Meng,D.、Zhao,Q.、Shan,S.和Hauptmann,A.G.(2015)。自定进度的课程学习。在AAAI。 [22] Jie,Z.、Wei,Y.、Jin,X.、Feng,J.和Liu,W.(2017)。用于弱监督对象定位的深度自学学习。在CVPR中。 [23] Kantorov,V.、Oquab,M.、Cho,M.和Laptev,I.(2016)。Contextlocnet:用于弱监督本地化的上下文软件深度网络模型。在ECCV中。 [24] Khan,F.、Mutlu,B.和Zhu,X.(2011)。人类如何教学:关于课程学习和教学维度。以NIPS为单位。 [25] Krizhevsky,A.、Sutskever,I.和Hinton,G.E.(2012)。基于深度卷积神经网络的Imagenet分类。以NIPS为单位。 [26] Kumar,M.P.、Packer,B.和Koller,D.(2010年)。潜在变量模型的自主学习。以NIPS为单位。 [27] Kumar Singh,K.、Xiao,F.和Jae Lee,Y.(2016)。跟踪和传输:观看视频以模拟人类对弱小目标检测的强烈监督。在CVPR中。 [28] Li,D.,Huang,J.-B.,Li,Y.,Wang,S.,&Yang,M.-H.(2016)。具有渐进域自适应的弱监督对象定位。在CVPR中。 [29] Lin,T.-Y.,Maire,M.,Belongie,S.,Bourdev,L.,Girshick,R.,Hays,J.,Perona,P.,Ramanan,D.,Zitnick,C.L.,&Dollr,P.(2014)。Microsoft coco:上下文中的通用对象。arXiv预打印arXiv:1405.0312。 [30] Meng,D.,Zhao,Q.,&Jiang,L.(2017)。对自主学习的理论理解。信息科学,414319-328·Zbl 1435.68278号 ·doi:10.1016/j.ins.2017.05.043 [31] Pandey,M.和Lazebnik,S.(2011年)。基于可变形部分模型的场景识别和弱监督目标定位。在ICCV中。 [32] Ren,W.、Huang,K.、Tao,D.和Tan,T.(2016)。基于多实例学习和包分解的弱监督大规模对象定位。IEEE模式分析和机器智能汇刊,38(2),405-416·doi:10.1109/TPAMI.2015.2456908 [33] Russakovsky,O.、Lin,Y.、Yu,K.和Fei-Fei,L.(2012)。用于图像分类的以对象为中心的空间池。在ECCV中。 [34] Shi,M.和Ferrari,V.(2016)。使用大小估计进行弱监督目标定位。在ECCV中。 [35] Shi,Z.,Hospedales,T.M.,&Xiang,T.(2015)。弱标记图像中物体定位的贝叶斯联合建模。IEEE模式分析和机器智能汇刊,37(10),1959-1972·doi:10.1109/TPAMI.2015.2392769 [36] Simonyan,K.和Zisserman,A.(2014)。用于大规模图像识别的深度卷积网络。arXiv预打印arXiv:1409.1556。 [37] Siva,P.、Russell,C.和Xiang,T.(2012)。为注释弱标记数据的负面挖掘辩护。在ECCV中。 [38] Siva,P.、Russell,C.、Xiang,T.和Agapito,L.(2013)。超越图像:无监督学习物体显著性和检测。在CVPR中。 [39] Siva,P.,&Xiang,T.(2011年)。基于模型漂移检测的弱监督目标检测器学习。在ICCV中。 [40] Song,H.O.、Girshick,R.、Jegelka,S.、Mairal,J.、Harchaoui,Z.和Darrell,T.(2014年a)。学习在最少的监督下定位对象。arXiv预打印arXiv:1403.1024。 [41] Song,H.O.、Lee,Y.J.、Jegelka,S.和Darrell,T.(2014b)。视觉模式配置的发现缺乏监督。在NIPS中。 [42] Spitkovsky,V.I.、Alshawi,H.和Jurafsky,D.(2009)。婴儿步骤:在无监督依赖性分析中,少即是多。NIPS:语法归纳、语言表征和语言学习。 [43] Supancic,D.和Ramanan,J.S.(2013)。自主学习,实现长期跟踪。在CVPR中。 [44] Tang,Y.,Yang,Y.-B.,&Gao,Y.(2012)。图像分类的自主词典学习。采用ACM-MM。 [45] Uijlings,J.R.、Van De Sande,K.E.、Gevers,T.和Smeulders,A.W.(2013)。对象识别的选择性搜索。国际计算机视觉杂志,104(2),154-171·doi:10.1007/s11263-013-0620-5 [46] Wang,L.,Hua,G.,Sukthankar,R.,Xue,J.,&Zheng,N.(2014a)。视频对象发现和联合分割,监管非常薄弱。在ECCV中。 [47] Wang,C.,Ren,W.,Huang,K.,&Tan,T.(2014b)。基于潜在类别学习的弱监督对象定位。在ECCV中。 [48] Yang,X.,Song,Q.,&Wang,Y.(2007)。一种用于数据分类的加权支持向量机。国际模式识别与人工智能杂志,21(05),961-976·doi:10.1142/S021801407005703 [49] Yao,X.、Han,J.、Zhang,D.和Nie,F.(2017)。重温共显著检测:基于两阶段多视角光谱旋转共聚类的新方法。IEEE图像处理汇刊,26(7),3196-3209·Zbl 1409.94712号 ·doi:10.1109/TIP.2017.2694222 [50] Zhang,D.,Fu,H.,Han,J.,Borji,A.,&Li,X.(2018)。共显检测算法综述:基础、应用和挑战。ACM智能系统与技术汇刊,9(4),38·数字对象标识代码:10.1145/3158674 [51] Zhang,D.,Meng,D.和Han,J.(2017a)。通过自定步长的多实例学习框架进行协同有效性检测。IEEE模式分析和机器智能汇刊,39(5),865-878·doi:10.1109/TPAMI.2016.2567393 [52] Zhang,D.,Meng,D.、Zhao,L.和Han,J.(2016)。基于自主学习的显著性检测与弱监督对象检测的桥梁。在IJCAI。 [53] Zhang,D.、Yang,L.、Meng,D.、Xu,D.和Han,J.(2017b)。Spftn:一种自动调整速度的微调网络,用于分割标记较弱的视频中的对象。在CVPR中。 [54] Zitnick,C.L.和Dollár,P.(2014)。边缘框:从边缘定位对象建议。在ECCV中。 此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。