×

通过多核度量学习的迭代类别发现。 (英语) Zbl 1328.68163号

摘要:对象类别发现系统的目标是注释未标记图像数据池,其中标签集最初对系统是未知的,因此必须通过查询人类注释器来随着时间的推移进行发现。然后,将带注释的数据用于在标准的监督学习设置中训练对象检测器,可能与类别发现本身结合使用。类别发现系统可以根据生成的对象检测器的准确性以及它们发现类别和注释训练数据的效率进行评估。为了提高类别发现的准确性和效率,我们提出了一个迭代框架,该框架交替使用多核度量学习优化已知类别的最近邻分类,以及检测可能属于新的未知类别的未标记图像区域簇。在MSRC和PASCAL VOC2007数据集上的实验结果表明,该方法改进了类别发现的聚类,并有效地注释了属于所发现类别的图像区域。

MSC公司:

68T05型 人工智能中的学习和自适应系统
68吨10 模式识别、语音识别
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Bart,E.、Porteous,I.、Perona,P.和;Welling,M.(2008)。视觉分类的无监督学习。计算机视觉和模式识别(CVPR)(第1-8页)。
[2] Branson,S.、Wah,C.、Schroff,F.、Babenko,B.、Welinder,P.、Perona,P.等人(2010年)。与人进行视觉识别。欧洲计算机视觉会议(ECCV)(第438–451页)
[3] Collins,B.、Deng,J.、Li,K.和;Fei-Fei,L.(2008)。面向可扩展数据集构建:一种主动学习方法。计算机视觉–ECCV。
[4] 科尔特斯,C.,&;Vapnik,V.(1995)。支持向量网络。机器学习研究杂志,20(3),273-297·Zbl 0831.68098号
[5] Defays,D.(1977年)。完整链接方法的有效算法。《计算机杂志》,20(4),364–366·Zbl 0364.68038号 ·doi:10.1093/comjnl/20.4.364
[6] Everingham,M,Van Gool,L,Williams,CKI,Winn,J,Zisserman,A(2007年)。PASCAL可视对象类,挑战2007(VOC2007)结果。
[7] Faktor,A.,&;Irani,M.(2012)。”按成分聚类”——无监督地发现图像类别。欧洲计算机视觉会议(ECCV)(第474-487页)。斯普林格。
[8] Forsyth,D.A.、Malik,J.、Fleck,M.M.、Greenspan,H.、Leung,T.、Belongie,S.等人(1995年)。在大量图像集合中查找对象的图片。《计算机杂志》,1144335–360。
[9] Frome,A.、Singer,Y.、Sha,F.和;Malik,J.(2007)。学习全局一致的局部距离函数,用于基于形状的图像检索和分类。计算机视觉国际会议(ICCV)(第1-8页)。
[10] Galleguillos,C.、McFee,B.、Belongie,S.和;Lanckriet,G.(2010年)。通过结合本地上下文交互进行多类对象定位。计算机视觉和模式识别(CVPR)(第113-120页)。
[11] Galleguillos,C.、McFee,B.、Belongie,S.和;Lanckriet,G.(2011年)。从区域相似性到类别发现。计算机视觉和模式识别(CVPR)(第2665-2672页)。
[12] Gehler,P.和;Nowozin,S.(2009年)。关于多类对象分类的特征组合。参加计算机视觉国际会议(ICCV)。
[13] A.Globerson,&;Roweis,S.(2007)。通过半定嵌入可视化成对相似性。在国际人工智能和统计会议(AISTATS)上。
[14] Grauman,K.,&;Darrell,T.(2006)。从部分匹配的图像特征集中进行分类的无监督学习。计算机视觉和模式识别(CVPR)。
[15] Heitz,G.和;Koller,D.(2008)。学习空间语境:利用事物来寻找事物。欧洲计算机视觉会议(ECCV)(第30-43页)。施普林格:内。
[16] Järvelin,K.,&;Kekäläinen,J.(2002)。基于累积收益的红外技术评估。ACM信息系统交易,20(4),422-446·Zbl 05457980号 ·数字对象标识代码:10.1145/582415.582418
[17] Joachims,T.(2005)。多元性能度量的支持向量方法。在机器学习国际会议上(第377-384页)。
[18] Joachims,T.、Finley,T.和;Yu,C.N.J.(2009)。结构svm的切面培训。机器学习研究杂志,77(1),27-59·Zbl 1235.68161号 ·doi:10.1007/s10994-009-5108-8
[19] Kang,H.、Hebert,M.、Efros,A.A.和;Kanade,T.(2012)。连接缺失的链接:使用500万张产品图像从稀疏观察中发现对象。欧洲计算机视觉会议(ECCV)(第794-807页)。斯普林格。
[20] Lanckriet,G.R.G.、Cristianini,N.、Bartlett,P.、El Ghaoui,L.和;Jordan,M.I.(2004)。用半定规划学习核矩阵。机器学习研究杂志,5,27-72·Zbl 1222.68241号
[21] Lee,Y.和;Grauman,K.(2010年)。用于上下文软件类别发现的对象粒度。计算机视觉和模式识别(CVPR)。
[22] Lee,Y.和;Grauman,K.(2011年)。首先学习简单的事情:自我控制的视觉类别发现。计算机视觉和模式识别(CVPR)(第1721-1728页)。
[23] McFee,B.和;Lanckriet,G.(2010年)。衡量学习排名。在关于机器学习的国际会议上·Zbl 1280.68181号
[24] Meila,M.和;Shi,J.(2001)。通过随机行走学习分段。神经信息处理系统的进展。
[25] Rabinovich,A.、Lange,T.、Buhmann,J.和;Belongie,S.(2006)。用于图像分割的模型顺序选择和线索组合。计算机视觉和模式识别(CVPR)。
[26] Russell,B.、Freeman,W.、Efros,A.、Sivic,J.和;Zisserman,A.(2006年)。使用多个分割来发现图像集合中的对象及其范围。计算机视觉和模式识别(CVPR)。
[27] Schölkopf,B.、Herbrich,R.、Smola,A.J.和;Williamson,R.(2001)。广义表示定理。计算学习理论(第416-426页)·Zbl 0992.68088号
[28] Shi,J.和;Malik,J.(2000)。标准化切割和图像分割。IEEE模式分析和机器智能汇刊,22(8),888-905·Zbl 05111961号 ·数字对象标识代码:10.1109/34.868688
[29] Sivic,J.、Russell,B.、Efros,A.、Zisserman,A.和;Freeman,W.(2005)。发现物体及其在图像中的位置。在国际计算机视觉会议(ICCV)上。
[30] Sivic,J.、Russell,B.、Zisserman,A.、Freeman,W.和;Efros,A.(2008)。可视化对象类层次结构的无监督发现。计算机视觉和模式识别(CVPR)(第1-8页)。
[31] 田,Y.,刘,W.,肖,R.,文,F.,&;Tang,X.(2007)。一个具有部分聚类和交互式标记的人脸注释框架。计算机视觉和模式识别(CVPR)(第1-8页)。
[32] 托多罗维奇(Todorovic,S.);Ahuja,N.(2006年)。从一组图像中提取未知类别的子图像。计算机视觉和模式识别(CVPR)。
[33] Tsochantaridis,I.、Joachims,T.、Hofmann,T.和;奥尔顿,Y(2005)。结构化和相互依赖输出变量的大幅度方法。机器学习研究杂志,61453-1484·Zbl 1222.68321号
[34] Tuytelaars,T.、Lampert,C.、Blaschko,M.和;Buntine,W.(2010年)。无监督对象发现:比较。国际计算机视觉杂志,88(2),284–302·Zbl 06023096号 ·doi:10.1007/s11263-009-0271-8
[35] Varma,M.和;Ray,D.(2007年)。在计算机视觉国际会议(ICCV)上学习辨别力-方差权衡。
[36] Vedaldi,A.、Gulshan,V.、Varma,M.和;Zisserman,A.(2009)。用于对象检测的多个内核。参加计算机视觉国际会议(ICCV)。
[37] Vijayanarasimhan,S.和;Grauman,K.(2009年)。你要花多少钱?多标签图像注释的预测工作量与信息量。计算机视觉和模式识别(CVPR)。
[38] Wang,G.、Hoiem,D.和;Forsyth,D.(2010年)。使用随机交集核机器从flickr组中学习图像相似性。计算机视觉和模式识别(CVPR)。
[39] Weinberger,K.Q.、Blitzer,J.和;Saul,L.K.(2006)。大幅度最近邻分类的距离度量学习。神经信息处理系统的进展。
[40] Wilcoxon,F.(1945年)。通过排名方法进行个人比较。生物统计公报,1(6),80–83·doi:10.2307/3001968
[41] Winn,J.、Criminisi,A.和;Minka,T.(2005)。通过学习的通用视觉词典进行对象分类。计算机视觉国际会议(ICCV)(第2卷,第1800-1807页)。
[42] Zhao,Y.和;Karypis,G.(2001年)。文档聚类的标准函数:实验和分析。机器学习·Zbl 1089.68615号
[43] Zhu,J.Y.,Wu,J.,Wei,Y.,Chang,E.,&涂政(2012)。通过盐度引导的多类学习进行无监督对象类发现。计算机视觉和模式识别(CVPR)(第3218–3225页)。
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。