×

用于域自适应的非对称和类别不变特征变换。 (英语) Zbl 1328.68242号

摘要:我们解决了将对象模型从一个数据集或可视域传输到另一个数据集中或可视域的可视域自适应问题。我们为监督学习和半监督学习引入了一个统一的灵活模型,它允许我们学习域之间的转换。此外,我们给出了该模型的两个实例,一个用于一般特征自适应/对齐,另一个用于分类。首先,我们展示了如何扩展用于域自适应的度量学习方法,允许学习度量独立于域移位和使用的最终分类器。此外,我们通过将该方法扩展到非对称、类别无关的转换,超越了经典的度量学习。我们的框架可以调整特性,即使目标域没有任何针对某些类别的标记示例,并且目标和源特性具有不同的维度。最后,我们为自适应分类器开发了一个联合学习框架,该框架在多类准确度和可扩展性方面优于竞争方法。我们展示了我们的方法在各种情况下适应对象识别模型的能力,例如不同的成像条件、特征类型和码本。实验表明,与以前的方法相比,该方法具有很强的性能,并且适用于大规模场景。

MSC公司:

68T45型 机器视觉和场景理解
68T05型 人工智能中的学习和自适应系统
68吨10 模式识别、语音识别
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Argyriou,A.、Micchelli,C.A.和;Pontil,M.(2010年)。关于频谱学习。《机器学习研究杂志》,11935–953·兹比尔1242.68201
[2] Y.Aytar和;Zisserman,A.(2011)。Tabula rasa:用于对象类别检测的模型传输。《计算机视觉国际会议论文集》(第2252-2259页)。
[3] Ben-david,S.、Blitzer,J.、Crammer,K.和;Pereira,O.(2007)。领域适应的表示分析。《神经信息处理系统进展》(NIPS)(第137-145页)。剑桥:麻省理工学院出版社。
[4] 贝加莫,A;Torresani,L.(2010)。利用标记较弱的web图像改进对象分类:一种域自适应方法。《神经信息处理系统进展》(NIPS)(第181-189页)。
[5] Blitzer,J.、Dredze,M.和;Pereira,F.(2007)。传记、宝莱坞、潮箱和搅拌器:情绪分类的领域适应。ACL,7440–447。
[6] Chopra,S.、Balakrishnan,S.和;Gopalan,R.(2013)。Dlid:通过在域之间插值进行域自适应的深度学习。在ICML代表学习挑战研讨会上。
[7] Dai,W.,Chen,Y.,Xue,G.,Yang,Q.,&Yu,Y.(2008)。翻译学习:跨不同特征空间传递学习。《神经信息处理系统进展》(NIPS)(第353–360页)。
[8] Daume III,H.(2007)。令人沮丧的简单领域适应。在ACL中(第256-263页)。
[9] Davis,J.、Kulis,B.、Jain,P.、Sra,S.和;Dhillon,I.(2007)。信息论计量学习。《机器学习国际会议论文集》(第209-216页)。
[10] Diethe,T.、Hardoon,D.R.和;Shawe Taylor,J.(2010年)。从多个数据视图构造非线性判别式。《数据库中的机器学习和知识发现》(第328-343页),柏林:施普林格出版社。
[11] Donahue,J.、Hoffman,J.、Rodner,E.、Saenko,K.和;Darrell,T.(2013)。具有实例约束的半监督域自适应。《IEEE计算机视觉和模式识别会议论文集》(第668-675页)。
[12] Donahue,J.、Jia,Y.、Vinyals,O.、Hoffman,J.,Zhang,N.、Tzeng,E.等人(2014)。Decaf:用于一般视觉识别的深度卷积激活功能。参加机器学习国际会议(ICML)。
[13] Duan,L.,Tsang,I.W.,Xu,D.和;马来亚银行,S.J.(2009)。用于视频概念检测的域转移支持向量机。IEEE计算机视觉和模式识别会议记录(第1375-1381页)。
[14] Duan,L.、Xu,D.和;Tsang,I.W.(2012年a)。使用增强功能学习异构域适应。《机器学习国际会议论文集》(第711-718页)。
[15] Duan,L.,Xu,D.,Tsang,I.W.H.和;Luo,J.(2012年b)。通过从网络数据中学习视频中的视觉事件识别。IEEE模式分析和机器智能汇刊,34(9),1667-1680·doi:10.1109/TPAMI.2011.265
[16] Farhadi,A.和;Tabrizi,M.K.(2008)。学会从错误的角度识别活动。《欧洲计算机视觉会议论文集》(第154-166页)。
[17] Farquhar,J.、Hardoon,D.、Meng,H.、Shawe-taylor,J.S.和;Szedmak,S.(2005)。双视角学习:Svm-2k,理论与实践。《神经信息处理系统进展》(NIPS)(第355-362页)。
[18] 龚,B.,石,Y.,沙,F.,&;Grauman,K.(2012年)。无监督域自适应的测地流核。《IEEE计算机视觉和模式识别会议论文集》(第2066-2073页)。
[19] Gopalan,R.、Li,R.&Chellappa,R.(2011)。对象识别的域自适应:一种无监督方法。《国际计算机视觉会议记录》(ICCV)(第999–1006页)。
[20] 霍夫曼(Hoffman,J.)、罗德纳(Rodner,E.)、多纳休(Donahue,J;Darrell,T.(2013)。域不变图像表示的有效学习。在国际学习表征会议(ICLR)上。http://arxiv.org/abs/1301.3224
[21] Jhuo,I.H.、Liu,D.、Chang,S.F.和;Lee,D.T.(2012)。具有低阶重建的鲁棒视觉域自适应。《IEEE计算机视觉和模式识别会议论文集》(第2168–2175页)。
[22] 姜杰(2008)。统计分类器领域适应性的文献综述。http://sifaka.cs.uiuc.edu/jiang4/domain_adaptation/survey/ .
[23] Jiang,J.和;翟春霞(2007)。NLP中域自适应的实例权重。在ACL中(第264-271页)。
[24] Jiang,W.、Zavesky,E.、Chang,S.和;Loui,A.(2008)。用于高级视觉概念分类的跨域学习方法。在国际图像处理会议(ICIP)上(第161-164页)。
[25] Kan,M.、Shan,S.、Zhang,H.、Lao,S.和;Chen,X.(2012)。多视角判别分析。欧洲计算机视觉会议(ECCV)论文集(第808-821页)。柏林:斯普林格。
[26] Krizhevsky,A.、Sutskever,I.和;Hinton,G.E.(2012年)。基于深度卷积神经网络的Imagenet分类。神经信息处理系统进展。
[27] Kulis,B.、Jain,P.和;Grauman,K.(2009年)。学习度量的快速相似性搜索。IEEE模式分析和机器智能汇刊,39(12),2143–2157·doi:10.1109/TPAMI.2009.151
[28] Kulis,B.、Saenko,K.和;Darrell,T.(2011)。您所看到的并不是您所得到的:使用非对称内核转换的域自适应。《IEEE计算机视觉和模式识别会议论文集》(第1785-1792页)。
[29] 李·R和;Zickler,T.(2012年)。用于交叉视图动作识别的区分虚拟视图。IEEE计算机视觉和模式识别会议记录(第2855–2862页)。
[30] Li,X.(2007年)。正则化自适应:理论、算法和应用。美国华盛顿大学博士论文
[31] Quadrianto,N.,&;Lampert,C.H.(2011)。学习多视图邻域保持投影。《机器学习国际会议论文集》(ICML)(第425-432页)。
[32] Rodner,E.,Hoffman,J.,Donahue,J.、Darrell,T.、Saenko,K.(2013)。使图像网络适应现实:具有隐式低阶变换的可伸缩域适应。arXiv:1308.4200(预印本)。
[33] Saenko,K.、Kulis,B.、Fritz,M.和;Darrell,T.(2010)。使视觉类别模型适应新领域。《欧洲计算机视觉会议论文集》(第213-226页)。
[34] Sharma,A.、Kumar,A.、Daume,H.和;Jacobs,D.W.(2012)。广义多视图分析:一个有区别的潜在空间。《IEEE计算机视觉和模式识别会议论文集》(第2160-2167页)。
[35] A.托拉尔巴;Efros,A.(2011年)。无偏见地看待数据集偏差。《IEEE计算机视觉和模式识别会议论文集》(第1521-1528页)。
[36] Yang,J.、Yan,R.和;Hauptmann,A.G.(2007)。使用自适应svm的跨域视频概念检测。ACM多媒体(第188-197页)。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。