×

人脸识别的域自适应:将公共子空间桥接的源域目标化。 (英语) 兹比尔1328.68244

摘要:在许多应用中,由于两个域之间的不匹配,在源域学习但应用于新目标域的人脸识别模型甚至会显著退化。为了学习更好的目标域人脸识别模型,本文提出了一种简单有效的域自适应方法,将监督知识从标记的源域转移到未标记的目标域。我们的基本思想是将源域图像转换为目标域(以下称为目标域),同时保留其监督信息。为此,每个源域图像简单地表示为图像空间中稀疏目标域邻域的线性组合,但组合系数是在公共子空间中学习的。该策略背后的原理是,公共知识仅有利于准确的跨域重建,但对于目标域中的分类,目标域的特定知识也是必不可少的,因此应该大部分保留下来(通过本文中的图像空间目标化)。为了发现公共知识,特别是学习一个公共子空间,在该子空间中保持两个域的结构,同时减少源域和目标域的差异。该方法在三种人脸识别场景下进行了广泛评估,即跨视角区域自适应、跨种族区域自适应和跨成像条件区域自适应。实验结果表明,我们的方法优于其他竞争方法。

MSC公司:

68T45型 机器视觉和场景理解
68吨10 模式识别、语音识别
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Belhumeur,P.N.、Hespanha,J.P.和;Kriegman,D.J.(1997)。特征脸与渔夫脸:使用特定类别的线性投影进行识别。IEEE模式分析和机器智能汇刊(T-PAMI),19(7),711-720·Zbl 05111919号 ·doi:10.1109/34.598228
[2] Ben-David,S.、Blitzer,J.、Crammer,K.和;Pereira,F.(2007)。领域适应的表示分析。神经信息处理系统进展NIPS,19,137–144。
[3] Bickel,S.、Brückner,M.和;Scheffer,T.(2009)。协变量转移下的判别学习。机器学习研究杂志(JMLR),10,2137–2155·Zbl 1235.62066号
[4] Blitzer,J.、McDonald,R.和;Pereira,F.(2006)。结构对应学习的领域适应。自然语言处理经验方法会议(EMNLP)(第120-128页)。
[5] 布鲁佐内(Bruzzone,L.);Marconcini,M.(2010年)。领域自适应问题:一种dasvm分类技术和一种循环验证策略。IEEE模式分析和机器智能汇刊(T-PAMI),32(5),770–787·doi:10.10109/TPAMI.2009.57
[6] Chen,Y.、Wang,G.和;Dong,S.(2003)。使用渐进式转换支持向量机进行学习。模式识别字母(PRL),24(12),1845-1855·Zbl 01977703号 ·doi:10.1016/S0167-8655(03)00008-4
[7] Donoho,D.L.(2006)。对于大多数大型欠定线性方程组,最小l({1})1-范数解也是最稀疏解。《纯粹数学与应用数学交流》,59(6),797-829·Zbl 1113.15004号 ·doi:10.1002/cpa.20132年
[8] Duan,L.,Tsang,I.W.,Xu,D.和;马来亚银行,S.J.(2009)。用于视频概念检测的域转移支持向量机。IEEE计算机视觉和模式识别会议(CVPR)(第1375-1381页)。
[9] Duan,L.、Xu,D.、Tsang,I.和;Luo,J.(2012)。通过从网络数据中学习视频中的视觉事件识别。IEEE模式分析和机器智能汇刊(T-PAMI),34(9),1667-1680·doi:10.1109/TPAMI.2011.265
[10] Dudák,M.、Schapire,R.E.和;Phillips,S.J.(2005)。修正最大熵密度估计中的样本选择偏差。神经信息处理系统(NIPS)进展,17,323–330。
[11] Efron,B.、Hastie,T.、Johnstone,I.和;Tibshirani,R.(2004)。最小角度回归。《统计年鉴》,39(4),407-499·Zbl 1091.62054号
[12] 高,X,王,X,李,X,&;Tao,D.(2011)。基于散度分析的传递潜变量模型。模式识别(PR),44(10–11),2358–2366·Zbl 1218.68122号 ·doi:10.1016/j.patcog.2010.06.013
[13] 耿,B.,陶,D.,&;Xu,C.(2011)。Daml:领域适应度量学习。IEEE图像处理汇刊(T-IP),20(10),2980–2989·兹比尔1372.68222 ·doi:10.10109/TIP.2011.2134107
[14] 龚,B.,石,Y.,沙,F.,&;Grauman,K.(2012年)。无监督域自适应的测地流核。IEEE计算机视觉和模式识别会议(CVPR),2066–2073。
[15] Gopalan,R.、Li,R.&Chellappa,R.(2011)。对象识别的域自适应:一种无监督方法。IEEE国际计算机视觉会议(ICCV)(第999-1006页)。
[16] Gretton,A.、Smola,A.、Huang,J.、Schmittfull,M.、Borgwardt,K.和;Schölkopf,B.(2009年)。通过核均值匹配实现协变量偏移。机器学习中的数据集转换(第131-160页)。剑桥:麻省理工学院出版社。
[17] Gross,R.、Matthews,I.、Cohn,J.、kanada,T.和;Baker,S.(2007)。cmu多糖、照明和表情(多ie)人脸数据库。卡内基梅隆大学机器人研究所技术代表。TR-07-08。
[18] DI哈尔。(2009年)。具有潜在层次结构的贝叶斯多任务学习。人工智能不确定性会议(UAI)(第135–142页)。
[19] 他、X、&;Niyogi,P.(2004)。保留位置的投影。神经信息处理系统进展NIPS,16,153-160。
[20] Huang,J.、Smola,A.J.、Gretton,A.、Borgwardt,K.M.和;Schölkopf,B.(2006年)。通过未标记数据纠正样本选择偏差。神经信息处理系统(NIPS)进展。
[21] Huang,K.和;Aviyente,S.(2007)。信号分类的稀疏表示。神经信息处理系统进展NIPS,19609-616。
[22] 伊利诺伊州Jhuo。,Liu,D.,Lee,D.T.和;Chang,S.F.(2012)。具有低阶重建的鲁棒视觉域自适应。在IEEE计算机视觉和模式识别会议(CVPR)上(第2168-2175页)。
[23] Jia,Y.,Nie,F.和;Zhang,C.(2009年)。跟踪比率问题再次出现。IEEE神经网络汇刊(T-NN),20(4),729–735·doi:10.1109/TNN.2009.2015760
[24] Liu,C.和;Wechsler,H.(2002)。使用增强的fisher线性判别模型进行基于Gabor特征的人脸识别。IEEE图像处理学报(T-IP),11(4),467–476·Zbl 05453130号 ·doi:10.1109/TIP.2002.9999679
[25] Mehrotra,R.、Agrawal,R.和Haider,S.A.(2012年)。基于字典的域自适应稀疏表示。在ACM信息和知识管理国际会议(CIKM)上(第2395-2398页)。
[26] Messer,K.、Matas,M.、Kittler,J.、Lttin,J.和;Maitre,G.(1999)。Xm2vtsdb:扩展的m2vts数据库。在基于音频和视频的生物特征身份验证(AVBPA)国际会议上(第72-77页)。
[27] Pan,S.J.和;杨琼(2010)。关于迁移学习的调查。IEEE知识与数据工程学报(T-KDE),22(10),1345-1359·doi:10.1109/TKDE.2009.191
[28] Pan,S.J.、Kwok,J.T.和;Yang,Q.(2008)通过降维转移学习。在AAAI人工智能会议(AAAI)上(第677-682页)。
[29] Pan,S.J.,Tsang,I.W.,Kwok,J.T.,Yang,Q.(2009)。通过传输组件分析进行域自适应。国际人工智能联合会议(IJCAI)(第1187-1192页)。
[30] Pan,S.J.,Tsang,I.W.,Kwok,J.T.和;杨琼(2011)。通过传输组件分析进行域自适应。IEEE神经网络汇刊(T-NN),22(2),199-210·doi:10.1109/TNN.2010.2091281
[31] Phillips,P.J.、Flynn,P.J、Scruggs,T.、Bowyer,K.W.、Chang,J.、Hoffman,K.等人(2005年)。人脸识别大挑战概述。IEEE计算机视觉和模式识别会议CVPR,1947–954。
[32] Qiu,Q.、Patel,V.M.、Turaga,P.和;Chellappa,R.(2012年)。领域自适应词典学习。在欧洲计算机视觉会议(ECCV)上(第631-645页)。
[33] Raina,R.、Battle,A.、Lee,H.、Packer,B.、Ng,A.Y.(2007年)。自学学习:从未标记数据中转移学习。在国际机器学习会议(ICML)上(第759-766页)。
[34] Roweis,S.T.,&;Saul,L.K.(2000)。局部线性嵌入的非线性降维。科学,290(5500),2323-2326。
[35] Shao,M.、Castillo,C.、Gu,Z.、Fu,Y.(2012)。低秩转移子空间学习。IEEE国际数据挖掘会议(ICDM)(第1104–1109页)。
[36] Shi,Y.和;Sha,F.(2012)。非监督领域适应的区分性集群的信息理论学习。在国际机器学习会议(ICML)上。
[37] Hidetoshi Shimodaira。(2000). 通过加权对数似然函数改进协变量移位下的预测推断。统计规划与推断杂志,90(2),227-244·Zbl 0958.62011号
[38] Si,S.,Tao,D.和;Geng,B.(2010年)。传递子空间学习中基于Bregman发散的正则化方法。IEEE知识与数据工程学报T-KDE,22(7),929-942·doi:10.1109/TKDE.2009.126
[39] Si,S.,Liu,W.,Tao,D.和;Chan,K.P.(2011)。黎曼对称空间中的分布校正。IEEE系统、人与控制论汇刊,B部分,41(4),921-930·doi:10.1109/TSMCB.2010.2100042
[40] Su,Y.,Shan,S.,Chen,X.,&;Gao,W.(2009)。用于人脸识别的全局和局部分类器的层次集成。IEEE图像处理汇刊T-IP,18(8),1885-1896·Zbl 1371.94355号 ·doi:10.1109/TIP.2009.2021737
[41] Sugiyama,M.、Nakajima,S.、Kashima,H.、Buenau,P.V.和;Kawanabe,M.(2008年)。模型选择的直接重要性估计及其在协变量偏移自适应中的应用。In:神经信息处理系统进展NIPS,201433-1440。
[42] Sugiyamai,M.、Krauledat,M.和;Müller,K.R.(2007)。通过重要性加权交叉验证实现协变量移位适应。机器学习研究杂志(JMLR),8985–1005·Zbl 1222.68313号
[43] Turk,M.A.和;Pentland,A.P.(1991)。使用特征脸的人脸识别。IEEE计算机视觉和模式识别会议(CVPR),591,586–591。
[44] Uribe,D.(2010年)。情感分类中的领域适应。在机器学习和应用国际会议(ICMLA)上(第857-860页)。
[45] Wang,H.,Yan,S.,Xu,D.,Tang,X.,&;Huang,T.(2007)。用于降维的跟踪比率与比率跟踪。IEEE计算机视觉和模式识别会议(CVPR)(第1-8页)。
[46] Wang,Z.,Song,Y.,Zhang,C.(2008)。传递的维度约简。在欧洲数据挖掘和知识发现原则会议(PKDD)上(第550-565页)。
[47] Wright,J.、Yang,A.Y.、Ganesh,A.、Sastry,S.S.和;Ma,Y.(2009年)。基于稀疏表示的鲁棒人脸识别。IEEE模式分析和机器智能汇刊(T-PAMI),31(2),210–227·doi:10.1109/TPAMI.2008.79
[48] 仙交通,U.(2006)。http://www.aiar.xjtu.edu.cn/dfrlsjk5.htm .
[49] Xue,Y.,Liao,X.,Carin,L.和;Krishnapuram,B.(2007年)。基于dirichlet过程先验的多任务分类学习。机器学习研究杂志(JMLR),8,35–63·Zbl 1222.68338号
[50] 扎德罗兹尼;比安卡(2004)。在样本选择偏差下学习和评估分类器。《机器学习国际会议论文集》(第114页)。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。