×

相对配对空间分析:从相对配对观察中学习潜在的公共空间。 (英语) Zbl 1398.68585号

摘要:发现不同模态之间的潜在公共空间在跨模态模式识别中具有重要作用。现有的技术通常需要绝对配对的观测值作为训练数据,并且无法捕获跨模态观测值之间更一般的语义关系。这大大限制了它们的应用。在本文中,我们提出了一个从相对配对观测值中学习潜在公共空间的一般框架(即,来自不同模态的两个观测值比另两个更相似配对)。相对配对信息使用潜在公共空间中观测值的相对邻近度进行编码。通过建立一个判别模型并最大化距离裕度,可以为每个模态学习一个将观测值映射到潜在公共空间的投影函数。然后可以在潜在公共空间中进行交叉模式识别。为了加快大规模训练数据的学习过程,该问题被重新定义为学习一个结构模型,并通过切割平面算法有效地解决了该问题。为了评估该框架的性能,将其应用于特征融合、交叉姿势人脸识别、文本图像检索和属性图像检索。实验结果表明,该框架优于其他最先进的方法。

MSC公司:

第68页第45页 机器视觉和场景理解
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Andrea,F.、Yoram,S.、Sha,F和Jitendra,M.(2007年)。学习全局一致的局部距离函数,用于基于形状的图像检索。在:ICCV公司(第1-8页)。
[2] 巴赫,F.和乔丹,M.(2005)。典型相关分析的概率解释技术报告:加州大学伯克利分校统计系。
[3] Branz,V.、Grother,P.、Phillips,P.和Vetter,T.(2005)。基于非正面图像生成的正面视图的人脸识别。在:CVPR公司(第454-461页)。
[4] 布莱,DM;Ng、AY;乔丹,密歇根州,潜在迪里克莱分配,JMLR,3,993-1022,(2003)·Zbl 1112.68379号
[5] Bottou,L.(2010)。具有随机梯度下降的大规模机器学习。在:COMPSTAT公司(第177-187页)·Zbl 1436.68293号
[6] Bronstein,M.和Bronsteim,A.(2010年)。通过使用相似性敏感哈希的跨模态度量学习进行数据融合。在:CVPR公司(第3594-3601页)。
[7] 柴,X;Shan,S;陈,X;Gao,W,位置不变人脸识别的局部线性回归,TIP,161716-1725,(2007)
[8] Davis,J.V.、Kulis,B.、Jain,P.、Sra,S.、Dhillon,I.(2007)。信息论计量学习。在:ICML公司(第209-216页)。
[9] Ek,C.H.,Rihan,J.,Torr,P.H.S.,Rogez,G.,&Lawrence,N.D.(2008年)。潜在空间中的模糊建模。在:MLMI公司(第62-73页)。
[10] Goldberger,J.、Roweis,S.、Hinton,G.和Salakhuttinov,R.(2004年)。邻里成分分析。在:NIPS公司(第513-520页)。
[11] 龚,Y;Ke,Q;伊萨德,M;Lazebnik,S,用于建模互联网图像、标签及其语义的多视图嵌入空间,IJCV,106,210-233,(2014)·文件编号:10.1007/s11263-013-0658-4
[12] 总量,R;马修斯,I;Baker,S,基于外观的人脸识别和光场,PAMI,26449-465,(2004)·doi:10.10109/TPAMI.2004.1265861
[13] 哈东,DR;塞德马克,S;Shawe-Taylor,J,典型相关分析:学习方法应用概述,神经计算,16,2639-2664,(2004)·Zbl 1062.68134号 ·doi:10.1162/0899766042321814
[14] Joachims,T.(2006)。在线性时间内训练线性SVM。收录于:KDD,第217-226页。
[15] Joachims,T;芬利,T;Yu,CNJ,结构支持向量机的切分平面训练,机器学习,77,27-59,(2009)·Zbl 1235.68161号 ·doi:10.1007/s10994-009-5108-8
[16] Kan,M.、Shan,S.和Zhang,H.(2012年)。多视角判别分析。在:电子对抗车辆(第808-821页)。
[17] Knutsson,H.、Borga,M.和Tomas,L.(1997)。学习典型相关性。在:SCIA,计算机视觉实验室,第1卷.
[18] Kuang,Z.和Wong,K.Y.K.(2013)。相对配对空间分析。在:BMVC公司. ·Zbl 1398.68585号
[19] Kumar,N.、Berg,A.C.、Belhumeur,P.N.和Nayar,S.K.(2009年)。用于人脸验证的属性和明喻分类器。在:ICCV公司.
[20] Lampert,C.和Krömer,O.(2010年)。多模态降维和转移学习的弱配对最大协方差分析。在:电子对抗车辆(第566-579页)。
[21] Lin,D.和Tang,X.(2005)。图像风格转换的耦合空间学习。在:ICCV公司(第1699-1706页)。
[22] Lin,D.和Tang,X.(2006)。模态间人脸识别。在:电子对抗车辆(第13-26页)。
[23] 刘,DC;Nocedal,J,关于大规模优化的有限内存BFGS方法,数学规划,45,503-528,(1989)·Zbl 0696.90048号 ·doi:10.1007/BF0158916文件
[24] 刘,X;Chen,T,使用几何辅助概率建模的姿态鲁棒人脸识别,CVPR,1502-509,(2005)
[25] Lowe,DG,《尺度不变关键点的独特图像特征》,国际期刊,60,91-110,(2004)·doi:10.1023/B:VISI.0000029664.99615.94
[26] Navaratnam,R.、Fitzgibbon,A.W.和Cipolla,R.(2007)。半监督多值回归的联合流形模型。在:ICCV公司(第1-8页)。
[27] Parameswaran,S.和Weinberger,K.(2010年)。大幅度多任务度量学习。在:NIPS公司(第1-9页)。
[28] Parikh,D.和Grauman,K.(2011年)。相对属性。在:ICCV公司.
[29] 王子,S;沃雷尔,J;Elder,J;Felisberti,F,大姿势差异人脸识别的捆绑因子分析,PAMI,30970-984,(2008)·doi:10.1109/TPAMI.2008.48
[30] Quadrianto,N.和Lampert,C.(2011年)。学习多视图邻域保持投影。在:ICML公司(第425-432页)。
[31] Rakotomamonjy,A.(2004)。支持向量机与ROC曲线下面积PSI-INSA de Rouen:技术报告。
[32] Rasiwasia,N.、Pereira,J.C.、Coviello,E.、Doyle,G.、Lanckriet,G.R.G.、Levy,R.和Vasconcelos,N.(2010年)。一种跨模态多媒体检索的新方法。在:ACM毫米(第251-260页)。
[33] 罗斯帕尔,R;Krämer,N,《偏最小二乘法概述和最新进展》,34-51,(2006),柏林·数字对象标识代码:10.1007/117527902
[34] Rupnik,J.和Shawe-Taylor,J.(2010年)。多视角典型相关分析。在:SiKDD公司.
[35] Saenko,K.、Kulis,B.、Fritz,M.和Darrell,T.(2010年)。使视觉类别模型适应新领域。在:电子对抗车辆(第1-14页)。
[36] Shalev Shwartz,Singer,Y.和Srebro,N.(2007年)。Pegasos:SVM的原始估计亚GrAdient SOlver。在:ICML公司. ·Zbl 1211.90239号
[37] Sharma,A.和Jacobs,D.W.(2011年)。旁路合成:PLS用于姿势、低分辨率和草图的人脸识别。在:CVPR公司(第593-600页)。
[38] Sharma,A.和Kumar,A.(2012年)。广义多视图分析:一个有区别的潜在空间。在:CVPR公司(第2160-2167页)。
[39] Shen,C.、Kim,J.、Wang,L.和Hengel,A.(2009)。带boosting的半正定度量学习。在:钳口(第1651-1659页)。
[40] Shen,C.、Kim,J.和Wang,L.(2011)。半定度量学习的可扩展对偶方法。在:CVPR公司(第2601-2608页)。
[41] Shon,A.P.、Grochow,K.、Hertzmann,A.和Rao,R.P.N.(2006)。学习用于图像合成和机器人仿真的共享潜在结构。在:NIPS公司(第1233-1240页)。
[42] Stewart,G.(1993)。关于奇异值分解的早期历史。在:暹罗(第551-566页)·Zbl 0799.01016号
[43] Sun,T.、Chen,S.、Yang,J.和Shi,P.(2008年)。一种新的用于识别的组合特征提取方法。在:ICDM公司(第1043-1048页)。
[44] Taskar,B.(2004)。学习结构化预测模型:大幅度评估。斯坦福大学博士论文。
[45] Tenenbaum,J;弗里曼,W,用双线性模型分离风格和内容,神经计算,12,1247-1283,(2000)·doi:10.1162/089976600300015349
[46] 托瑞,F;Black,M,动态耦合组件分析,CVPR,2643-650,(2001)
[47] Tsochantaridis,I.、Hofmann,T.、Joachims,T.和Altun,Y.(2004年)。支持相互依赖和结构化输出空间的向量机学习。在:ICML公司(第104-112页)。
[48] Wang,B.,Tang,J.,Fan,W.,Chen,S.,Yang,Z.,&Liu,Y.(2009)。潜在空间类别和主题描述符的异构跨域排名。在:CIKM公司.
[49] Weinberger,K.Q.、Blitzer,J.和Saul,L.K.(2006年)。大幅度最近邻分类的距离度量学习。在:NIPS公司.
[50] Wu,W.,Xu,J.,&Li,H.(2010)。学习异构空间中对象之间的相似函数。技术代表MSR-TR-2010-86。
[51] 邢,EP;Ng、AY;密歇根州约旦;Russell,S,远程度量学习,及其在附带信息聚类中的应用,NIPS,15205-512,(2002)
[52] 张,J;Zhang,D,利用类内示例之间的随机交叉相关性构建多视图数据集成的新方法,模式识别,44,1162-1171,(2011)·Zbl 1209.68499号 ·doi:10.1016/j.patcog.2010.12.011
[53] Zhang,W.,Wang,X.,&Tang,X..(2011)。用于人脸照片识别的耦合信息理论编码。在:CVPR公司(第513-520页)。
[54] 郑,W;龚,S;Tao,X,通过相对距离比较重新识别,PAMI,35,653-668,(2013)·doi:10.1109/TPAMI.2012.138
[55] Zhou,H.、Kuang,Z.和Wong,K.Y.K.(2012)。用于人脸草图合成的马尔可夫权重场。在:CVPR公司(第1091-1097页)。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。