×

图像对齐的度量学习。 (英语) Zbl 1477.68401号

摘要:图像对齐是计算机视觉中一个长期存在的问题。参数化外观模型(PAM),如Lucas-Kanade方法、Eigentracking和Active Appearance Models,通常用于将图像与模板或之前学习的模型对齐。虽然与替代方法相比,PAM有许多优点,但它们至少有两个缺点。首先,它们在注册过程中特别容易出现局部极小值。其次,通常很少(如果有的话)成本函数的局部极小值对应于可接受的解决方案。为了克服这些问题,本文提出了一种学习PAM度量的方法,该方法显式优化了局部极小值出现在且仅出现在正确拟合参数对应的位置。据我们所知,这是第一篇讨论学习度量以显式建模PAM错误曲面的局部属性的论文。合成和实际示例表明,与传统方法相比,对齐性能有所提高。此外,我们还展示了如何使用所提出的良好度量标准来选择要跟踪的良好特征。

MSC公司:

68T45型 机器视觉和场景理解
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 贝克,S.,&;Matthews,I.(2001)。图像对齐算法的等效性和效率。IEEE计算机视觉和模式识别会议论文集。
[2] 贝克,S.,&;Matthews,I.(2004)。《卢卡斯·卡纳德20年:统一框架》,《国际计算机视觉杂志》,56(3),221-255·Zbl 1477.68324号 ·doi:10.1023/B:VISI.0000011205.11775.fd
[3] Bergen,J.R.、Anandan,P.、Hanna,K.J.和;Hingorani,R.(1992年)。基于层次模型的运动估计。在欧洲计算机视觉会议上(第237-252页)。
[4] 布莱克、M.J.和;Jepson,A.D.(1998年)。特征跟踪:使用基于视图的表示对对象进行稳健的匹配和跟踪。国际计算机视觉杂志,26(1),63–84·doi:10.1023/A:1007939232436
[5] 布兰兹,V.,&;Vetter,T.(1999)。用于合成3D面的可变形模型。在ACM SIGGRAPH中。
[6] Cootes,T.、Edwards,G.和;Taylor,C.(2001)。活动外观模型。模式分析与机器智能,23(6)。
[7] 库特斯、T.F.和;Taylor,C.(2001)。计算机视觉外观的统计模型(技术代表)。曼彻斯特大学。
[8] de la Torre,F.和;布莱克,M.J.(2003)。稳健的参数化组件分析:2D面部外观模型的理论和应用。计算机视觉和图像理解,91,53–71·doi:10.1016/S1077-3142(03)00076-6
[9] de la Torre,F.和;Nguyen,M.H.(2008)。参数化核主成分分析:监督和非监督图像对齐的理论和应用。IEEE计算机视觉和模式识别会议论文集。
[10] de la Torre,F.、Vitriá,J.、Radeva,P.和;Melenchón,J.(2000年)。用于灵活特征跟踪的特征滤波。在模式识别国际会议上(第1118-1121页)。
[11] de la Torre,F.、Collet,A.、Cohn,J.和;Kanade,T.(2007)。过滤组件分析,以提高外观模型中对局部极小值的鲁棒性。在IEEE计算机视觉和模式识别会议上。
[12] Gong,S.、Mckenna,S.和;Psarrou,A.(2000年)。动态视觉:从图像到人脸识别。帝国学院出版社。
[13] Grant,M.和;Boyd,S.(2008a)。CVX:用于严格凸编程的Matlab软件(网页和软件)。http://stanford.edu网站/\(\sim\)boyd/cvx。
[14] Grant,M.和;Boyd,S.(2008b)。非光滑凸程序的图形实现。在V.Blondel、S.Boyd和;H.Kimura(编辑),《控制和信息科学讲稿:学习和控制的最新进展》(向M.Vidyasagar致敬)(第95-110页)。柏林:斯普林格·Zbl 1205.90223号
[15] Gross,R.、Matthews,I.、Cohn,J.、Kanade,T.和;Baker,S.(2007)。CMU多剂量、照明和表情(multi-PIE)面部数据库(技术代表tR-07-08)。卡内基·梅隆大学。
[16] Hager,G.和;Belhumeur,P.(1998年)。使用几何和照明的参数模型进行有效的区域跟踪。模式分析与机器智能,21025-1039·数字对象标识代码:10.1109/34.722606
[17] Jolliffe,I.(1986年)。主成分分析。纽约:斯普林格·Zbl 0584.62009号
[18] Jones,M.J.和;Poggio,T.(1998)。多维可变形模型。在计算机视觉国际会议上(第683-688页)。
[19] Kanatani,K.(1996年)。几何计算的统计优化:理论与实践。纽约:爱思唯尔科学·Zbl 0851.62078号
[20] Learnd-Miller,E.G.(2006年)。通过连续关节对齐的数据驱动图像模型。IEEE模式分析和机器智能汇刊,28(2),236–250·doi:10.1109/TPAMI.2006.34
[21] Liu,X.(2007)。使用增强外观模型的通用人脸对齐。在IEEE计算机视觉和模式识别会议上。
[22] Lucas,B.和;Kanade,T.(1981)。一种迭代图像配准技术及其在立体视觉中的应用。图像理解研讨会论文集。
[23] Matei,B.C.和;Meer,P.(2006)。计算机视觉应用中非线性误差-变量模型的估计。IEEE模式分析和机器智能汇刊,28(10),1537-1552·doi:10.1109/TPAMI.2006.205
[24] 马修斯,I.,&;Baker,S.(2004年)。重新访问了活动外观模型。国际计算机视觉杂志,60(2),135–164·doi:10.1023/B:VISI.0000029666.37597.d3
[25] Matthews,I.、Ishikawa,T.和;Baker,S.(2004)。模板更新问题。IEEE模式分析和机器智能汇刊,26,810-815·doi:10.1109/TPAMI.2004.16
[26] Nayar,S.K.,&;Poggio,T.(1996)。早期视觉学习。牛津:牛津大学出版社·Zbl 0847.68003号
[27] Nguyen,M.H.和;de la Torre,F.(2008年a)。学习无局部极小值的图像对齐,用于人脸检测和跟踪。在第八届IEEE自动人脸和手势识别国际会议上。
[28] Nguyen,M.H.和;de la Torre,F.(2008b)。无局部极小参数化外观模型。IEEE计算机视觉和模式识别会议论文集。
[29] Rudin,W.(1976年)。数学分析原理(第三版)。纽约:McGraw-Hill·Zbl 0346.26002号
[30] Saragih,J.和;Goecke,R.(2007)。AAM拟合的非线性判别方法。在计算机视觉国际会议上。
[31] Shi,J.和;Tomasi,C.(1994年)。要跟踪的良好功能。在IEEE计算机视觉和模式识别会议上。
[32] Taskar,B.、Guestrin,C.和;Koller,D.(2003)。最大边际马尔可夫网络。神经信息处理系统进展。
[33] 托马西,C.,&Kanade,T.(1991)。点特征的检测和跟踪(技术代表CMU-CS-91-132)。卡内基·梅隆大学。
[34] Tsochantaridis,I.、Joachims,T.、Hofmann,T.和;Altun,Y.(2005)。结构化和相互依存的输出变量的大利润方法。机器学习研究杂志,61453-1484·Zbl 1222.68321号
[35] Vapnik,V.(1998)。统计学习理论。纽约:Wiley·Zbl 0935.62007号
[36] Vetter,T.(1997)。学习对单张脸图像的新颖观点。在自动人脸和手势识别国际会议上。
[37] Wimmer,M.、Stulp,F.、Tschechne,S.J.和;Radig,B.(2006年)。学习用于图像理解应用中模型拟合的鲁棒目标函数。英国机器视觉会议论文集。
[38] Wu,H.,Liu,X.,&Doretto,G.(2008)。通过增强的排名模型进行面部对齐。IEEE计算机视觉和模式识别会议论文集。
[39] Xiao,J.、Baker,S.、Matthews,I.和;Kanade,T.(2004)。实时组合2D+3D活动外观模型。在计算机视觉和模式识别会议上(第二卷,第535-542页)。
[40] Yang,L.(2006)。远程测量学习:一项综合调查。http://www.cse.msu.edu/\(\sim\)杨柳1/frame_survey_v2.pdf。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。