×

稳健的低变换多秩张量图像对齐方法。 (英语) Zbl 1464.65020号

摘要:对齐一组线性相关的图像是计算机视觉中的一项重要任务。本文提出了一种变换张量核范数和张量(ell_1)范数的组合来处理这一图像对齐问题,其中,叠加成三阶张量的观测图像被未知域变换变形,并受到脉冲噪声、部分遮挡、,和照明变化。该方法的主要优点是可以利用变换后的张量核范数来捕获空间相关性和图像变化。我们表明,当相关图像的底层是一个低多秩张量时,可以建立该模型估计量的误差上界,该上界可以优于以前的结果。除了所提出的凸变换张量模型外,该方法还可以通过在变换张量核范数和稀疏范数中引入非凸函数来进一步研究。所提出的凸优化模型和非凸优化模型均采用广义高斯-奈顿算法进行求解。在非常温和的条件下,还可以提供求解凸优化模型和非凸优化模型子问题的数值方法的全局收敛性。对具有失调和稀疏畸变的真实图像进行的大量数值实验表明,我们提出的方法在准确性和效率方面优于几种最先进的方法。

理学硕士:

65D18天 计算机图形、图像分析和计算几何的数值方面
68单位10 图像处理的计算方法
94A08型 信息与通信理论中的图像处理(压缩、重建等)
15A69号 多线性代数,张量演算
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿盖勒贝雷,C。;Delbracio,M。;Bartesaghi,A。;Sapiro,G.,《多图像对齐的基本极限》,IEEE Trans。信号处理。,64, 21, 5707-5722 (2016) ·Zbl 1414.94008号 ·doi:10.1109/TSP.2016.2600517
[2] 北卡罗来纳州阿里卡。;Yarman-Vural,FT,草书手写的光学字符识别,IEEE Trans。模式分析。机器。智力。,24, 6, 801-813 (2002) ·doi:10.1109/TPAMI.2002.1008386
[3] Attouch,H。;博尔特,J。;Redont,P。;Soubeyran,A.,非凸问题的近似交替最小化和投影方法:基于Kurdyka-Łojasiewicz不等式的方法,数学。操作。研究,35,2,438-457(2010)·兹伯利1214.65036 ·doi:10.1287/门.1100.0449
[4] Attouch,H。;博尔特,J。;Svaiter,BF,半代数和驯服问题下降方法的收敛性:近似算法,前向-后向分裂,正则高斯-赛德尔方法,数学。程序。,137, 1-2, 91-129 (2013) ·Zbl 1260.49048号 ·doi:10.1007/s10107-011-0484-9
[5] 巴斯里(Basri),R。;雅各布斯,D.,兰伯反射和线性子空间,IEEE Trans。模式分析。机器。智力。,25, 2, 218-233 (2003) ·doi:10.1109/TPAMI.2003.1177153
[6] 孟加拉,JA;费恩,HN;Tuan,HD;Do,MN,《彩色图像和视频恢复的高效张量补全:低阶张量序列》,IEEE Trans。图像处理。,26, 5, 2466-2479 (2017) ·兹比尔1409.94036 ·doi:10.1109/TIP.2017.2672439
[7] 博尔特,J。;Danilidis,A。;Lewis,A.,非光滑子分析函数的Łojasiewicz不等式及其在次梯度动力系统中的应用,SIAM J.Optim。,17, 4, 1205-1223 (2007) ·Zbl 1129.26012号 ·doi:10.1137/050644641
[8] 博尔特,J。;萨巴赫,S。;Teboulle,M.,非凸和非光滑问题的近似交替线性化最小化,数学。程序。,146, 1-2, 459-494 (2014) ·Zbl 1297.90125号 ·doi:10.1007/s10107-013-0701-9
[9] 伯克,合资公司;Ferris,MC,凸组合优化的高斯-纽顿方法,数学。程序。,71, 2, 179-194 (1995) ·Zbl 0846.90083号 ·doi:10.1007/BF01585997
[10] JD卡罗尔;Chang,J-J,通过“Eckart-Young”分解的n向泛化分析多维标度中的个体差异,《心理测量学》,35,3,283-319(1970)·Zbl 0202.19101号 ·doi:10.1007/BF02310791
[11] Chen,L。;Sun,D。;Toh,K-C,一种用于高维凸组合二次曲线规划的高效非精确对称高斯-赛德尔优化ADMM,数学。程序。,161, 1-2, 237-270 (2017) ·Zbl 1356.90105号 ·doi:10.1007/s10107-016-1007-5
[12] 陈,X。;韩,Z。;Wang,Y。;Tang,Y。;Yu,H.,非凸加二次惩罚低秩稀疏分解用于噪声图像对齐,Sci。中国资讯。科学。,59, 5, 052107 (2016) ·doi:10.1007/s11432-015-5419-2
[13] Cox,M.、Sridharan,S.、Lucey,S.和Cohn,J.:图像无监督对齐的最小二乘凝聚。2008年IEEE计算机学会计算机视觉和模式识别会议,第1-8页(2008)
[14] Cox,M.、Sridharan,S.、Lucey,S.和Cohn,J.:大量图像的最小二乘凝聚。2009年IEEE第12届国际计算机视觉会议,第1949-1956页(2009)
[15] Cromme,L.,《强唯一性:迭代过程收敛分析的深远准则》,Numer。数学。,29, 2, 179-193 (1978) ·Zbl 0352.65012号 ·doi:10.1007/BF01390337
[16] 丁,C。;Qi,H-D,非线性降维中忠实欧氏距离表示的凸优化学习,数学。程序。,164, 1-2, 341-381 (2017) ·Zbl 1391.90472号 ·doi:10.1007/s10107-016-1090-7
[17] 多诺霍,DL;Grimes,C.,与欧几里得空间等距的图像流形,数学杂志。成像视觉。,23, 1, 5-24 (2005) ·Zbl 1478.62186号 ·doi:10.1007/s10851-005-4965-4
[18] 范,J。;Li,R.,《通过非一致惩罚似然进行变量选择及其预言属性》,美国统计协会,96,456,1348-1360(2001)·Zbl 1073.62547号 ·doi:10.1198/016214501753382273
[19] 范,J。;薛,L。;Zou,H.,折叠凹惩罚估计的强预言最优,Ann.Stat.,42,3,819-849(2014)·Zbl 1305.62252号 ·doi:10.1214/13-AOS1198
[20] Goldfarb,D。;秦,Z.,《稳健低秩张量恢复:模型和算法》,SIAM J.矩阵分析。申请。,35, 1, 225-253 (2014) ·Zbl 1296.65086号 ·doi:10.1137/130905010
[21] Gong,P,Zhang,C.,Lu,Z.,Huang,J.,Ye,J.:非凸正则优化问题的通用迭代收缩和阈值算法。摘自:机器学习国际会议,第37-45页(2013)
[22] He,J。;张,D。;巴尔扎诺,L。;Tao,T.,稳健图像对齐的迭代格拉斯曼优化,image Vis。计算。,32, 10, 800-813 (2014) ·doi:10.1016/j.imavis.2014.02.015
[23] 希勒,CJ;Lim,L-H,大多数张量问题都是NP-hard,J.ACM,60,6,45(2013)·Zbl 1281.68126号 ·doi:10.145/2512329
[24] Huang,G.B.,Jain,V.,Learnd-Miller,E.:复杂图像的无监督联合对齐。2007年IEEE计算机视觉国际会议,第1-8页(2007年)
[25] Jiang,Q.,Ng,M.:通过凸优化实现鲁棒低管秩张量补全。摘自:《第28届国际人工智能联合会议记录》,第2649-2655页。AAAI出版社(2019)
[26] Jittorntrum,K。;奥斯本,MR,非线性离散逼近中的强唯一性和二阶收敛性,数值。数学。,34, 4, 439-455 (1980) ·Zbl 0486.65008号 ·doi:10.1007/BF01403680
[27] 科恩菲尔德,E。;基尔默,M。;Aeron,S.,带可逆线性变换的张量传感器产品,线性代数应用。,485, 545-570 (2015) ·Zbl 1323.15016号 ·doi:10.1016/j.laa.2015.07.021
[28] 基尔默,ME;Braman,K。;郝,N。;胡佛,RC,《作为矩阵算子的三阶张量:成像应用的理论和计算框架》,SIAM J.矩阵分析。申请。,34, 1, 148-172 (2013) ·兹比尔1269.65044 ·数字对象标识代码:10.1137/10837711
[29] 基尔默,ME;Martin,CD,三阶张量的因式分解策略,线性代数应用。,435, 3, 641-658 (2011) ·Zbl 1228.15009号 ·doi:10.1016/j.laa.2010.09.020
[30] 科尔达,TG;Bader,BW,张量分解与应用,SIAM Rev.,51,3,455-500(2009)·Zbl 1173.65029号 ·doi:10.1137/07070111X
[31] Kurdyka,K.,《关于o-极小结构中可定义函数的梯度》,《傅里叶年鉴》,48,3,769-783(1998)·Zbl 0934.32009 ·doi:10.5802/aif.1638
[32] Learnd-Miller,EG,通过连续联合对齐的数据驱动图像模型,IEEE Trans。模式分析。机器。智力。,28, 2, 236-250 (2006) ·doi:10.1109/TPAMI.2006.34
[33] LeCun,Y。;博图,L。;Y.本吉奥。;Haffner,P.,《基于梯度的学习应用于文档识别》,Proc。IEEE,86,11,2278-2324(1998)·数字对象标识代码:10.1109/5.726791
[34] 路易斯,AS;Wright,SJ,复合最小化的近似方法,数学。程序。,158, 1-2, 501-546 (2016) ·Zbl 1345.49041号 ·doi:10.1007/s10107-015-0943-9
[35] 李,P。;冯,J。;金,X。;张,L。;Xu,X。;Yan,S.,流数据分析的在线稳健低秩张量建模,IEEE Trans。神经网络。学习。系统。,30, 4, 1061-1075 (2019) ·doi:10.1109/TNNLS.2018.2860964
[36] 李,X。;Sun,D。;Toh,K-C,基于Schur补码的凸二次锥规划半近似ADMM及其扩展,数学。程序。,155, 1-2, 333-373 (2016) ·Zbl 1342.90134号 ·doi:10.1007/s10107-014-0850-5
[37] 李毅。;陈,C。;杨,F。;Huang,J.,鲁棒图像配准的分层稀疏表示,IEEE Trans。模式分析。机器。智力。,40, 9, 2151-2164 (2018) ·doi:10.1109/TPAMI.2017.2748125
[38] 刘杰。;穆西亚尔斯基,P。;Wonka,P。;Ye,J.,估计视觉数据中缺失值的张量补全,IEEE Trans。模式分析。机器。智力。,35, 1, 208-220 (2013) ·doi:10.1109/TPAMI.2012.39
[39] Łojasiewicz,S.:Une propriété拓扑des sous-ensemples analytiques réels。在《部分河流方程》中,《国家科学研究中心条件》,第87-89页(1963年)·Zbl 0234.57007号
[40] Lu,C。;冯,J。;陈,Y。;刘伟。;林,Z。;Yan,S.,新张量核范数张量鲁棒主分量分析,IEEE Trans。模式分析。机器。智力。,42, 4, 925-938 (2020) ·doi:10.1109/TPAMI.2019.2891760
[41] 马云(Ma,Y.)。;索托,S。;Kosecka,J。;Sastry,SS,《3D视觉邀请:从图像到几何模型》(2004),纽约:Springer,纽约·兹比尔1043.65040 ·doi:10.1007/978-0-387-21779-6
[42] 马亚诺维奇,G。;Solo,V.,《On(\ell_q)optimization and matrix completion》,IEEE Trans。信号处理。,60, 11, 5714-5724 (2012) ·Zbl 1393.94353号 ·doi:10.1109/TSP.2012.212015
[43] 马丁,CD;沙弗,R。;LaRue,B.,《有序p张量因式分解及其在成像中的应用》,SIAM J.Sci。计算。,35、1、A474-A490(2013)·Zbl 1273.15032号 ·doi:10.1137/110841229
[44] Martinez,A.M.:AR人脸数据库。计算机视觉中心,技术报告,24(1998)
[45] Mu,C。;黄,B。;Wright,J。;Goldfarb,D.,《平方协议:张量恢复的下限和改进松弛》,Proc。内部配置机。学习。,32, 73-81 (2014)
[46] Ng、MK;张,X。;Zhao,X-L,用于稳健张量补全的拼接管幺正变换,模式识别。,100, 107181 (2020) ·doi:10.1016/j.patcog.2019.107181
[47] 尼科洛娃,M。;Ng、MK;Tam,C-P,On(\ell_1)数据拟合和图像恢复的凹正则化,SIAM J.Sci。计算。,35、1、A397-A430(2013)·Zbl 1267.65028号 ·数字对象标识码:10.1137/10080172X
[48] Oseledets,IV,张量-应变分解,SIAM J.Sci。计算。,33, 5, 2295-2317 (2011) ·Zbl 1232.15018号 ·doi:10.1137/090752286
[49] 彭,Y。;Ganesh,A。;赖特,J。;徐伟(Xu,W.)。;Ma,Y.,RASL:线性相关图像的稀疏和低秩分解鲁棒对齐,IEEE Trans。模式分析。机器。智力。,34, 11, 2233-2246 (2012) ·doi:10.1109/TPAMI.2011.282
[50] Penney,普通合伙人;Weese,J.等人。;小,JA;Desmedt,P。;希尔,DL;DJ Hawkes,《2-D-3-D医学图像配准中使用的相似性度量的比较》,IEEE Trans。医学成像,17,4,586-595(1998)·数字对象标识代码:10.1109/42.73403
[51] 普鲁姆,JP;美因茨,JA;马萨诸塞州Viergever,医学图像的基于互信息的注册:一项调查,IEEE Trans。医学成像,22,8,986-1004(2003)·doi:10.1109/TMI.2003.815867
[52] 邱,D。;Bai,M。;Ng,M。;Zhang,X.,带非凸正则化的非局部稳健张量恢复,反问题,37,3,035001(2021)·Zbl 1464.65039号 ·doi:10.1088/1361-6420/abd85b
[53] Rockafellar,RT公司;Wets,RJ-B,变分分析(2009),柏林:施普林格出版社,柏林·Zbl 0888.49001号
[54] Romera--Paredes,B.,Pontil,M.:张量完备的新凸松弛。摘自:《神经信息处理系统进展》,第2967-2975页(2013年)
[55] Song,G。;Ng、MK;Zhang,X.,使用变换张量奇异值分解的稳健张量补全,Numer。线性代数应用。,27、3、e2299(2020年)·Zbl 07217207号 ·doi:10.1002/nla.2299
[56] Song,W。;朱,J。;李毅。;Chen,C.,基于随机梯度下降的在线鲁棒PCA图像对齐,IEEE Trans。电路系统。视频技术。,26, 7, 1241-1250 (2016) ·doi:10.1109/TCSVT.2015.2455711
[57] Szeliski,R.,《图像对齐和缝合:教程》,Found。趋势计算。图表。视觉。,2, 1, 1-104 (2006) ·Zbl 1126.68092号 ·doi:10.1561/0600000009
[58] Tibshirani,R.,《通过套索进行回归收缩和选择》,J.R.Stat.Soc.Ser。B、 58、1、267-288(1996)·Zbl 0850.62538号
[59] Tucker,LR,关于三模因子分析的一些数学注释,心理测量学,31,3279-311(1966)·doi:10.1007/BF02289464
[60] Turk,M.A.,Pentland,A.P.:使用特征脸进行人脸识别。摘自:1991年IEEE计算机学会计算机视觉和模式识别会议记录,第586-587页(1991)
[61] Vedaldi,A.、Guidi,G.、Soatto,S.:联合数据对齐到(有损)转换。在:2008年IEEE计算机学会计算机视觉和模式识别会议,第1-8页(2008)
[62] Wu,Y.,Shen,B.,Ling,H.:通过迭代凸优化实现在线鲁棒图像对齐。2012年IEEE计算机学会计算机视觉和模式识别会议,第1808-1814页。IEEE(2012)
[63] Zhang,C-H,最小最大凹惩罚下的几乎无偏变量选择,《Ann.Stat.》,38,2,894-942(2010)·Zbl 1183.62120号 ·doi:10.1214/09-AOS729
[64] Zhang,T.,稀疏正则化的多级凸松弛分析,J.Mach。学习。第11、35、1081-1107号决议(2010年)·兹比尔1242.68262
[65] Zhang,X.,低秩张量完备的非凸松弛方法,IEEE Trans。神经网络。学习。系统。,30, 6, 1659-1671 (2019) ·doi:10.1109/TNNLS.2018.2872583
[66] 张,X。;Bai,M。;Ng,MK,基于脉冲噪声去除的非凸TV图像恢复,SIAM J.成像科学。,10, 3, 1627-1667 (2017) ·Zbl 1382.49013号 ·doi:10.1137/16M1076034
[67] 张,X。;Ng,MK,噪声低阶张量补全的校正张量核范数最小化方法,SIAM J.成像科学。,12, 2, 1231-1273 (2019) ·Zbl 07716400号 ·doi:10.1137/18M1202311
[68] 张,X。;Wang博士。;Zhou,Z。;Ma,Y.,通过稳健恢复低阶张量进行同步校正和对准,高级神经信息。过程。系统。,26, 1637-1645 (2013)
[69] 张,X。;Wang博士。;Zhou,Z。;Ma,Y.,带校正和对齐的稳健低阶张量恢复,IEEE Trans。模式分析。机器。智力。,43, 1, 238-255 (2021)
[70] 张,X。;Zhou,Z。;Wang博士。;Ma,Y.,张量补全的混合奇异值阈值,Proc。AAAI Conf.Artif.公司。智力。,28, 1362-1368 (2014)
[71] Zhang,X-D,矩阵分析与应用(2017),剑桥:剑桥大学出版社,剑桥·Zbl 1381.65027号 ·数字标识代码:10.1017/9781108277587
[72] 张,Z。;Aeron,S.,使用t-SVD的精确张量补全,IEEE Trans。信号处理。,65, 6, 1511-1526 (2017) ·Zbl 1414.94741号 ·doi:10.1109/TSP.2016.2639466
[73] Zhang,Z.,Ely,G.,Aeron,S.,Hao,N.,Kilmer,M.:基于张量SVD的多线性数据补全和去噪新方法。摘自:IEEE计算机学会计算机视觉和模式识别会议记录,第3842-3849页(2014年)
[74] 张,Z。;Ganesh,A。;X·梁。;Ma,Y.,TILT:变换不变的低阶纹理,国际期刊计算。视觉。,99, 1, 1-24 (2012) ·Zbl 1254.68290号 ·doi:10.1007/s11263-012-0515-x
[75] 郑琦。;Wang,Y。;Heng,PA,用于鲁棒图像对齐的梯度方向在线子空间学习,IEEE Trans。图像处理。,28, 7, 3383-3394 (2019) ·Zbl 07122911号 ·doi:10.1109/TIP.2019.2896528
[76] Zou,H.,《自适应套索及其预言属性》,美国统计协会,101,476,1418-1429(2006)·Zbl 1171.62326号 ·doi:10.1198/016214500000735
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。