×

一种基于归一化割的具有自适应相似性和空间正则化的变分图像分割模型。 (英语) Zbl 1457.94029号

摘要:图像分割是图像处理和计算机视觉中的一个基础研究课题。近几十年来,研究人员为各种应用开发了大量的分割算法。在这些算法中,归一化切割(Ncut)分割方法由于其良好的性能而被广泛应用。Ncut分割模型是一个优化问题,其能量定义在专门设计的图上。因此,现有Ncut方法的分割结果在很大程度上取决于图上预先构造的相似性度量,因为该度量通常由用户凭经验给出。此缺陷将导致一些不希望出现的分割结果。本文将自适应相似性度量与空间正则化相结合,提出了一种基于Ncut的分割算法。该模型将Parzen-Rosenblatt窗口方法、非局部权重熵、Ncut能量和相场正则化子结合在一个变分框架中。这种自适应过程使所提出的算法能够找到比Ncut方法更好的相似性度量来进行分类。我们从统计和凸优化等多个角度对提出的自适应相似性进行了数学解释。此外,相位场正则化器可以保证该算法在噪声存在下具有鲁棒性,并且可以通过空间先验修正相似性度量。文中给出了该模型的适定性理论,如极小值的存在性。与传统的基于Ncut的模型和经典的Chan-Vese模型等现有分割方法相比,数值实验表明,我们的方法可以提供很好的分割结果。

MSC公司:

94A08型 信息与通信理论中的图像处理(压缩、重建等)
68单位10 图像处理的计算方法
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] P.Arbelaez、M.Maire、C.C.Fowlkes和J.Malik(2011),轮廓检测和分层图像分割,IEEE Trans。模式分析。机器。智力。,33,第898-916页。
[2] P.Arias、G.Facciolo、V.Caselles和G.Sapiro(2011),基于样本的图像修复的变化框架,国际计算机杂志。视觉。,93,第319-347页·Zbl 1235.94015号
[3] T.Brox和D.Cremers(2008),关于局部区域模型和分段光滑Mumford-Shah泛函的统计解释,国际计算杂志。视觉。,84,第184-193页·兹比尔1477.68335
[4] H.Bauschke和J.Borwein(1996),关于解决凸可行性问题的投影算法,SIAM Rev.,38,pp.367-426·Zbl 0865.47039号
[5] H.Bauschke和J.Borwein(1993),关于von Neumann的两组交替投影算法的收敛性,集值分析。,第1页,第185-212页·Zbl 0801.47042号
[6] M.Belkin和P.Niyogi(2003),用于降维和数据表示的拉普拉斯特征映射,神经计算。,第15页,第1373-1396页·Zbl 1085.68119号
[7] J.A.Bilmes(2000),《EM算法及其在高斯混合和隐马尔可夫模型参数估计中的应用的温和教程》,技术报告,国际计算机科学研究所,加利福尼亚州伯克利,第2-7页。
[8] M.Belkin、P.Niyogi和V.Sindhwani(2006),流形正则化:从标记和未标记的例子中学习的几何框架,J.Mach。学习。第7号决议,第2399-2434页·Zbl 1222.68144号
[9] T.Buhler和M.Hein(2009),基于图p-laplacian的谱聚类,《机器学习国际会议论文集》,第81-88页。
[10] D.Cai、X.He、J.Han和T.S.Huang(2011),数据表示的图形正则化非负矩阵分解,IEEE Trans。模式分析。机器。智力。,33,第1548-1560页。
[11] V.Caselles、F.Catte、T.Coll和F.Dibos(1993),图像处理中活动轮廓的几何模型,数字。数学。,66,第1-31页·兹伯利0804.68159
[12] L.-C.Chen、G.Papandreou、I.Kokkinos、K.Murphy和A.L.Yuille(2018),Deeplab:使用深度卷积网络、atrous卷积和全连接CRFS的语义图像分割,IEEE Trans。模式分析。机器。智力。,40,第834-848页。
[13] T.F.Chan和L.A.Vese(2001),《无边活动轮廓》,IEEE Trans。图像处理。,10,第266-277页·Zbl 1039.68779号
[14] T.F.Chan和J.Shen(2005),《图像处理与分析:变分、PDE、小波和随机方法》,SIAM,费城·Zbl 1095.68127号
[15] T.F.Chan、S.Esedoglu和M.Nikolova(2006),图像分割和去噪模型的全局极小值发现算法,SIAM J.Appl。数学。,66,第1632-1648页·Zbl 1117.94002号
[16] A.Chambolle(2004),总变异最小化算法及其应用,J.Math。《成像视觉》,20,第89-97页·Zbl 1366.94048号
[17] F.R.K.Chung(1997),谱图理论,Betascript出版社·Zbl 0867.05046号
[18] T.F.Chan、G.H.Golub和P.Mulet(1999),基于全变量图像恢复的非线性原对偶方法,SIAM J.Sci。计算。,20,第1964-1977页·Zbl 0929.68118号
[19] L.Cheng和S.V.N.Vishwanathan(2007),《学习压缩图像和视频》,《机器学习国际会议论文集》,第161-168页。
[20] P.L.Combettes和J.C.Pesquet(2011),《信号处理中的近似分裂方法》,载于《科学与工程中反问题的定点算法》,纽约斯普林格,第185-212页·Zbl 1242.90160号
[21] A.P.Eriksson、C.Olsson和F.Kahl(2007年),《重新审视归一化切割:用线性分组约束重新制定分割规则》,《计算机视觉国际会议论文集》,第1-8页·Zbl 1255.68171号
[22] S.Esedoglu和Y.H.R.Tsai(2006),分段常数Mumford-Shah泛函的阈值动力学,J.Compute。物理。,211,第367-384页·Zbl 1086.65522号
[23] W.H.Fleming和R.Rishel(1960),总梯度变化的积分公式,Arch。数学。,11,第218-222页·Zbl 0094.26301号
[24] L.Grady(2006),图像分割的随机行走,IEEE Trans。模式分析。机器。智力。,28,第1768-1783页。
[25] B.Ghanem和N.Ahuja(2010),Dinkelbach NCUT:解决具有先验和凸约束的标准化切割问题的有效框架,国际计算杂志。视觉。,89,第40-55页。
[26] G.Gilboa和S.Osher(2008),图像处理应用的非局部算子,SIAM J.多尺度模型。模拟。,第7(3)页,第1005-1028页·Zbl 1181.35006号
[27] T.Goldstein和S.Osher(2009),《L1正则化问题的分裂Bregman方法》,SIAM J.成像科学。,2,第323-343页·Zbl 1177.65088号
[28] L.W.Hagen和A.B.Kahng(1991),比率分割和聚类的快速谱方法,IEEE Trans。计算机辅助设计,11,第1074-1085页。
[29] L.W.Hagen和A.B.Kahng(1992),比率分割和聚类的新谱方法,IEEE Trans。计算机辅助设计集成电路系统,11,第1074-1085页。
[30] A.K.Jain(2010),《数据聚类:K-means之后的50年》,模式识别快报。,31,第651-666页。
[31] M.Kass、A.Witkin和D.Terzopoulos(1988),《蛇:主动轮廓模型》,国际计算机杂志。视觉。,第1页,第321-331页·Zbl 0646.68105号
[32] J.Long、E.Shelhamer和T.Darrell(2015),语义分割的完全卷积网络,《IEEE计算机视觉和模式识别会议论文集》,第3431-3440页。
[33] J.Liu和H.Zhang(2013),在变分框架中使用局部GMM进行图像分割,J.Math。成像视觉。,46,第161-176页·Zbl 1310.94018号
[34] J.Liu和X.Zheng(2017),用于图像恢复的块非局部电视方法,SIAM J.Imaging Sci。,10,第920-941页·Zbl 1437.94021号
[35] C.Li、C.Kao、J.C.Gore和Z.Ding(2008),图像分割的区域可缩放拟合能量最小化,IEEE Trans。图像处理。,17,第1940-1949页·Zbl 1371.94225号
[36] J.M.Morel和S.Solimini(1995),《图像分割中的变分方法,非线性微分方程及其应用进展》,Birkhauser,巴塞尔·Zbl 0827.68111号
[37] D.Mumford和J.Shah(1989),分段光滑函数的最佳逼近和相关变分问题,Comm.Pure Appl。数学。,42,第577-685页·Zbl 0691.49036号
[38] B.Mohar、Y.Alavi、G.Chartrand、O.R.Oellermann和A.J.Schwenk(1991),图的拉普拉斯谱,图论组合应用。,第2页,第871-898页·Zbl 0840.05059号
[39] M.Meila(2005),《比较聚类:公理观点》,《机器学习国际会议论文集》,第577-584页。
[40] E.Parzen(1962),《关于概率密度函数和模式的估计》,《数学年鉴》。统计学。,33,第1065-1076页·Zbl 0116.11302号
[41] W.M.Rand(1971),聚类方法评估的客观标准,J.Amer。统计师。协会,66,第846-850页。
[42] L.I.Rudin、S.Osher和E.Fatemi(1992),基于非线性全变分的噪声去除算法,Phys。D、 60,第259-268页·Zbl 0780.49028号
[43] M.Rosenblatt(1956),关于密度函数的一些非参数估计的评论,《数学年鉴》。统计学。,27,第832-837页·Zbl 0073.14602号
[44] D.Reynolds(2015),高斯混合模型,摘自《生物统计学百科全书》,纽约斯普林格,第827-832页。
[45] R.G.Rodenas、M.Lopez和D.Verastegui(1999),Dinkelbach算法在求解非线性分式规划问题中的扩展,Top,7,pp.33-70·Zbl 0932.90043号
[46] A.Sarkar、M.K.Biswas、B.Kartikeyan、V.Kumar、K.Majumder和D.K.Paul,(2002),基于MRF模型的多光谱图像分类分割方法,IEEE Trans。地质科学。遥感,40,第1102-1113页。
[47] J.Shi和J.Malik(2000),标准化切割和图像分割,IEEE Trans。模式分析。机器。智力。,22,第888-905页。
[48] A.Szlam和X.Bresson(2009),切格比率削减的基于总变分的图形聚类算法,加州大学洛杉矶分校Cam报告。
[49] M.Tang、D.Marin、I.B.Ayed和Y.Boykov(2016),《归一化切割符合MRF》,《欧洲计算机视觉会议记录》,第748-765页。
[50] R.Unnikrishnan、C.Pantofaru和M.Hebert(2007),图像分割算法的客观评估,IEEE Trans。模式分析。机器。智力。,29,第929-944页。
[51] L.A.Vese和T.F.Chan(2002),使用Mumford和Shah模型进行图像分割的多阶段水平集框架,国际计算机杂志。视觉。,50,第271-293页·Zbl 1012.68782号
[52] U.Von Luxburg(2007),《光谱聚类教程》,统计。计算。,17,第395-416页。
[53] Y.Weiss(1999),《使用特征向量的分割:统一观点》,载于《计算机视觉国际会议论文集》,第975-982页。
[54] Z.Wu和R.Leahy(1993),数据聚类的最优图论方法:理论及其在图像分割中的应用,IEEE Trans。模式分析。机器。智力。,第15页,第1101-1113页。
[55] C.Wu和X.Tai(2010),ROF、矢量电视和高阶模型的增广拉格朗日方法、对偶方法和分裂Bregman迭代,SIAM J.Imaging Sci。,第3页,第300-339页·Zbl 1206.90245号
[56] A.Y.Yang、J.Wright、Y.Ma和S.Sastry(2008),通过有损数据压缩对自然图像进行无监督分割,计算。视觉图像理解,110,第212-225页。
[57] S.X.Yu和J.Shi(2004),给定部分分组约束的分段,IEEE Trans。模式分析。机器。智力。,26,第173-183页。
[58] Y.Yu、C.Fang和Z.Liao(2015),用于图像分割的分段平面嵌入,《IEEE计算机视觉国际会议论文集》,第1368-1376页。
[59] M.Zheng、J.Bu、C.Chen、C.Wang、L.Zhang、G.Qiu和D.Cai(2011),图像表示的图形正则化稀疏编码,IEEE Trans。图像处理。,20,第1327-1336页·Zbl 1372.94314号
[60] H.Zhuang、K.S.Low和W.Yau(2012),基于多通道脉冲耦合神经网络的目标检测彩色图像分割,IEEE Trans。工业电子,59,第3299-3308页。
[61] S.Zhu、T.S.Lee和A.L.Yuille(1995),《区域竞争:统一蛇,区域增长,多波段图像分割的能量/贝叶斯/MDL》,《计算机视觉国际会议论文集》,第416-423页。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。