×

图像标记的马尔可夫模型。 (英语) Zbl 1264.68189号

摘要:马尔可夫随机场(MRF)是一种广泛使用的概率模型,用于表示不同事件之间的相互作用。最成功的应用之一是解决计算机视觉中的图像标记问题。本文综述了这一领域的最新进展。我们给出了MRF的背景、基本概念和基本公式。讨论了两种不同的离散优化方法,即置信传播和图割。我们进一步关注两个经典视觉问题的解决方案,即使用MRF模型的立体和二值图像分割。

MSC公司:

68T45型 机器视觉和场景理解
62M40型 随机字段;图像分析

软件:

抓斗切割
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] S.Geman和D.Geman,“随机松弛、吉布斯分布和图像的贝叶斯恢复”,IEEE模式分析和机器智能学报,第6卷,第6期,第721-741页,1984年·Zbl 0573.62030号 ·doi:10.1109/TPAMI.1984.4767596
[2] S.Z.Li,图像分析中的马尔可夫随机场建模,施普林格,德国柏林,2009年·Zbl 1183.68691号
[3] R.Szeliski,《计算机视觉:算法和应用》,施普林格出版社,德国柏林,第1版,2011年·Zbl 1219.68009号
[4] Y.Boykov、O.Veksler和R.Zabih,“通过图形切割实现快速近似能量最小化”,IEEE模式分析和机器智能汇刊,第23卷,第11期,第1222-12392001页·数字对象标识代码:10.1109/34.969114
[5] P.F.Felzenszwalb和D.P.Huttenlocher,“早期视觉的有效信念传播”,《国际计算机视觉杂志》,第70卷,第1期,第41-54页,2006年·Zbl 05062736号 ·doi:10.1007/s11263-006-7899-4
[6] V.Kolmogorov,“能量最小化的聚合树重加权消息传递”,IEEE模式分析和机器智能汇刊,第28卷,第10期,第1568-1583页,2006年·Zbl 05340984号 ·doi:10.1109/TPAMI.2006.200
[7] N.Komodakis、N.Paragios和G.Tziritas,“通过双重分解实现MRF能量最小化和超越”,IEEE模式分析和机器智能学报,第33卷,第3期,第531-552页,2011年·doi:10.1109/TPAMI.2010.108
[8] V.Lempitsky、C.Rother、S.Roth和A.Blake,“马尔可夫随机场优化的融合运动”,IEEE模式分析和机器智能学报,第32卷,第8期,第1392-14052010页·doi:10.1109/TPAMI.2009.143
[9] R.Szeliski,R.Zabih,D.Scharstein等人,“马尔可夫随机场能量最小化方法与平滑先验的比较研究”,IEEE模式分析与机器智能学报,第30卷,第6期,第1068-1080页,2008年·Zbl 05340877号 ·doi:10.1109/TPAMI.2007.70844
[10] P.F.Felzenszwalb和R.Zabih,“计算机视觉中的动态编程和图形算法”,IEEE模式分析和机器智能学报,第33卷,第4期,第721-740页,2011年·doi:10.1109/TPAMI.2010.135
[11] T.Werner,“最大和问题的线性规划方法:综述”,IEEE模式分析和机器智能汇刊,第29卷,第7期,第1165-1179页,2007年·Zbl 05340888号 ·doi:10.1109/TPAMI.2007.1036
[12] S.Roth和M.J.Black,“专家领域:学习图像先验的框架”,摘自《IEEE计算机学会计算机视觉和模式识别会议论文集》(CVPR’05),第2卷,第860-867页,美国加利福尼亚州圣地亚哥,2005年6月。
[13] U.Schmidt,Q.Gao和S.Roth,“低层视觉中MRF的生成性观点”,摘自IEEE计算机学会计算机视觉和模式识别会议(CVPR’10),第1751-1758页,美国加利福尼亚州旧金山,2010年6月·doi:10.1109/CVPR.2010.5539844
[14] O.Woodford、C.Rother和V.Kolmogorov,“低水平视觉MAP推断的全球视角”,载于《第十二届计算机视觉国际会议论文集》(ICCV’09),第2319-2326页,2009年10月·doi:10.1109/ICCV.2009.5459434
[15] S.Y.Lin和J.Y.Shi,“基于马尔可夫随机场模型的自然图像铺垫方法”,《计算机科学与技术杂志》,第22卷,第1期,第161-167页,2007年·Zbl 05147659号 ·doi:10.1007/s11390-007-9022-x
[16] T.Kasetkasem、M.K.Arora和P.K.Varshney,“使用基于马尔可夫随机场的方法进行超分辨率土地覆盖制图”,《环境遥感》,第96卷,第3-4期,第302-314页,2005年·doi:10.1016/j.rse.2005.02.006
[17] H.Heng-Feng,L.Jin-Jang,L.Cheng-Shian,C.Hsun-Ying,“使用结构引导的优先信念传播和标签转换进行图像修复”,《第20届模式识别国际会议论文集》(ICPR’10),第4492-4495页,2010年8月·doi:10.1109/ICPR.2010.1091
[18] D.Zikic,B.Glocker,O.Kutter等人,“用于基于强度的2D-3D配准的马尔可夫随机场优化”,《医学成像2010:图像处理》,SPIE期刊第7623卷,2010年·doi:10.117/12.837232
[19] J.Verbeek和B.Triggs,“马尔可夫场方面模型的区域分类”,载于《IEEE计算机学会计算机视觉和模式识别会议论文集》(CVPR'07),第1059-10662007年6月·doi:10.1109/CVPR.2007.383098
[20] D.Larlus和F.Jurie,“将外观模型和马尔可夫随机场结合用于类别级对象分割”,载于《第26届IEEE计算机视觉和模式识别会议论文集》(CVPR’08),第1-20卷,第864-870页,2008年6月·doi:10.1109/CVPR.2008.4587453
[21] M.Lievin和F.Luthon,“视频中人脸特征分层分割的非线性颜色空间和时空MRF”,IEEE图像处理汇刊,第13卷,第1期,第63-71页,2004年·Zbl 05453112号 ·doi:10.1109/TIP.2003.818013
[22] X.G.Wang和X.O.Tang,“人脸照片合成和识别”,IEEE模式分析和机器智能汇刊,第31卷,第11期,第1955-1967页,2009年·doi:10.1109/TPAMI.2008.222
[23] S.Espana-Boquera、M.J.Castro-Bleda、J.Gorbe-Moya和F.Zamora-Martinez,“使用混合HMM/ANN模型改进脱机手写文本识别”,IEEE模式分析和机器智能学报,第33卷,第4期,第767-7792011页·doi:10.1109/TPAMI.2010.141
[24] M.L.Song、D.C.Tao、C.Chen、X.L.Li和C.W.Chen,“颜色到灰色:视觉线索保存”,IEEE模式分析和机器智能汇刊,第32卷,第9期,第1537-1552页,2010年·doi:10.1109/TPAMI.2009.74
[25] H.Mirzaalian和G.Hamarneh,“使用MRF优化进行血管尺度选择”,摘自IEEE计算机学会计算机视觉和模式识别会议论文集(CVPR’10),第3273-32792010年6月·doi:10.1109/CVPR.2010.5540051
[26] Y.Boykov和G.Funka-Lea,“图形切割和高效的N-D图像分割”,《国际计算机视觉杂志》,第70卷,第2期,第109-131页,2006年·Zbl 05062740号 ·doi:10.1007/s11263-006-7934-5
[27] J.Sun、N.N.Zheng和H.Y.Shum,“使用信念传播的立体匹配”,IEEE模式分析和机器智能汇刊,第25卷,第7期,第787-800页,2003年·Zbl 1039.68730号 ·doi:10.1109/TPAMI.2003.1206509
[28] R.Detry、N.Pugeault和J.H.Piater,“3D视觉对象表示的概率框架”,IEEE模式分析和机器智能学报,第31卷,第10期,第1790-1803页,2009年·doi:10.1109/TPAMI.2009.64
[29] A.S.Willsky,“信号和图像处理的多分辨率马尔可夫模型”,《IEEE学报》,第90卷,第8期,第1396-1458页,2002年·doi:10.1109/JPROC.2002.800717
[30] Z.Kato、M.Berthod和J.Zerubia,“并行图像分类的多尺度马尔可夫随机场模型”,《IEEE第四届计算机视觉国际会议论文集》,第253-257页,1993年5月·Zbl 0825.62706号
[31] M.Mignotte、C.Collet、P.Perez和P.Bouthemy,“使用无监督分层MRF模型的声纳图像分割”,IEEE图像处理学报,第9卷,第7期,第1216-12312000页·doi:10.1109/83.847834
[32] C.L.Zitnick和S.B.Kang,“使用图像过分割进行基于图像的立体渲染”,《国际计算机视觉杂志》,第75卷,第1期,第49-65页,2007年·Zbl 05186875号 ·doi:10.1007/s11263-006-0018-8
[33] P.Kohli、L.Ladicky和P.H.S.Torr,“增强标签一致性的鲁棒高阶势”,《国际计算机视觉杂志》,第82卷,第3期,第302-324页,2009年·Zbl 05671877号 ·doi:10.1007/s11263-008-0202-0
[34] C.Rother、P.Kohli、W.Feng和J.Y.Jia,“最小化离散变量的稀疏高阶能量函数”,《IEEE计算机学会计算机视觉和模式识别研讨会会议记录》(CVPR Workshops'09),第1-4卷,第1382-1389页,2009年6月·doi:10.10109/CVPRW.2009.5206739
[35] B.Potetz和T.S.Lee,“使用线性约束节点的高阶集团的有效信念传播”,《计算机视觉和图像理解》,第112卷,第1期,第39-54页,2008年·兹伯利05363059 ·doi:10.1016/j.cviu.2008.05.007
[36] D.Kwon、K.J.Lee、I.D.Yun和S.U.Lee,“使用层次梯度节点求解具有高阶平滑先验的MRF”,《第十届亚洲计算机视觉会议论文集》,第121-134页,2010年11月。
[37] D.Tarlow、I.Givoni和R.S.Zemel,“HOP-MAP:高效信息传递与高阶势”,《机器学习研究杂志》,第9卷,第812-819页,2010年。
[38] D.Kwon、K.J.Lee、I.D.Yun和S.U.Lee,“使用动态高阶MRF模型进行非刚性图像配准”,载于《第十届欧洲计算机视觉会议论文集》(ECCV'08),第5302卷,《计算机科学讲义》第1部分,第373-386页,法国马赛,2008年10月·doi:10.1007/978-3-540-88682-2-29
[39] X.Y.Lan、S.Roth、D.Huttenlocher和M.J.Black,“学习高阶马尔可夫随机场的有效信念传播”,《第九届欧洲计算机视觉会议论文集》(ECCV'06),第3952卷,第2部分,第269-282页,奥地利格拉茨,2006年5月·doi:10.1007/11744047_21
[40] D.M.Greig、B.T.Porteous和A.H.Seheult,“二值图像的精确最大后验估计”,《皇家统计学会期刊B系列方法学》,第51卷,第2期,第271-279页,1989年。
[41] V.Kolmogorov和C.Rother,“用图割最小化非亚模块函数——综述”,IEEE模式分析和机器智能学报,第29卷,第7期,第1274-12792007页·Zbl 05340897号 ·doi:10.1109/TPAMI.2007.1031
[42] X.Liu、O.Veksler和J.Samarabandu,“基于图形的优化的顺序-保留动作”,IEEE模式分析和机器智能汇刊,第32卷,第7期,第1182-1196页,2010年·doi:10.1109/TPAMI.2009.120
[43] N.Komodakis和G.Tziritas,“基于线性规划的图切割近似标记”,IEEE模式分析和机器智能学报,第29卷,第8期,第1436-1453页,2007年·Zbl 05340927号 ·doi:10.1109/TPAMI.2007.1061
[44] D.Scharstein和R.Szeliski,“Middlebury立体视觉研究页”,2011年,http://vision.middlebury.edu/stereo/eval。
[45] J.Pearl,“推理机上的Reverend bayes:分布式层次方法”,《全国人工智能会议论文集》,第133-136页,美国宾夕法尼亚州匹兹堡,1982年。
[46] J.S.Yedidia、W.T.Freeman和Y.Weiss,“构建自由能量近似和广义信念传播算法”,《IEEE信息理论汇刊》,第51卷,第7期,第2282-2312页,2005年·Zbl 1283.94023号 ·doi:10.1109/TIT.2005.850085
[47] T.L.Yu、R.S.Lin、B.Super和B.Tang,“信念传播的有效消息表示”,载《第11届IEEE计算机视觉国际会议论文集》(ICCV’07),第1-6卷,第604-611页,2007年10月·doi:10.1109/ICCV.2007.4408905
[48] J.S.Yedidia、W.T.Freeman和Y.Weiss,“广义信念传播”,《神经信息处理系统进展》,第13卷,第689-6952001页。
[49] M.F.Tappen和W.T.Freeman,“使用相同的MRF参数比较立体图像的图形切割和信念传播”,载于第九届IEEE计算机视觉国际会议论文集,第2卷,第900-907页,2003年10月。
[50] K.Alahari、P.Kohli和P.H.S.Torr,“离散MRF中MAP推理的动态混合算法”,IEEE模式分析和机器智能学报,第32卷,第10期,第1846-1857页,2010年·doi:10.1109/TPAMI.2009.194
[51] M.P.Kumar、V.Kolmogorov和P.H.S.Torr,“离散MRF MAP估计的凸松弛分析”,《机器学习研究杂志》,第10卷,第71-106页,2009年·Zbl 1235.90092号
[52] N.Komodakis和G.Tziritas,“通过优先级调度和动态剪枝使用有效信念传播完成图像”,IEEE图像处理汇刊,第16卷,第11期,第2649-2661页,2007年·Zbl 05453779号 ·doi:10.1109/TIP.2007.906269
[53] H.Ishikawa,“凸先验马尔可夫随机场的精确优化”,IEEE模式分析和机器智能汇刊,第25卷,第10期,第1333-1336页,2003年·Zbl 05112455号 ·doi:10.10109/TPAMI.2003.1233908
[54] T.S.Cho、S.Avidan和W.T.Freeman,“补丁变换”,IEEE模式分析和机器智能汇刊,第32卷,第8期,第1489-15012010页·doi:10.10109/TPAMI.2009.133
[55] Q.X.Yang、L.Wang、R.G.Yang、H.Stewenius和D.Nister,“立体匹配与颜色加权相关性、层次信念传播和遮挡处理”,IEEE模式分析和机器智能学报,第31卷,第3期,第492-504页,2009年·doi:10.1109/TPAMI.2008.99
[56] A.Barbu和S.C.Zhu,“将视觉知识表示纳入立体重建”,载于第十届IEEE国际计算机视觉会议论文集(ICCV’05),第1-2卷,第572-579页,中国北京,2005年10月·doi:10.1109/ICCV.2005.120
[57] N.D.F.Campbell、G.Vogiatzis、C.Hernandez和R.Cipolla,“使用多种假设改善多视点立体声的深度映射”,载于《第十届欧洲计算机视觉会议论文集》(ECCV’08),第5302卷,第1部分,第766-779页,2008年·doi:10.1007/978-3-540-88682-2-58
[58] J.Starck和A.Hilton,“宽时间范围自由曲面匹配的对应标签”,载于2007年10月第11届IEEE国际计算机视觉会议论文集(ICCV’07),第1-6卷,第2189-2196页·doi:10.1109/ICCV.2007.4409108
[59] D.Scharstein和R.Szeliski,“密集双帧立体对应算法的分类和评估”,《国际计算机视觉杂志》,第47卷,第1-3期,第7-42页,2002年·Zbl 1012.68731号 ·doi:10.1023/A:1014573219977
[60] C.Rother、V.Kolmogorov和A.Blake,“GrabCut”-使用迭代图切割的交互式前景提取,“Acm Transactions on Graphics,第23卷,第3期,第309-3142004页。
[61] Y.Y.Boykov和M.P.Jolly,“交互式图形切割用于N-D图像中对象的最佳边界和区域分割”,《第八届计算机视觉国际会议论文集》,第1卷,第105-112页,2001年7月。
[62] I.Grinias、N.Komodakis和G.Tziritas,“交互式分割的洪水和基于MRF的算法”,《第20届模式识别国际会议论文集》(ICPR’10),第3943-3946页,2010年8月·doi:10.1109/ICPR.2010.959
[63] B.Micusik和T.Pajdla,“通过max-sum解算器进行多标签图像分割”,《IEEE计算机视觉和模式识别会议论文集》,第1-8卷,第1994-1999页,2007年·doi:10.1109/CVPR.2007.383230
[64] M.Mignotte,“图像分割的标签场融合贝叶斯模型及其惩罚最大随机估计”,IEEE图像处理汇刊,第19卷,第6期,第1610-1624页,2010年·Zbl 1371.94264号 ·doi:10.1109/TIP.2010.2044965
[65] S.Panda和P.K.Nanda,“使用复合马尔可夫随机场模型的无监督彩色图像分割”,《第三届模式识别和机器智能国际会议论文集》,第5909卷,第291-296页,2009年12月·Zbl 05647214号 ·doi:10.1007/978-3-642-11164-847
[66] S.F.Chen、L.L.Cao、J.Z.Liu和X.O.Tang,“图像分割的迭代MAP和ML估计”,《IEEE计算机视觉和模式识别会议论文集》(CVPR’07),第1-8卷,第289-294页,2007年6月·doi:10.1109/CVPR.2007.383007
[67] C.T.Li,“无监督纹理图像分割的条件随机场方法”,《Eurasip信号处理进展杂志》,2010年第1卷·Zbl 1204.94019号 ·doi:10.1155/2010/167942
[68] M.Rivera、O.Ocegueda和J.L.Marroquin,“有效图像分割的熵控制二次马尔可夫测量场模型”,IEEE图像处理学报,第16卷,第12期,第3047-3057页,2007年·Zbl 05516517号 ·doi:10.1109/TIP.2007.909384
[69] J.Li、J.M.Bioucas-Dias和A.Plaza,“使用带主动学习的多项式logistic回归进行半监督高光谱图像分割”,IEEE地球科学与遥感汇刊,第48卷,第11期,第4085-4098页,2010年·doi:10.1109/TGRS.2010.2060550
[70] X.Feng、C.K.I.Williams和S.N.Felderhof,“将信念网络和神经网络相结合用于场景分割”,IEEE模式分析和机器智能汇刊,第24卷,第4期,第467-483页,2002年·doi:10.1109/34.993555
[71] X.Jiangqing和Q.Long,“街景图像的多视图语义分割”,载于《第12届国际计算机视觉大会论文集》(ICCV'09),第686-693页,2009年10月·doi:10.1010/ICCV.2009.5459249
[72] Y.Y.Zhang、M.Brady和S.Smith,“通过隐马尔可夫随机场模型和期望最大化算法对脑MR图像进行分割”,IEEE医学成像汇刊,第20卷,第1期,第45-57页,2001年·doi:10.1109/42.906424
[73] B.Scherrer、M.Dojat、F.Forbes和C.Garbay,“基于马尔可夫模型的分割的代理:磁共振脑扫描的应用”,《医学人工智能》,第46卷,第1期,第81-95页,2009年·Zbl 05747281号 ·doi:10.1016/j.artmed.2008.08.012
[74] D.Angelov,B.Taskar,V.Chatalbashev等人,“马尔可夫随机场的判别学习用于3D扫描数据的分割”,摘自《IEEE计算机视觉和模式识别会议论文集》(CVPR’05),第2卷,第169-176页,2005年6月。
[75] D.Hower、V.Singh和S.Johnson,“基于MRF的神经成像分割的标签集扰动”,载于《第十二届计算机视觉国际会议论文集》(ICCV’09),第849-856页,2009年10月·doi:10.1109/ICCV.2009.5459305
[76] Z.Honghui、X.Jianxing和Q.Long,“街道场景语义分割的监督标签转移”,载《第十一届欧洲计算机视觉会议论文集》(ECCV’10),第6315卷,第561-574页,2010年9月·Zbl 05821243号 ·doi:10.1007/978-3642-15555-0_41
[77] W.Feng、J.Y.Jia和Z.Q.Liu,“用于图像分割的马尔可夫随机场的自我验证标记”,IEEE模式分析和机器智能汇刊,第32卷,第10期,第1871-1887页,2010年·doi:10.1109/TPAMI.2010.24
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。