×

一种用于语义图像分割的正则卷积神经网络。 (英语) Zbl 1462.68211号

卷积神经网络(CNN)在一系列图像处理问题中取得了显著的性能。细胞神经网络成为语义分割等密集分类问题的首选。然而,在语义分割任务中,CNN独立预测每个像素的类别,分割对象的空间规则性仍然是这些方法的一个问题。特别是当给定的训练数据较少时,CNN在细节上表现不佳,各种CNN分割结果中往往出现孤立和分散的小区域。在本文中,我们提出了一种将空间正则化添加到分割对象的方法。在我们的方法中,诸如总变差(TV)之类的空间正则化可以很容易地集成到CNN网络中,它可以生成平滑的边缘并消除孤立点。我们将我们提出的方法应用于Unet和Segnet,它们是用于图像分割的成熟CNN,并分别在WBC和CamVid数据集上进行测试。结果表明,正则化网络能够很好地改善预测的细节。

MSC公司:

68平方英寸10 图像处理的计算方法
68T07型 人工神经网络与深度学习
90 C90 数学规划的应用
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Badrinarayanan,V.、Kendall,A.和Cipolla,R.,Segnet:用于图像分割的深度卷积编码器-解码器架构,IEEE Trans。模式分析。机器。Intell.39(12)(2017)2481-2495。
[2] L.Barghout和L.Lee,感知信息处理系统,美国专利申请。10/618543(2004年)。
[3] Brostow,G.J.、Shotton,J.、Fauqueur,J.和Cipolla,R.,使用运动点云的结构进行分割和识别,载于《欧洲计算机视觉会议》(法国马赛斯普林格出版社,2008年),第44-57页。
[4] Chambolle,A.,《总变异最小化算法及其应用》,J.Math。图像。见20(1-2)(2004)89-97·Zbl 1366.94048号
[5] Chambolle,A.和Lions,P.-L.,通过总变化最小化和相关问题进行图像恢复,Numer。数学76(2)(1997)167-188·Zbl 0874.68299号
[6] Chen,L.-C.,Papandreou,G.,Kokkinos,I.,Murphy,K.和Yuille,A.L.,Deeplab:使用深度卷积网络、atrous卷积和完全连接的CRF进行语义图像分割,IEEE Trans。模式分析。机器。Intell.40(4)(2018)834-848。
[7] Erhan,D.,Szegedy,C.,Toshev,A.和Angelov,D.,使用深度神经网络的可缩放对象检测,见Proc。IEEE Conf.计算机视觉和模式识别(美国俄亥俄州哥伦布,2014),第2147-2154页。
[8] Girshick,R.、Donahue,J.、Darrell,T.和Malik,J.,《用于精确对象检测和语义分割的丰富特征层次》,摘自Proc。IEEE Conf.计算机视觉和模式识别(美国俄亥俄州哥伦布,2014),第580-587页。
[9] Hariharan,B.、Arbeláez,P.、Girshick,R.和Malik,J.,《同时检测和分割》,摘自《欧洲计算机视觉会议》(瑞士苏黎世施普林格,2014),第297-312页。
[10] He,K.,Zhang,X.,Ren,S.和Sun,J.,《深入研究整流器:在图像网络分类方面超越人类水平的表现》,收录于Proc。IEEE Int.Conf.Computer Vision(智利圣地亚哥,2015),第1026-1034页。
[11] He,K.,Zhang,X.,Ren,S.和Sun,J.,图像识别的深度剩余学习,收录于Proc。IEEE Conf.计算机视觉和模式识别(美国内华达州拉斯维加斯,2016),第770-778页。
[12] M.Johnson-Roberson、C.Barto、R.Mehta、S.N.Sridhar、K.Rosaen和R.Vasudevan,《矩阵驱动:虚拟世界能否取代现实世界任务中的人工生成注释?arXiv:1610.01983。
[13] Krähenbühl,P.和Koltun,V.,《高斯边势全连通crf中的有效推断》,《神经信息处理系统进展》(西班牙格拉纳达,2011年),第109-117页。
[14] Krizhevsky,A.、Sutskever,I.和Hinton,G.E.,深度卷积神经网络的图像网络分类,《神经信息处理系统进展》(美国内华达州太浩湖,2012年),1097-1105。
[15] 拉迪克ỳ, L.,Sturgess,P.,Alahari,K.,Russell,C.和Torr,P.H.S.,什么,在哪里,有多少?结合目标探测器和CRF,见《欧洲计算机视觉会议》(Springer,2010),第424-437页。
[16] LeCun,Y.、Bottou,L.、Bengio,Y.和Haffner,P.,基于梯度的学习应用于文档识别,Proc。IEEE86(11)(1998)2278-2324。
[17] L.C.Chen,G.Papandreou,I.Kokkinos,K.Murphy和A.L.Yuille,基于深度卷积网络和全连通CRF的语义图像分割,arXiv:1412.7062。
[18] Liu,W.,Anguelov,D.,Erhan,D.,Szegedy,C.,Reed,S.,Fu,C.-Y.和Berg,A.C,SSD:单次多盒探测器,摘自《欧洲计算机视觉》(European Conf.Computer Vision)(荷兰阿姆斯特丹施普林格出版社,2016),第21-37页。
[19] Long,J.、Shelhamer,E.和Darrell,T.,《语义分割的完全卷积网络》,收录于Proc。IEEE Conf.计算机视觉和模式识别(美国马萨诸塞州波士顿,2015),第3431-3440页。
[20] Noh,H.,Hong,S.和Han,B.,《语义分段的学习反卷积网络》。IEEE Int.Conf.Computer Vision(智利圣地亚哥,2015),第1520-1528页。
[21] Ochs,P.,Ranftl,R.,Brox,T.和Pock,T.,基于梯度的双层优化技术与非光滑下层问题,J.Math。图像。见56(2)(2016)175-194·Zbl 1352.65155号
[22] Papandreou,G.、Kokkinos,I.和Savalle,P.-A.,《深度学习中的局部和全局变形建模:表观卷积、多实例学习和滑动窗口检测》,Proc。IEEE Conf.计算机视觉和模式识别(波士顿,马萨诸塞州,美国,2015),第390-399页。
[23] Ronneberger,O.,Fischer,P.和Brox,T.,《U-Net:生物医学图像分割的卷积网络》,载于《国际医学图像计算与计算机辅助干预》(德国慕尼黑施普林格,2015),第234-241页。
[24] Rudin,L.I.,Osher,S.和Fatemi,E.,基于非线性总变差的噪声去除算法,Physica D60(1-4)(1992)259-268·Zbl 0780.49028号
[25] P.Sermanet、D.Eigen、X.Zhang、M.Mathieu、R.Fergus和Y.LeCun,Overfeat:使用卷积网络的集成识别、定位和检测,arXiv:1312.6229。
[26] Shapiro,L.和Stockman,G.C.,《计算机视觉》(Prentice Hall,2001)。
[27] Shotton,J.、Johnson,M.和Cipolla,R.,图像分类和分割的语义文本森林,IEEE Conf.计算机视觉和模式识别(CVPR 2008)。(IEEE,2008),第1-8页。
[28] Sturgess,P.、Alahari,K.、Ladicky,L.和Torr,P.H.S.,《结合运动特征的外观和结构以理解道路场景》,载于BMVC-British Machine Vision Conf.BMVA(英国伦敦,2009),第62.1-62.11页。
[29] Wu,C.和Tai,X.C.,《ROF、矢量TV和高阶模型的增广拉格朗日方法、对偶方法和分裂bregman迭代》,SIAM J.Imag。科学3(3)(2010)300-339·Zbl 1206.90245号
[30] Zeiler,M.D.和Fergus,R.,《可视化和理解卷积网络》,载于《欧洲计算机视觉会议》(瑞士苏黎世施普林格,2014),第818-833页。
[31] Zhao,H.、Shi,J.、Qi,X.、Wang,X.和Jia,J.,金字塔场景解析网络,收录于IEEE Conf.Computer Vision and Pattern Recognition(CVPR)(美国夏威夷檀香山,2017),第2881-2890页。
[32] Zheng,X.,Wang,Y.,Wag,G.和Liu,J.,通过自监督学习快速稳健地分割白细胞图像,Micron107(2018)55-71。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。