×

用于基于深度学习的语义图像分割的相关图像分数可视化的子集选择。 (英语) Zbl 1395.94053号

摘要:语义图像分割是图像处理中的一个挑战性问题,近年来,深度卷积神经网络(CNN)在图像处理中得到了成功应用。它处理输入图像的像素分类,将其划分为多个对象类的区域。然而,CNN是不透明的模型。给定一个经过训练的CNN,很难判断输入图像中编码的哪些信息对网络执行分割很重要。这些信息可能有助于判断一个经过训练的网络是否学会了以合理的方式进行分段,或者如何改进其性能。
对于一个训练好的CNN,我们提出了一个优化问题来提取相关的图像分数进行语义分割。我们尝试识别包含用于分割一个选定对象类的相关信息的像素子集。在Cityscapes数据集上的实验中,我们表明,这是一种简单的方法,可以帮助我们深入了解经过语义分割训练的CNN。通过查看相关的图像分数,我们可以确定经过训练的网络的可能极限,并得出可能改进的结论。

MSC公司:

94A08型 信息与通信理论中的图像处理(压缩、重建等)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Pham,D.L。;徐,C。;Prince,J.L.,医学图像分割的当前方法,年。生物识别版本。工程师,2,1,315-337,(2000)
[2] 张,T。;刘,S。;徐,C。;Lu,H.,为交通场景的智能视频监控挖掘语义上下文信息,IEEE Trans。印第安纳州通知。,149-160年9月1日(2013年)
[3] 古尔德,S。;他,X,通过标记像素来理解场景,Commun。ACM,57,11,68-77,(2014)
[4] Badrinarayan,V。;肯德尔,A。;Cipolla,R.,Segnet:{A}用于图像分割的深度卷积编码器-解码器架构,CoRR,(2015)
[5] Long,J。;谢尔哈默,E。;Darrell,T.,语义分割的完全卷积网络,IEEE计算机视觉和模式识别会议论文集,3431-3440,(2015)
[6] Farabet,C。;库普利,C。;纳杰曼,L。;LeCun,Y.,学习场景标记的层次特征,IEEE Trans。模式分析。马赫。智力。,35, 8, 1915-1929, (2013)
[7] Yosinski,J。;克伦,J。;Nguyen,A。;Fuchs,T。;Lipson,H.,《通过深度可视化理解神经网络》,《深度学习研讨会论文集:机器学习国际会议》(2015)
[8] 科茨,M。;奥姆兰,M。;拉莫斯,S。;Rehfeld,T。;恩兹韦勒,M。;Benenson,R。;Franke,美国。;罗斯,S。;Schiele,B.,语义城市场景理解的城市景观数据集,IEEE计算机视觉和模式识别会议论文集,(2016),IEEE
[9] 王,C。;Mauch,L。;郭,Z。;Yang,B.,《利用具有快捷方式和易于类扩展的深度卷积神经网络进行语义图像分割》,《图像处理理论、工具和应用国际会议论文集》(2016),IEEE
[10] Parikh,北。;Boyd,S.,《近似算法》,Found。最佳趋势。,1, 3, 127-239, (2014)
[11] Deng,L.,用于机器学习研究的手写数字图像MNIST数据库,IEEE信号处理。Mag.,29,141-142,(2012)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。