×

边缘学习:研究CNN中的边界过滤器。 (英语) Zbl 1477.68373号

摘要:卷积神经网络(CNNs)使用几种启发式方法(如零、重复或均值填充)来处理滤波器扩展到图像边界之外的情况。这些方案是以一种特殊的方式应用的,与图像内容的相关性较弱,并且忽略了目标任务,导致边界处的输出质量较低。在本文中,我们提出了一个简单有效的改进学习边界处理本身。在训练时,网络配备了一组单独的显式边界过滤器。在测试时,我们使用这些滤波器,这些滤波器已经学会了以特定任务的最佳方式外推边界处的特征。我们对广泛的架构更改(层的变化、特征通道或两者)进行了广泛的评估,显示了显式过滤器如何改进边界处理。此外,我们还研究了这种边界滤波器的变化对收敛速度和精度的影响。最后,我们展示了典型CNN应用程序(彩色化、去贝叶斯、光流、视差估计和超分辨率)的5–20%的改进。补充材料和代码可从项目页面下载:http://geometry.cs.ucl.ac.uk/projects/2019/investigatingedge网站/.

MSC公司:

68T45型 机器视觉和场景理解
68T07型 人工神经网络与深度学习
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Cholet,F.等人(2015年)。凯拉斯。2019年7月检索自https://keras.io网址
[2] Ciregan,D.、Meier,U.和Schmidhuber,J.(2012)。用于图像分类的多列深度神经网络。CVPR(第3642-49页)。
[3] Cohen,T.和Welling,M.(2016年)。群等变卷积网络。ICML(第2990-2999页)。
[4] Deng,J.,Dong,W.,Socher,R.,Jia Li,L.,Li,K.,&Fei-Fei,L.(2009)。Imagenet:大规模分层图像数据库。在CVPR中。
[5] Dong,C。;罗伊,CC;He,K。;Tang,X.,使用深度卷积网络的图像超分辨率,IEEE模式分析和机器智能汇刊,38,2,295-307(2016)·doi:10.1109/TPAMI.2015.2439281
[6] Dosovitskiy,A.、Fischer,P.、Ilg,E.、Häusser,P.,Hazírbaš,C.、Golkov,V.、V.d.Smagt,P.和Cremers,d.及Brox,T.(2015)。Flownet:利用卷积网络学习光流。在ICCV中。
[7] Fukushima,K.和Miyake,S.(1982年)。Neocognitron:视觉模式识别机制的自组织神经网络模型。《神经网络的竞争与合作》(第267-85页)。柏林:斯普林格。
[8] 加尔比,M。;乔拉西亚,G。;美国巴黎。;Durand,F.,Deep joint demosaicking and denowing,ACM Transactions on Graphics,35,6,191(2016年)·doi:10.145/2980179.29822399
[9] 古德费罗,I。;本吉奥,Y。;科尔维尔,A。;Bengio,Y.,《深度学习》(2016),剑桥:麻省理工学院出版社,剑桥·Zbl 1373.68009号
[10] Innamorati,C.、Ritschel,T.、Weyrich,T.和Mitra,N.J.(2018年)。边缘学习:CNN中的显式边界处理。英国机器视觉会议(BMVC)论文集。BMVA出版社。被选中进行口头陈述
[11] Krizhevsky,A.、Sutskever,I.和Hinton,G.E.(2012)。基于深度卷积神经网络的Imagenet分类。NIPS(第1097-1105页)。
[12] Ren,J.S.,Xu,L.,Yan,Q.,&Sun,W.(2015)。Shepard卷积神经网络。在NIPS中(第901-09页)。
[13] Ronneberger,O.、Fischer,P.和Brox,T.(2015)。U-net:生物医学图像分割的卷积网络。在医学图像计算和计算机辅助干预国际会议上(第234-41页)。
[14] 俄勒冈州Russakovsky。;邓,J。;苏,H。;克劳斯,J。;Satheesh,S。;马,S。;黄,Z。;Karpathy,A。;科斯拉,A。;伯恩斯坦,M。;Berg,AC;Fei-Fei,L.,ImageNet大规模视觉识别挑战,国际计算机视觉杂志(IJCV),115,3,211-252(2015)·doi:10.1007/s11263-015-0816-y
[15] Uhrig,J.、Schneider,N.、Schneider,L.、Franke,U.、Brox,T.和Geiger,A.(2017)。稀疏不变CNN。arXiv:1708.06500。
[16] Worrall,D.E.、Garbin,S.J.、Turmukhambetov,D.和Brostow,G.J.(2017年)。谐波网络:深度平移和旋转等方差。在CVPR中。
[17] Zhang,R.,Isola,P.,&Efros,A.A.(2016)。彩色图像着色。在ECCV中。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。