×

利用多尺度深度神经网络将简单素描转换为中国画。 (英语) Zbl 1461.94016号

摘要:最近,受深度学习能力的启发,卷积神经网络可以在像素级生成奇妙的图像。然而,先前方法的一个重要限制因素是,它们侧重于一些简单的数据集,如人脸和卧室。本文提出了一种多尺度深度神经网络,用于将草图转换为中国画。为了合成更逼真的图像,我们使用L1损失和对抗损失训练生成网络。此外,由于生成网络是前馈的,用户可以控制合成过程。通过添加边缘检测器,该网络也可以被视为神经型传输。此外,在图像彩色化和图像超分辨率方面的附加实验证明了我们提出的方法的通用性。

MSC公司:

94A08型 信息与通信理论中的图像处理(压缩、重建等)
68吨10 模式识别、语音识别
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Jing,Y。;Yang,Y。;Z.Feng。;Ye,J。;宋,M。;神经风格迁移:综述;arXiv:2017。
[2] 洛杉矶Gatys。;埃克,A.S。;Bethge,M。;艺术风格的神经算法;arXiv:2015。
[3] 洛杉矶Gatys。;埃克,A.S。;Bethge,M。;基于卷积神经网络的图像风格转换;IEEE计算机视觉与模式识别会议论文集:,2414-2423.
[4] Shih,Y。;美国巴黎。;巴恩斯,C。;弗里曼,W.T。;杜兰德,F;头像风格转换:纽约,纽约,美国2014。
[5] 埃弗罗斯,A.A。;W.T.弗里曼。;用于纹理合成和传输的图像绗缝;第28届计算机图形与交互技术年会论文集:纽约,纽约,美国2001年,341-346.
[6] Wei,L.Y。;勒沃伊,M。;基于树结构矢量量化的快速纹理合成;第27届计算机图形与交互技术年会论文集:美国马萨诸塞州波士顿,2000年,479-488.
[7] Krizhevsky,A。;Sutskever,I。;辛顿,G.E。;基于深度卷积神经网络的图像元分类;《神经信息处理系统进展》,《神经信息加工系统学报》,内华达州塔霍湖,2012年12月3日至6日:美国纽约州红钩,2012年,1097-1105.
[8] LeCun,Y。;Y.本吉奥。;辛顿,G。;深度学习;性质:2015年;第521卷,第436-444页。
[9] Radford,A。;梅茨,L。;钦塔拉,S。;基于深度卷积生成对抗网络的无监督表征学习;arXiv:2015年,1-15.
[10] 约翰逊,J。;Alahi,A。;费菲,L。;实时风格传输和超分辨率的感知损失;欧洲计算机视觉会议记录:2016年德国柏林,694-711.
[11] I.J.古德费罗。;Pouget-Abadie,J。;米尔扎,M。;徐,B。;Warde-Farley,D。;Ozair,S。;科尔维尔,A。;Y.本吉奥。;生成对抗性网络;arXiv:2014年,1-9.
[12] Sangkloy,P。;卢,J。;方,C。;Yu,F。;海斯,J。;Scribbler:用草图和颜色控制深度图像合成;arXiv:2016。
[13] Güçlütürk,Y。;Güçlü,美国。;van Lier,R。;van Gerven,文学硕士。;卷积草图反转;欧洲计算机视觉会议记录:2016年德国柏林,810-824.
[14] Long,J。;谢尔哈默,E。;Darrell,T。;用于语义分割的全卷积网络;IEEE计算机视觉和模式识别会议记录:,3431-3440.
[15] 艾茨,M。;里希特(Richter,R.)。;希尔德布兰德,K。;布比基尔,T。;Alexa,M。;Photosketcher:交互式基于草图的图像合成;IEEE计算。图表。申请:2011; 第31卷,第56-66页。
[16] 陈,T。;郑,M.M。;Tan,P。;沙米尔。;胡,S.M。;Sketch2photo:互联网图像蒙太奇;ACM事务处理。图表:2009; 第28卷。
[17] Shih,Y。;美国巴黎。;杜兰德,F。;W.T.弗里曼。;一张户外照片中不同时间的数据驱动幻觉;ACM事务处理。图表:2013; 第32卷。
[18] 夸特拉,V。;Schödl,A。;埃萨,I。;Turk,G。;Bobick,A。;图形剪切纹理:使用图形剪切进行图像和视频合成;ACM事务处理。图表:2003; 第22卷,277-286。
[19] Kingma,D.P。;韦林,M。;自动编码变分贝叶斯;arXiv:2013·Zbl 1431.68002号
[20] Rezende,D.J。;穆罕默德,S。;Wierstra,D。;深度生成模型中的随机反向传播和近似推断;第31届机器学习国际会议论文集:,1278-1286.
[21] 古德费罗,I。;Pouget-Abadie,J。;米尔扎,M。;徐,B。;Warde-Farley,D。;Ozair,S。;科尔维尔,A。;Y.本吉奥。;生成性对抗网;《神经信息处理系统进展》,《神经信息处理系统学报》,加拿大蒙特利尔,2014年12月8日至13日:美国纽约州红钩市,2014年,2672-2680.
[22] Van den Oord,A。;Kalchbrenner,N。;Espeholt,L。;葡萄酒,O。;格雷夫斯,A。;基于pixelcnn解码器的条件图像生成;《神经信息处理系统进展》,《神经信息加工系统学报》,西班牙巴塞罗那,2016年12月5日至10日:美国纽约州Red Hook,2016年,4790-4798.
[23] Hertzmann,A。;雅各布斯,C.E。;Oliver,N。;Curless,B。;Salesin,D.H。;图像类比;第28届计算机图形与交互技术年会论文集:纽约,纽约,美国2001年,327-340.
[24] 严,X。;杨,J。;Sohn,K。;Lee,H。;Attribute2image:根据视觉属性生成条件图像;欧洲计算机视觉会议记录:2016年德国柏林,776-791.
[25] Iizuka,S。;西莫·塞拉,E。;石川,H。;让我们有颜色!:全局和局部图像先验的联合端到端学习用于同时分类的自动图像着色;ACM事务处理。图表:2016年;第35卷,110:1-110:11。
[26] 塞格迪,C。;刘伟。;贾毅。;Sermanet,P。;里德,S。;安格洛夫,D。;Erhan,D。;Vanhoucke,V。;Rabinovich,A。;用卷积深入;IEEE计算机视觉和模式识别会议记录:,1-9.
[27] Salimans,T。;古德费罗,I。;Zaremba,W。;张,V。;Radford,A。;陈,X。;改进的GAN训练技术;《神经信息处理系统进展》,《神经信息加工系统学报》,西班牙巴塞罗那,2016年12月5日至10日:美国纽约州Red Hook,2016年,1-10.
[28] 陈,X。;Duan,Y。;Houthooft,R。;舒尔曼,J。;Sutskever,I。;Abbeel,P。;InfoGAN:通过信息最大化生成对抗网进行可解释表征学习;arXiv:2016。
[29] Dixon,D。;普拉萨德,M。;哈蒙德,T。;iCanDraw:使用草图识别和纠正反馈来帮助用户绘制人脸;2010年美国纽约州纽约市SIGCHI计算机系统人为因素会议记录,897-906.
[30] Isola,P。;朱J.Y。;周,T。;埃弗罗斯,A.A。;基于条件对抗网络的图像翻译;arXiv:2016。
[31] 米尔扎,M。;Osindero,S。;条件生成对抗网;arXiv:2014。
[32] O.Ronneberger。;菲舍尔,P。;布罗克斯,T。;U-net:用于生物医学图像分割的卷积网络;医学图像计算和计算机辅助干预国际会议论文集:德国柏林,2015年,234-241.
[33] 医学博士泽勒。;Krishnan,D。;G.W.泰勒。;弗格斯,R。;非卷积网络;2010年IEEE计算机视觉与模式识别会议论文集(CVPR):,2528-2535.
[34] 奥德纳,A。;杜穆林,V。;奥拉赫,C。;反褶积和棋盘式伪影;2016; .
[35] 谢S。;屠呦呦,Z。;整体嵌套边缘检测;IEEE计算机视觉国际会议论文集:,1395-1403.
[36] M.阿巴迪。;阿加瓦尔,A。;巴勒姆,P。;Brevdo,E。;陈,Z。;Citro,C。;Corrado,G.S。;A.戴维斯。;迪安·J。;德文,M。;Tensorflow:异构分布式系统上的大规模机器学习;arXiv:2016。
[37] 洛夫,S。;塞格迪,C。;批量规范化:通过减少内部协变量偏移加快深度网络训练;第32届机器学习国际会议论文集:,448-456.
[38] 李,C。;Wand,M。;结合马尔可夫随机场和卷积神经网络进行图像合成;IEEE计算机视觉与模式识别会议论文集:,2479-2486.
[39] Ulyanov,D。;列别捷夫,V。;Vedaldi,A。;伦皮茨基,V。;纹理网络:纹理和风格化图像的前馈合成;第33届机器学习国际会议论文集:。
[40] Yang,Y。;纽萨姆,S。;土地利用分类的视觉袋和空间扩展;第18届SIGSPATIAL地理信息系统进展国际会议记录:美国纽约州纽约市,2010年,270-279.
[41] 张,R。;朱J.Y。;Isola,P。;耿,X。;林,A.S。;Yu,T。;埃弗罗斯,A.A。;基于深度先验知识的实时用户引导图像着色;ACM事务处理。图表:2017; 第36卷。
[42] 杨,J。;Wright,J。;黄,T.S。;马云(Ma,Y.)。;基于稀疏表示的图像超分辨率;IEEE传输。图像处理:2010; 第19卷,2861-2873·兹比尔1371.94429
[43] 马丁·D·。;Fowlkes,C。;塔尔·D。;Malik,J。;人体分割自然图像数据库及其在分割算法评估和生态统计测量中的应用;第八届IEEE计算机视觉国际会议论文集:,416-423.
[44] Chang,H。;Yeung,D.Y。;熊,Y。;邻域嵌入超分辨率;2004年IEEE计算机学会计算机视觉和模式识别会议论文集:。
[45] Glassner,D。;巴贡,S。;伊拉尼,M。;单个图像的超分辨率;2009年IEEE第12届计算机视觉国际会议论文集:,349-356.
[46] Zeyde,R。;Elad,M。;普罗特,M。;基于稀疏表示的单幅图像放大;国际曲线和曲面会议记录:,711-730. ·Zbl 1314.94018号
[47] 贝维拉夸,M。;A.鲁米。;吉列莫特,C。;莫雷尔,A。;基于非负邻域嵌入的低复杂度单幅图像超分辨;第23届英国机器视觉会议(BMVC)会议记录:·Zbl 1374.94045号
[48] 蒂莫夫特,R。;德斯梅特,V。;Van Gool,L。;A+:用于快速超分辨率的调整锚定邻域回归;《亚洲计算机视觉会议论文集:2014年德国柏林》,111-126.
[49] 黄J.B。;辛格,A。;阿胡加,N。;基于变换自聚焦的单图像超分辨率;IEEE计算机视觉和模式识别会议记录:,5197-5206页。
[50] Dong,C。;罗伊,C.C。;He,K。;唐,X。;学习用于图像超分辨率的深度卷积网络;欧洲计算机视觉会议记录:德国柏林,2014年,184-199年。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。