HLNet:实时分割和面部肤色评估的统一框架
摘要
1.简介
(1) 我们提出了一种高效的头发和面部分割网络,该网络使用新提出的模块来实现实时推理,同时保证性能。 (2) 给出了一个名为InteractionModule的模块,该模块利用多维特征交互来缓解网络越来越深时空间信息的减弱。 (3) 提出了一种新的肤色等级评估算法,并在手动标记的数据集上获得了准确的结果。 (4) 我们的方法在多个基准数据集上取得了优异的结果。
2.相关工程
3.方法
3.1. 高维到低维融合网络
3.2. 面部肤色分类
|
4.实验
4.1. 实施详细信息
4.2. 数据集集合
4.2.1. 面部和头发分割数据集
4.2.2. 手动注释数据集
4.3. 评估指标
5.结果和讨论
5.1. 细分结果
5.1.1. 总体比较
5.1.2. 与SOTA轻量级网络的比较
5.1.3. 烧蚀研究
5.2. 面部肤色分类结果
6.结论
作者贡献
基金
致谢
利益冲突
工具书类
罗塞特,C。; Coulon,P.Y.,发罩分割的频率和颜色分析。 2008年10月12日至15日,美国加利福尼亚州圣地亚哥,第15届IEEE图像处理国际会议论文集; IEEE:皮斯卡塔韦,新泽西州,美国,2008年; 第2276–2279页。 [ 谷歌学者 ] 沈毅。; 彭,Z。; 基于图像的头发分割算法在人脸漫画自动合成中的应用。 科学。 世界J。 2014 , 2014 , 748634. [ 谷歌学者 ] [ 交叉参考 ] [ 公共医学 ] [ 绿色版本 ] 阿巴斯,Q。; 加西亚,I.F。; Emre Celebi,M。; Ahmad,W.皮肤镜图像的特征保护脱毛算法。 皮肤研究技术。 2013 , 19 ,e27–e36。 [ 谷歌学者 ] [ 交叉参考 ] [ 公共医学 ] 博尔扎,D。; Ileni,T。; Darabant,A.从面部图像中进行头发分割和颜色提取的深度学习方法。 2018年9月24日至27日在法国普瓦捷举行的智能视觉系统先进概念国际会议记录; 第438–449页。 [ 谷歌学者 ] Wen,S。; 董,M。; Yang,Y。; 周,P。; 黄,T。; Chen,Y.面部标签的端到端检测分割系统。 IEEE传输。 Emerg.顶部。 计算。 智力。 2019 . [ 谷歌学者 ] [ 交叉参考 ] 罗,L。; 薛博士。; Feng,X.EHANet:一种有效的人脸解析层次聚合网络。 申请。 科学。 2020 , 10 , 3135. [ 谷歌学者 ] [ 交叉参考 ] 穆罕默德,苏联。; 斯瓦内拉,M。; 莱昂纳迪,R。; Benini,S.野外头发检测、分割和发型分类。 图像可视性。 计算。 2018 , 71 , 25–37. [ 谷歌学者 ] [ 交叉参考 ] [ 绿色版本 ] Long,J。; 谢尔哈默,E。; Darrell,T.语义分割的完全卷积网络。 IEEE传输。 模式分析。 机器。 智力。 2014 , 39 , 640–651. [ 谷歌学者 ] O.Ronneberger。; 菲舍尔,P。; Brox,T.U-net:生物医学图像分割的卷积网络。 2017年10月5日至9日,德国慕尼黑,医学图像计算和计算机辅助干预国际会议记录; 第234-241页。 [ 谷歌学者 ] Yu,F。; Koltun,V.通过膨胀卷积实现多尺度上下文聚合。 2015年。在线提供: https://arxiv.org/abs/1511.07122 (2016年4月30日访问)。 郑S。; 贾亚苏马纳,S。; 罗梅拉·佩雷斯,B。; 维尼特,V。; 苏,Z。; 杜,D。; Huang,C.等人。; Torr,P.H.条件随机场作为递归神经网络。 2015年12月11日至18日在智利圣地亚哥举行的IEEE计算机视觉国际会议记录; 第1529-1537页。 [ 谷歌学者 ] Yu,C。; Wang,J。; 彭,C。; 高,C。; Yu,G。; Sang,N.Bisenet:用于实时语义分割的双边分割网络。 2018年9月8日至14日在德国慕尼黑举行的欧洲计算机视觉会议记录; 第325-341页。 [ 谷歌学者 ] Stricker,文学硕士。; Orengo,M.彩色图像的相似性。 1995年3月23日,《国际光学和光子学会会刊》,美国加利福尼亚州圣何塞; 第381-392页。 [ 谷歌学者 ] Pal,M.遥感分类的随机森林分类器。 《国际遥感杂志》。 2005 , 26 , 217–222. [ 谷歌学者 ] [ 交叉参考 ] 陈,L.C。; 帕潘德里欧,G。; 施罗夫,F。; Adam,H.重新思考语义图像分割的Atrous卷积。 2017年。在线提供: https://arxiv.xilesou.top/abs/1706.05587 (2017年12月5日访问)。 郑S。; 贾亚苏马纳,S。; 罗梅拉·佩雷斯,B。; 维尼特,V。; 苏,Z。; 杜,D。; 黄,C。; Torr,P.H.一百层提拉米苏:用于语义分割的全卷积密集网络。 2017年7月21日至27日在美国夏威夷州火奴鲁鲁举行的IEEE计算机视觉和模式识别研讨会会议记录; 第11-19页。 [ 谷歌学者 ] 赵,H。; 史J。; 齐,X。; 王,X。; Jia,J.《金字塔场景解析网络》,《IEEE计算机视觉和模式识别会议论文集》,美国夏威夷州火奴鲁鲁,2017年7月21日至26日; 第2881–2890页。 [ 谷歌学者 ] 林·G。; 米兰,A。; 沈,C。; Reid,I.Refinenet:用于高分辨率语义分割的多路径细化网络。 2017年7月21-26日,美国夏威夷火奴鲁鲁,IEEE计算机视觉和模式识别会议记录; 第1925-1934页。 [ 谷歌学者 ] Paszke,A。; Chaurasia,A。; Kim,S。; Culurciello,E.Enet:实时语义分割的深层神经网络架构。 2016年。在线提供: https://arxiv.xilesou.top/abs/1606.02147 (2016年6月7日访问)。 赵,H。; 齐,X。; 沈,X。; 史J。; Jia,J.Icnet,用于高分辨率图像的实时语义分割。 2018年9月8日至14日在德国慕尼黑举行的欧洲计算机视觉会议记录; 第405-420页。 [ 谷歌学者 ] A.G.霍华德。; 朱,M。; 陈,B。; Kalenichenko,D。; Wang,W。; 韦扬德,T。; 安德烈托,M。; Adam,H.Mobilenets:用于移动视觉应用的高效卷积神经网络。 2017年。在线提供: https://arxiv.xilesou.top/abs/1704.04861 (2017年4月17日访问)。 Poudel,R.P。; Liwicki,S。; Cipolla,R.Fast-SCNN:快速语义分割网络,2019年。 在线可用: https://arxiv.xilesou.top/abs/1902.04502 (2019年2月12日访问)。 李,H。; 熊,P。; 风扇,H。; Sun,J.Dfanet:实时语义分割的深层特征聚合。 2019年6月16日至20日,美国加利福尼亚州洛杉矶市,IEEE计算机视觉和模式识别会议记录; 第9522–9531页。 [ 谷歌学者 ] Wang,Y。; 周,Q。; 刘杰。; 熊,J。; 高,G。; 吴,X。; Latecki,L.J.LEDNet:用于实时语义分割的轻量级编解码网络。 2019.在线提供: https://arxiv.xilesou.top/abs/1905.02423 (2019年5月13日访问)。 He,K。; 张,X。; Ren,S。; Sun,J.图像识别的深度残差学习。 2016年6月26日至7月1日,美国加利福尼亚州拉斯维加斯,IEEE计算机视觉和模式识别会议记录; 第770-778页。 [ 谷歌学者 ] 张,H。; Dana,K。; 史J。; 张,Z。; 王,X。; Tyagi,A。; Agrawal,A.语义分段的上下文编码。 2018年6月19日至21日,美国犹他州盐湖城,IEEE计算机视觉和模式识别会议记录; 第7151-7160页。 [ 谷歌学者 ] Fu,J。; 刘杰。; 田,H。; 李毅。; Bao,Y。; 方,Z。; Lu,H.场景分割的双注意网络。 2019年6月16日至20日,美国加利福尼亚州洛杉矶市,IEEE计算机视觉和模式识别会议记录; 第3146–3154页。 [ 谷歌学者 ] 陈,L.C。; 帕潘德里欧,G。; 科基诺斯,I。; 墨菲,K。; Yuille,A.L.用深度卷积网和完全连接的Crfs进行语义图像分割。 2014.在线提供: https://arxiv.xilesou.top/abs/1412.7062 (2016年6月7日访问)。 莱文斯坦,A。; Chang,C。; Phung,E。; Kezele,我。; 郭伟。; Aarabi,P.移动设备上的实时深发垫。 计算机和机器人视觉会议记录,加拿大安大略省多伦多,2018年5月8日至10日; 第1-7页。 [ 谷歌学者 ] Sun,K。; 肖,B。; 刘,D。; Wang,J.人类姿势估计的深度高分辨率表征学习。 2019.在线提供: https://arxiv.xilesou.top/abs/1902.09212 (2019年2月25日访问)。 桑德勒,M。; A.霍华德。; 朱,M。; Zhmoginov,A。; Chen,L.C.Mobilenetv2:倒置残差和线性瓶颈。 2018年6月19日至21日,美国犹他州盐湖城,IEEE计算机视觉和模式识别会议记录; 第4510–4520页。 [ 谷歌学者 ] Chollet,F.Xception:深度学习与深度可分离卷积。 2017年7月21-26日,美国夏威夷火奴鲁鲁,IEEE计算机视觉和模式识别会议记录; 第1251-1258页。 [ 谷歌学者 ] 洛夫,S。; Szegedy,C.批处理规范化:通过减少内部协变量转移加快深层网络培训。 2015年。在线提供: https://arxiv.xilesou.top/abs/1502.03167 (2015年3月2日访问)。 田,Z。; 沈,C。; 陈,H。; He,T.FCOS:完全卷积一阶段目标检测。 2019.在线提供: https://arxiv.xilesou.top/abs/1904.01355 (2019年8月20日访问)。 苏德雷,C.H。; 李伟(Li,W.)。; Vercauteren,T。; Ourselin,S。; Cardoso,M.J.广义骰子重叠作为高度不平衡分割的深度学习损失函数。 2017年9月14日,加拿大魁北克省魁北克市,医学图像分析深度学习和临床决策支持多模式学习论文集; 第240-248页。 [ 谷歌学者 ] He,K。; Sun,J。; Tang,X.引导式图像过滤。《欧洲计算机视觉会议论文集》,希腊克里特岛,2010年9月5日至11日; 第1-14页。 [ 谷歌学者 ] He,K。; Sun,J.快速导向过滤器。 2015年。在线提供: https://arxiv.xilesou.top/abs/1505.00996 (2015年5月5日查阅)。 莱文,A。; Lischinski,D。; Weiss,Y.自然图像遮光的封闭解决方案。 IEEE传输。 模式分析。 机器。 智力。 2007 , 30 , 228–242. [ 谷歌学者 ] [ 交叉参考 ] [ 公共医学 ] [ 绿色版本 ] Kae,A。; Sohn,K。; Lee,H。; Learnd-Miller,E.使用Boltzmann机器形状先验信息增强CRF用于图像标记。 2013年12月1日至8日,澳大利亚悉尼,IEEE计算机视觉和模式识别会议记录; 2019-2026页。 [ 谷歌学者 ] Yang,S。; 罗,P。; 洛伊,C.C。; Tang,X.从面部部位反应到面部检测:一种深度学习方法。 2015年12月11日至18日在智利圣地亚哥举行的IEEE计算机视觉国际会议记录; 第3676-3684页。 [ 谷歌学者 ] 斯瓦内拉,M。; 穆罕默德,苏联。; 莱昂纳迪,R。; Benini,S.Figaro,《野外毛发检测和分割》。 2016年9月25日至28日在美国亚利桑那州凤凰城举行的IEEE图像处理国际会议记录; 第3676–3684页。 [ 谷歌学者 ] 张凯。; 张,Z。; 李,Z。; 乔,Y.使用多任务级联卷积网络进行联合人脸检测和对齐。 电气与电子工程师协会。 信号。 过程。 莱特。 2016 , 23 , 1499–1503. [ 谷歌学者 ] [ 交叉参考 ] [ 绿色版本 ]