计算机科学››2022,第49卷››发行(6A): 418-423.数字对象标识:10.11896/jsjkx.210700210

图像处理&多媒体技术 • 上一篇   下一篇

不同数据增强方法对模型识别精度的影响

王建明1,陈响育1,杨自忠2,史晨阳1,张宇航1,钱正坤1  

  1. 1大理大学数学计算机学院 云南 大理 670003
    2大理大学云南省昆虫生物医药研发重点实验室 云南 大理 670003
  • 出版日期:2022-06-10 发布日期:2022-06-08
  • 通讯作者:王建明(王建明618@163.com)
  • 基金资助:
    国家自然科学基金(32001313);云南省地方本科高校基础研究联合专项青年项目(2018FH001-106);云南省博士后科研基金项目(ynbh20057);云南省基础研究专项面上项目(202201AT070006);云南省重大科技专项计划(202002AA100007)

不同数据增强方法对模型识别精度的影响

王建明1、陈香玉1,杨自忠2、史晨阳1,张玉杭1、钱正坤1  

  1. 1大理大学数学与计算机学院,云南大理670003
    2云南省昆虫生物制药研发重点实验室,大理大学,云南大理670003
  • 在线:2022-06-10 出版:2022-06-08
  • 关于作者:王建明,1986年生,博士,副教授。他的主要研究兴趣包括人工智能和优化算法。
  • 支持单位:
    国家自然科学基金(32001313)、云南省地方本科院校青年基础研究联合专项(2018FH001-106)、云南省博士后科研基金项目(ynbh20057)、云南省级基础研究专项(202201AT070006)云南省重大科技项目(202002AA100007)。

摘要:深度学习的效果严重依赖于数据的数量与质量,数据量不足将导致模型过拟合。而在实际应用研究中,大量的高质量样本数据往往较难获取,图像数据尤甚。针对上述问题,以动物-10数据集为基础,设计了一种基于前景目标提取,使用纯色替换原始背景以实现数据增强的方法,并结合传统数据增强方法构造了新数据集,使用AlexNet、Inception-v3、ResNet-50和VGG-16 4个神经网络模型分析不同颜色背景及不同数据增强方法对模型识别精度的影响。实验结果表明:不同颜色背景对模型识别精度无显著影响。以此为基础,采用绿色背景进行后续的数据增强操作,设计了A、 B、C、D 4个数据集并对上述4个模型进行了对比实验,实验结果表明模型对识别精度有显著影响而对数据集无显著影响,但对于AlexNet和Inception-v3模型,包含突出前景数据增强数据集的识别精度较原始图像及传统数据增强方式分别提高了3.78%和4.55%,这说明在小数据集下,突出前景的数据增强方法能使模型更容易注意到并学习到图像的关键特征,从而使模型的表现更好,提高模型的识别精度,在实际的工程应用中具有一定的实践价值。

关键词: 卷积神经网络, 深度学习, 数据增强, 突出前景, 图像识别

摘要:深度学习的效果在很大程度上取决于数据的数量和质量,数据不足会导致模型过度拟合。在实际应用研究中,往往很难获得大量高质量的样本数据,尤其是图像数据。针对上述问题,本文以ANIMAL-10数据集为研究对象,设计了一种基于前景目标提取和用纯色替换原始背景的方法来实现数据增强。结合传统的数据增强方法构建新的数据集,使用AlexNet、Inception、ResNet和VGG-16四个神经网络模型分析不同颜色背景和不同数据增强方法对模型识别精度的影响。实验表明,不同颜色背景对模型识别的准确性没有显著影响。在此基础上,将绿色背景用于后续的数据增强操作,设计了四个数据集A、B、C和D,并对上述四个模型进行了比较。测试结果表明,模型对识别精度有显著影响,而数据集对识别精度没有显著影响。然而,对于AlexNet和Inception-v3模型,与原始图像和传统数据增强方法相比,包含显著前景数据的增强数据集的识别准确率分别提高了3.78%和4.55%。这表明,在小数据集下,突出前景的数据增强方法可以使模型更容易注意和学习图像的关键特征,从而使模型的性能更好,提高了模型的识别精度,在实际工程应用中具有一定的实用价值。

关键词: 卷积神经网络, 数据增强, 深度学习, 突出显示前景, 图像识别

中图分类号: 

  • TP391型
[1] 朱建堂,姚国良,张国喜,等.深度神经网络少镜头学习研究[J]。CEA,2021,57(7):22-33。
[2] 颜立中,YOSHUA B,GEOFFREY H.深度学习[J]。《自然》,2015521(7553):436-444。
[3] JORDAN M I,MITCHELL T M.机器学习:趋势、观点和前景[J]。科学,2015349(6245):255-260。
[4] ALBAWI S,MOHAMMED T A,AL-ZAWI S。对卷积神经网络的理解[C]//国际工程技术会议(ICET)。IEEE,2017:1-6。
[5] 诺鲁扎德·M·S,NGUYEN A,KOSMALA M,等.基于深度学习的摄像机捕捉图像中野生动物的自动识别、计数和描述[J]。美国国家科学院院刊,2018115(25):E5716-E5725。
[6] 机器学习中的过度拟合与欠计算[J]。ACM计算调查(CSUR),1995年,27(3):326-327。
[7] BIEHL M,GHOSH A,HAMMER B.LVQ算法的动力学和泛化能力[J]。机器学习研究杂志,2007,8(8):323-360。
[8] KRIZHEVSKY A,SUTSKEVER I,HINTON G.基于深度卷积神经网络的图像网络分类[J]。ACM通讯,2017,60(6):84-90。
[9] SIMONYAN K,ZISSERMAN A.用于大规模图像识别的超深卷积网络[C]//国际学习表征会议(ICLR).2015。
[10] RUSSO F.一种结合切分和降噪的图像增强技术[J]。IEEE仪器和测量汇刊,2002,51(4):824-828。
[11] RANA P,CHOPRA V.图像增强技术研究[J]。IJARCCE,2015年4月(5):609-611。
[12] 刘世凯,唐鹏,金伟德.基于智能数据增强和改进YOLOv3的接触网跌落器和支架检测研究[J]。计算机科学,2020,47(11A):178-182。
[13] 鲍永X,吕天良,杜永华,等.基于i_ResNet34模型和数据增强的深度假视频检测方法[J]。计算机科学,2021,48(7):77-85。
[14] 钟忠,郑磊,康刚,等.随机擦除数据增强[J]。AAAI人工智能会议记录,2017,34(7):13001-13008。
[15] 陈鹏,刘斯,赵华,等.网格掩码数据增强[J].arXiv:2001.040862020。
[16] PEREZ L,WANG J.深度学习在图像分类中数据增强的有效性[J].arXiv:1712.046212017。
[17] GIROSI F,JONES M,POGGIO T.正则化理论与神经网络体系结构[J]。神经计算,1995,7(2):219-269。
[18] SCHWARTZ E,KARLINSKY L,SHTOK J,等.Delta-en-coder:一种有效的小目标识别样本合成方法[C]//第32届神经信息处理系统国际会议论文集(NIPS'18).2018:2850-2860。
[19] 王永强,姚清明,郭建堂,等.从几个例子中归纳:少快照学习的调查[J]。ACM计算调查,2020,53(3):1-34。
[20] 岳志强,张和伟,孙庆瑞,等.干预性小样本学习[J].arXiv:2009.1300020。
[21]卢杰,龚平,叶杰平,等。从极少数样本中学习:一项调查[J]。arXiv:2009.0256352020。
[22]IOFFE S,SZEGEDY C.批量规范化:通过减少内部协变量偏移加快深层网络训练[C]//国际机器学习会议(ICML).2015:448-456。
[23]RIBEIRO M T,SINGH S,GUESTRIN C。“为什么要信任你?”解释任何分类器的预测[C]//第22届ACM SIGKDD国际知识发现和数据挖掘会议记录。2016:1135-1144。
[24]于毅,王立伟,张永立.基于特征提取偏好与背景颜色相关性的数据增强算法[J]。计算机应用,2019,39(11):3172-3177。
[25]CORRADO A.来自谷歌图片的10种不同类别的动物图片[EB/OL]。(2019-12-13)[2021-07-21].https://www.kaggle.com/alessiocorrado99/animals10/metadata。
[1] 饶志双, 贾真, 张凡, 李天瑞.
基于键值关联记忆网络的知识图谱问答方法
用于知识图问题回答的键值关系存储网络
计算机科学, 2022, 49(9): 202-207.https://doi.org/10.11896/jsjkx.220300277
[2] 汤凌韬, 王迪, 张鲁飞, 刘盛云.
基于安全多方计算和差分隐私的联邦学习方案
基于安全多方计算和差异隐私的联合学习方案
计算机科学, 2022, 49(9): 297-305.https://doi.org/10.11896/jsjkx.210800108
[3] 周乐员, 张剑华, 袁甜甜, 陈胜勇.
多层注意力机制融合的序列到序列中国连续手语识别和翻译
基于多层注意机制融合的汉语连续手语识别与翻译
计算机科学, 2022, 49(9): 155-161.https://doi.org/10.11896/jsjkx.210800026
[4] 徐涌鑫, 赵俊峰, 王亚沙, 谢冰, 杨恺.
时序知识图谱表示学习
时间知识图表示学习
计算机科学, 2022, 49(9): 162-171.https://doi.org/10.11896/jsjkx.220500204
[5] 李宗民, 张玉鹏, 刘玉杰, 李华.
基于可变形图卷积的点云表征学习
基于可变形图卷积网络的点云表示学习
计算机科学, 2022, 49(8): 273-278.https://doi.org/10.11896/jsjkx.210900023
[6] 王剑, 彭雨琦, 赵宇斐, 杨健.
基于深度学习的社交网络舆情信息抽取方法综述
基于深度学习的社会网络舆情信息提取研究综述
计算机科学, 2022, 49(8): 279-293.https://doi.org/10.11896/jsjkx.220300099
[7] 郝志荣, 陈龙, 黄嘉成.
面向文本分类的类别区分式通用对抗攻击方法
文本分类中的类鉴别通用对抗攻击
计算机科学, 2022, 49(8): 323-329.https://doi.org/10.11896/jsjkx.220200077
[8] 姜梦函, 李邵梅, 郑洪浩, 张建朋.
基于改进位置编码的谣言检测模型
基于改进位置嵌入的谣言检测模型
计算机科学, 2022, 49(8): 330-335.https://doi.org/10.11896/jsjkx.210600046
[9] 陈泳全, 姜瑛.
基于卷积神经网络的应用程序用户行为分析方法
基于卷积神经网络的APP用户行为分析方法
计算机科学, 2022, 49(8): 78-85.https://doi.org/10.11896/jsjkx.210700121
[10] 朱承璋, 黄嘉儿, 肖亚龙, 王晗, 邹北骥.
基于注意力机制的医学影像深度哈希检索算法
基于注意机制的医学图像深度散列检索算法
计算机科学, 2022, 49(8): 113-119.https://doi.org/10.11896/jsjkx.210700153
[11] 孙奇, 吉根林, 张杰.
基于非局部注意力生成对抗网络的视频异常事件检测方法
基于非局部注意的视频异常事件检测生成对抗网络
计算机科学, 2022, 49(8): 172-177.https://doi.org/10.11896/jsjkx.210600061
[12] 檀莹莹, 王俊丽, 张超波.
基于图卷积神经网络的文本分类方法研究综述
基于图卷积网络的文本分类方法综述
计算机科学, 2022, 49(8): 205-216.https://doi.org/10.11896/jsjkx.210800064
[13] 胡艳羽, 赵龙, 董祥军.
一种用于癌症分类的两阶段深度特征选择提取算法
用于癌症分类的两阶段深度特征选择提取算法
计算机科学, 2022, 49(7): 73-78.https://doi.org/10.11896/jsjkx.210500092
[14] 张颖涛, 张杰, 张睿, 张文强.
全局信息引导的真实图像风格迁移
全球信息引导的真实感风格转换
计算机科学, 2022, 49(7): 100-105.https://doi.org/10.11896/jsjkx.210600036
[15] 戴朝霞, 李锦欣, 张向东, 徐旭, 梅林, 张亮.
基于DNGAN公司的磁共振图像超分辨率重建算法
基于DNGAN的MRI超分辨率重建
计算机科学, 2022, 49(7): 113-119.https://doi.org/10.11896/jsjkx.210600105
已查看
全文


摘要

引用

  共享   
  讨论   
找不到建议阅读的文章!