计算机应用》唯一官方网站››2024,第44卷››问题(5): 1619-1628.DOI(操作界面):10.11772/j.issn.100-9081.2023050675

多媒体计算与计算机仿真 • 上一篇   

基于分离式标签协同学习的YOLOv5持续性分析

李鑫,孟乔(),皇甫俊逸,孟令辰  

  1. 青海大学 计算机技术与应用系,西宁 810016
  • 收稿日期:2023-06-01 修回日期:2023-09-17 接受日期:2023-10-11 发布日期:2023-10-17 出版日期:2024-05-10
  • 通讯作者:孟乔
  • 作者简介:李鑫(1995—),男,四川南充人,硕士研究生,主要研究方向:智能交通、计算机视觉
    皇甫俊逸(1998年-)男,江西上饶人,硕士,主要研究方向:图像处理、视频分析
    孟令辰(1999—),男,河南南阳人,硕士研究生,主要研究方向:智能交通。
    第一联系人:孟乔(1983—),女,陕西咸阳人,讲师,博士,立方英尺会员,主要研究方向:智能交通、信息系统工程
  • 基金资助:
    投资项目(2023?ZJ?989Q)

基于可分离标签协作学习的YOLOv5多属性分类

李欣(Xin LI),巧梦(),君毅黄福,凌晨盟  

  1. 青海大学计算机技术与应用系,中国青海省西宁市810016
  • 收到:2023-06-01 修订过的:2023-09-17 认可的:2023-10-11 在线:2023-10-17 出版:2024-05-10
  • 联系人:乔蒙
  • 关于作者:李欣,1995年出生,硕士研究生。他的研究兴趣包括智能交通、计算机视觉。
    黄福君毅,1998年生,硕士,主要研究方向为图像处理、视频分析。
    孟凌晨,1999年出生,硕士研究生。他的研究兴趣包括智能交通。
  • 支持单位:
    青海省自然科学基金(2023-ZJ-989Q)

摘要:

针对图像分类任务中卷积网络提取图像细粒度特征能力不足、多属性之间的依赖关系无法识别的问题,提出一种基于YOLOv5公司的车辆多属性分类方法Multi-YOLOv5该方法设计了多头非极大值抑制(多-NMS)(单独损失)函数协同工作机制实现车辆的多属性分类任务,并采用卷积块注意力模块(CBAM)、SA(Shuffle Attention)和CoordConv YOLOv5检测模型,分别从提升多属性特征能力提取、增强不同属性之间的关联关系、增强网络对位置信息的感知能力三方面提升模型对目标多属性分类的精准性。在VeRi公司等数据集上进行了训练与测试,实验结果表明,与基于GoogLeNet、There络(ResNet)、EfficientNet、ViT(Vision Transformer)等的网络结构相比,多YOLOv5方法在目标的多属性分类方面取得了较好的识别结果,在VeRi公司数据集上,它的平均精度均值(mAP)87.37%较上述表现最佳的方法提高了4.47个百分点,且比原YOLOv5公司模型具有更好的鲁棒性,能为密集环境下的交通目标感知提供可靠的数据信息。

关键词: 多属性分类, 深度学习, 多特征融合, 注意力, YOLOv5公司

摘要:

针对卷积网络提取图像细粒度特征的能力不足以及图像分类任务中无法识别多属性之间的依赖性等问题,提出了一种基于YOLOv5的车辆多属性分类的Multi-YOLOv 5方法。设计了一种多头部非最大抑制(Multi-NMS)和可分离标签丢失(Separate-loss)功能的协同工作机制,以完成车辆的多属性分类任务。此外,利用卷积块注意模块(CBAM)、随机注意(SA)重构了YOLOv5检测模型和CoordConv方法增强了提取多属性特征的能力,增强了不同属性之间的相关性,增强了网络对位置信息的感知,从而提高了模型在对象多属性分类中的准确性。最后,对VeRi等数据集进行了训练和测试。实验结果表明,与GoogLeNet、ResNet等网络体系结构相比,Multi-YOLOv5方法在对象的多属性分类中取得了更好的识别结果、EfficientNet和Vision Transformer(ViT)。在VeRi数据集上,Multi-YOLOv5的平均精度(mAP)达到87.37%,与上述最佳方法相比,显著提高了4.47个百分点。此外,与原始YOLOv5模型相比,Multi-YOLOv 5具有更好的鲁棒性,从而为密集环境中的交通对象感知提供了可靠的数据信息。

关键词: 多属性分类, 深度学习, 多特征融合, 注意, YOLOv5公司

中图分类号: