计算机工程与应用››2024,第60卷››发行(8): 267-273.内政部:10.3778/j.issn.1002-8331.2302-0056

图形图像处理 • 上一篇   下一篇

面向目标检测的数据集标签遗漏的协同修正技术

周定威,扈静,张良锐,段飞亚  

  1. 合肥工业大学 机械工程学院,合肥 230009
  • 出版日期:2024-04-15 发布日期:2024-04-15

面向对象检测的数据集标签遗漏协同校正技术

周定伟、胡静、张良瑞、段飞亚  

  1. 合肥工业大学机械工程学院,合肥230009
  • 在线:2024-04-15 出版:2024-04-15

摘要:针对图像标注中疲劳、粗心等因素引起的标签遗漏现象,使得模型训练时难以正确区分正负样本,进而影响模型性能。设计了一种协同修正技术,通过多次迭代更新训练集,将潜在无标签的目标进行对象擦除,降低训练集的错误监督信息,避免人工的重复检查和重复标注。该方法无需进行算法参数调整、不依赖具体网络结构,低成本地减少数据集错误从而提升模型训练精度。在YOLOv5公司算法的实验基础上表明协同修正操作仅迭代1次即有明显的改善效果,并在多个公共数据集上能够提升0.4%~1.4%的检测精度,当数据集中的标签遗漏率达到40%时依然能够生效。该方法对数据集中样本的数据量和类别数没有限制,可应用于电商、遥感、通用等多种目标检测场景,保持着较好的鲁棒性和泛化性。

关键词: 协同修正, 标签遗漏, 数据集优化, 目标检测, 深度学习

摘要:对于图像标注中由于疲劳、粗心等因素造成的标注遗漏,在模型训练过程中很难正确区分正负样本,从而影响模型的性能。设计了一种协同校正技术,通过多轮迭代更新训练集,擦除潜在的未标记对象,减少训练集的错误监控信息,避免人工重复检查和标记。该方法不需要调整算法参数,不依赖于特定的网络结构,并且以低成本减少数据集错误,提高模型训练的准确性。基于YOLOv5算法的实验表明,在多个公共数据集上,协作校正操作只需一次迭代就能将检测精度提高0.4%~1.4%,并且在数据集中标签遗漏率达到40%时仍然有效。该方法对数据集中的数据量和样本类别没有限制,可以应用于电子商务、遥感、通用等多种目标检测场景,保持了良好的鲁棒性和泛化性。

关键词: 协同校正, 标签遗漏, 数据集优化, 目标检测, 深度学习