计算机工程与应用››2024,第60卷››问题(9): 142-150.内政部:10.3778/j.issn.1002-8331.2312-0043

•YOLOv8改进及应用专题 • 上一篇   下一篇

面向无人机视角下小目标检测的YOLOv8系列改进模型

潘玮,韦超,钱春雨,杨哲  

  1. 苏州大学 计算机科学与技术学院,江苏 苏州 215006
  • 出版日期:2024-05-01 发布日期:2024-04-29

从无人机角度改进的YOLOv8s小目标检测模型

潘伟、魏超、钱春玉、杨哲  

  1. 苏州大学计算机科学与技术学院,江苏苏州215006
  • 在线:2024-05-01 出版:2024-04-29

摘要:从无人机视角进行目标检测,面临图像目标小、分布密集、类别不均衡等难点,且由于无人机的硬件条件限制了模型的规模,导致模型的准确率偏低。提出一种融合多种注意力机制的YOLOv8系列改进模型,在骨干网络中引入感受野注意力卷积和CBAM(集中注意力模块)注意力机制改进卷积模块,解决注意力权重参数在感受野特征中共享问题的同时,在通道和空间维度加上注意力权重,增强特征提取能力;通过引入大型可分离卷积注意力思想,改造空间金字塔池化层,增加不同层级特征间的信息交融;优化颈部结构,增加具有丰富小目标语义信息的特征层;使用内部IoU损失函数的思想改进MPDIoU(基于IoU的最小点距离)函数,以MPDIoU内部代替原损失函数,提升对困难样本的学习能力。实验结果表明,改进后的YOLOv8系列模型在VisDrone公司数据集上mAP、P、R分别提升了分别为16.1%、9.3%、14.9%性能超过YOLOv8m可以有效应用于无人机平台上的目标检测任务。

关键词: 无人机, 小目标检测, YOLOv8, 感受野注意力, 大型可分离卷积

摘要:面对小而密集的图像目标、不均匀的类分布以及硬件条件的模型大小限制等问题,从无人机角度进行目标检测的精度较差。提出了一种基于YOLOv8的多注意机制的改进模型。为了解决接受域特征中共享注意权重参数的问题,提高特征提取能力,在主干中引入了接受域注意卷积和基于集中的注意模块(CBAM)注意机制,在通道和空间维度上增加了注意权重。通过在特征金字塔池层中引入大的可分离核注意,增加了不同层次特征之间的信息融合。添加具有丰富小目标语义信息的特征层,以改进颈部结构。使用inner-IoU损失函数来改进MPDIoU(基于最小点距离的IoU)函数,并使用inner-MPDIoU代替原始损失函数来增强对困难样本的学习能力。实验结果表明,改进的YOLOv8s模型在VisDrone数据集上分别将mAP、P和R提高了16.1%、9.3%和14.9%,性能超过了YOLOv 8m,可以有效地应用于无人飞行器视觉检测任务。

关键词: 无人机(UAV), 小目标检测, YOLOv8, 感受性场注意, 大可分离内核关注