基于矢量IOU的无人机空中场景目标检测
摘要
1.简介
我们提出了VIOU损失,它简化了计算并提高了边界框的回归精度。 我们提出了一种新的特征融合网络(PFFN),它充分融合了浅层特征和深层特征,解决了多尺度目标的问题,提高了小目标的检测能力。 我们提出了一种非对称解耦头,它提高了网络分类和定位相似和重叠对象的能力。
2.相关工作
2.1. 回归损失函数
2.2. 颈部
2.3. 检测头
3.方法
3.1. VIOU损失
3.2. 渐进式特征融合网络
3.3. 非对称解耦磁头
4.实验
4.1. VIOU性能比较实验
4.2. 颈部网络特征融合特性的比较实验
4.3. 烧蚀实验
4.4. 不同探测器的比较
4.5. 目视分析
5.结论
作者贡献
基金
机构审查委员会声明
知情同意书
数据可用性声明
利益冲突
工具书类
Girshick,R。; Donahue,J。; Darrell,T。; Malik,J.丰富的特征层次用于准确的对象检测和语义分割。 arXiv公司 2013 ,arXiv:1311.2524。 [ 谷歌学者 ] [ 交叉参考 ] 吉尔西克,R·法斯特R-CNN。 2015年12月7-13日,智利圣地亚哥,IEEE计算机视觉国际会议(ICCV)会议记录。 [ 谷歌学者 ] 任,S。; He,K。; Girshick,R。; Sun,J.Faster R-CNN:利用区域建议网络实现实时目标检测。 arXiv公司 2015 ,arXiv:1506.01497。 [ 谷歌学者 ] [ 交叉参考 ] [ 绿色版本 ] 雷德蒙,J。; 迪瓦拉,S。; 吉尔希克,R。; Farhadi,A.你只看一次:统一的实时目标检测。 2016年6月27日至30日在美国内华达州拉斯维加斯举行的2016 IEEE计算机视觉和模式识别会议(CVPR)会议记录; 第779–788页。 [ 谷歌学者 ] [ 交叉参考 ] [ 绿色版本 ] 雷德蒙,J。; Farhadi,A.YOLOv3:增量改进。 arXiv公司 2018 ,arXiv:1804.02767。 [ 谷歌学者 ] Bochkovskiy,A。; 王,C.Y。; Liao,H.Y.M.YOLOv4:目标检测的最佳速度和准确性。 arXiv公司 2020 ,arXiv:2004.10934。 [ 谷歌学者 ] Jocher,G.Stoken Yolo第5版。 在线可用: https://github.com/ultralytics/yolov5/releases/tag/v6.0 (2021年10月12日访问)。 李,C。; 李,L。; 姜浩。; 翁,K。; 耿毅。; 李,L。; Ke,Z。; 李强。; Cheng,M。; 聂,W。; 等。YOLOv6:工业应用的单阶段对象检测框架。 arXiv公司 2022 ,arXiv:2209.02976。 [ 谷歌学者 ] 雷德蒙,J。; Farhadi,A.YOLO9000:更好、更快、更强。 2017年7月21日至26日在美国夏威夷州火奴鲁鲁举行的2017 IEEE计算机视觉和模式识别会议(CVPR)会议记录; 第6517–6525页。 [ 谷歌学者 ] [ 交叉参考 ] [ 绿色版本 ] Wang,C.Y。; Bochkovskiy,A。; Liao,H.Y.M.YOLOv7:可训练的免费袋装食品为实时目标探测器创造了新的技术水平。 arXiv公司 2022 ,arXiv:2207.02696。 [ 谷歌学者 ] Ultralytics,G.J.Yolo v8。 在线可用: https://github.com/ultralytics/ultralytics.git (2023年1月9日访问)。 刘伟。; 安格洛夫,D。; Erhan,D。; 塞格迪,C。; 里德,S。; Fu,C.Y。; Berg,A.C.Ssd:单发多盒探测器。 2016年10月11日至14日,荷兰阿姆斯特丹,欧洲计算机视觉会议记录; 第21-37页。 [ 谷歌学者 ] Lin,T。; 戈亚尔,P。; 吉尔希克,R。; He,K。; Dollár,P.密集目标检测的焦距损失。 2017年IEEE国际计算机视觉会议(ICCV)会议记录,意大利威尼斯,2017年10月22日至29日; 第2999–3007页。 [ 谷歌学者 ] [ 交叉参考 ] [ 绿色版本 ] Duan,K。; Bai,S。; 谢林。; 齐,H。; 黄,Q。; Tian,Q.中心网:用于物体检测的关键点三元组。 2019年10月27日至11月2日在韩国首尔举行的IEEE/CVF计算机视觉国际会议记录; 第6569–6578页。 [ 谷歌学者 ] 丁,J。; 薛,N。; 夏,G.S。; Bai,X。; 杨伟(Yang,W.)。; Yang,M.Y。; Belongie,S。; 罗,J。; 达特库,M。; 佩利略,M。; 等,《航空图像中的目标检测:大尺度基准和挑战》。 arXiv公司 2021 ,arXiv:2102.12219。 [ 谷歌学者 ] [ 交叉参考 ] Shadab Malik,H。; 索比罗夫,I。; Mohamed,A.航空图像中的目标检测:是什么提高了准确性? arXiv公司 2022 ,arXiv:2201.08763。 [ 谷歌学者 ] 科云,O.C。; Keser,R.K。; 伊利诺伊州阿克卡亚。 B。; Töreyin,B.U.Focus-and-Detect:用于航空图像的小目标检测框架。 信号处理。 图像通信。 2022 , 104 , 116675. [ 谷歌学者 ] [ 交叉参考 ] 李,C。; Yang,T。; 朱,S。; 陈,C。; Guan,S.密度图引导航空图像中的目标检测。 IEEE/CVF计算机视觉和模式识别研讨会会议记录,美国华盛顿州西雅图,2020年6月14日至19日; 第190-191页。 [ 谷歌学者 ] Duan,C。; 魏,Z。; 张,C。; Qu,S。; Wang,H.粗粒度密度图引导的航空图像目标检测。 2021年10月11日至17日,加拿大不列颠哥伦比亚省蒙特利尔,IEEE/CVF国际计算机视觉会议记录; 第2789–2798页。 [ 谷歌学者 ] 朱,X。; 柳,S。; 王,X。; Zhao,Q.TPH-YOLOv5:基于变压器预测头的改进YOLOv5,用于无人机捕获场景中的目标检测。 arXiv公司 2021 ,arXiv:2108.11539。 [ 谷歌学者 ] 罗,X。; Wu,Y。; Zhao,L.YOLOD:无人机航空图像的目标检测方法。 远程传感器。 2022 , 14 , 3240. [ 谷歌学者 ] [ 交叉参考 ] 刘,H。; Mu,C。; Yang,R。; 他,Y。; Wu,N.基于UVA航空图像的目标检测算法研究。 2021年11月17日至19日,中国北京,2021年第七届IEEE网络智能与数字内容国际会议(IC-NIDC)论文集; 第122–127页。 [ 谷歌学者 ] [ 交叉参考 ] 李,Z。; 孙,S。; 李毅。; Sun,B。; 田,K。; 乔·L。; Lu,X.基于自适应ClusDet网络的航空图像目标检测方法。2021年IEEE第21届国际通信技术会议论文集,中国天津,2021年10月13-16日; 第1091–1096页。 [ 谷歌学者 ] [ 交叉参考 ] 曹,C。; 吴杰。; 曾,X。; Z.Feng。; 王,T。; 严,X。; 吴,Z。; 吴琼。; 黄,Z。基于卷积神经网络的航空遥感图像飞机和船舶检测研究。 传感器 2020 , 20 , 4696. [ 谷歌学者 ] [ 交叉参考 ] [ 公共医学 ] 郑,Z。; 王,P。; 刘伟。; 李,J。; Ye,R。; Ren,D.Distance-IoU损失:更快更好地学习边界盒回归。 美国纽约州纽约市AAAI人工智能会议记录,2020年2月7日至12日; 第34卷,第12993–13000页。 [ 谷歌学者 ] Ge,Z。; 刘,S。; Wang,F。; 李,Z。; Sun,J.YOLOX:2021年超越YOLO系列。 arXiv公司 2021 ,arXiv:2107.08430。 [ 谷歌学者 ] 朱,P。; Wen,L。; 杜,D。; 边,X。; 风扇,H。; 胡,Q。; Ling,H.探测和跟踪迎接无人机挑战。 IEEE传输。 模式分析。 机器。 智力。 2021 , 44 , 7380–7399. [ 谷歌学者 ] [ 交叉参考 ] 夏,G.S。; Bai,X。; 丁,J。; 朱,Z。; Belongie,S。; 罗,J。; 达特库,M。; 佩利略,M。; Zhang,L.DOTA:航空图像中目标检测的大尺度数据集。 2018年6月18日至22日,美国犹他州盐湖城,IEEE计算机视觉和模式识别(CVPR)会议记录。 [ 谷歌学者 ] 丁,J。; 薛,N。; Long,Y。; 夏,G.S。; Lu,Q.学习用于检测航空图像中定向对象的RoI变换器。 2019年6月16日至20日,美国加利福尼亚州长滩,IEEE计算机视觉和模式识别会议(CVPR)会议记录。 [ 谷歌学者 ] 周,D。; 方,J。; 宋,X。; 关,C。; 尹,J。; 戴,Y。; Yang,R.用于2D/3D对象检测的IoU损失。 2019年9月16日至19日,在加拿大魁北克市举行的2019年国际3D视觉会议记录中; 第85-94页。 [ 谷歌学者 ] Rezatofighi,H。; 佐伊,N。; Gwak,J。; Sadeghian,A。; 里德,I。; Savarese,S.并集上的广义交集:边界盒回归的度量和损失。 2019年6月15日至20日在美国加利福尼亚州长滩举行的IEEE/CVF计算机视觉和模式识别会议记录; 第658–666页。 [ 谷歌学者 ] 徐,C。; Wang,J。; 杨伟(Yang,W.)。; Yu,L.航空图像中微小目标检测的点距离。 《IEEE/CVF计算机视觉和模式识别会议论文集》,虚拟,2021年6月19-25日; 第1192-1201页。 [ 谷歌学者 ] 杨,Z。; 王,X。; Li,J.EIoU:基于VehicleNet神经网络的改进车辆检测算法。 《物理学杂志》。 Conf.序列号。 2021 , 1924 , 012001. [ 谷歌学者 ] [ 交叉参考 ] Gevorgyan,Z.SIoU Loss:边界盒回归的更强大学习。 arXiv公司 2022 ,arXiv:2205.12740。 [ 谷歌学者 ] He,J。; 埃尔法尼,S。; 马,X。; Bailey,J。; Chi,Y。; Hua,X.S.Alpha-IoU:边界盒回归中联盟损失的权力交叉家族。 arXiv公司 2021 ,arXiv:2110.13675。 [ 谷歌学者 ] He,K。; Gkioxari,G。; 美元,P。; Girshick,R.Mask R-CNN。 2017年10月22日至29日,意大利威尼斯,IEEE计算机视觉国际会议(ICCV)会议记录。 [ 谷歌学者 ] 蔡,Z。; Vasconcelos,N.Cascade R-CNN:深入研究高质量物体检测。 2018年IEEE/CVF计算机视觉和模式识别会议记录,美国犹他州盐湖城,2018年6月18日至22日; 第6154–6162页。 [ 谷歌学者 ] [ 交叉参考 ] [ 绿色版本 ] Lin,T。; 多拉,P。; Girshick,R。; He,K。; 哈里哈兰,B。; Belongie,S.特征金字塔网络用于目标检测。 2017年7月21日至26日在美国夏威夷州火奴鲁鲁举行的2017 IEEE计算机视觉和模式识别会议(CVPR)会议记录; 第936-944页。 [ 谷歌学者 ] [ 交叉参考 ] [ 绿色版本 ] 王凯。; Liew,J.H。; 邹毅。; 周,D。; Feng,J.PANet:使用原型对齐的少镜头图像语义分割。 在2019年10月27日至11月2日于大韩民国首尔举行的IEEE/CFF国际计算机视觉会议(ICCV)上。 [ 谷歌学者 ] 黄,W。; 李·G。; 陈,Q。; Ju,M。; Qu,J.CF2PN:基于遥感目标检测的跨尺度特征融合金字塔网络。 远程。 传感器。 2021 , 13 , 847. [ 谷歌学者 ] [ 交叉参考 ] 周,L。; Rao,X。; 李毅。; 左,X。; 乔,B。; Lin,Y.一种基于密集特征融合路径聚合网络的航空图像轻型目标检测方法。 Isprs国际地理信息杂志。 2022 , 11 , 189. [ 谷歌学者 ] [ 交叉参考 ] 塔亚拉,H。; Chong,K.T.使用一级密集连接特征金字塔网络检测超高分辨率航空图像中的目标。 传感器 2018 , 18 , 3341. [ 谷歌学者 ] [ 交叉参考 ] [ 绿色版本 ] Tian,H。; 郑毅。; Jin,Z.改进的RetinaNet模型在航空图像小目标检测中的应用。 《IOP会议系列会议记录:地球与环境科学》,中国长沙,2020年9月18日至20日。 [ 谷歌学者 ] Hamoda,M.充气浸没式固定膜(ASFF)生物反应器的动力学分析。 水资源。 1989 , 23 , 1147–1154. [ 谷歌学者 ] [ 交叉参考 ] Ghiasi,G。; 林,T.Y。; Le,Q.V.NAS-FPN:学习用于对象检测的可伸缩特征金字塔体系结构。 2019年6月15日至20日,美国加利福尼亚州长滩,IEEE/CVF计算机视觉和模式识别(CVPR)会议记录。 [ 谷歌学者 ] Tan,M。; 庞,R。; Le,Q.V.Efficientdet:可扩展且高效的对象检测。 《IEEE/CVF计算机视觉和模式识别会议论文集》,美国华盛顿州西雅图,2020年6月13日至19日; 第10781–10790页。 [ 谷歌学者 ] 乔·S。; Chen,L.C.(法律顾问)。; Yuille,A.Detectors:使用递归特征金字塔和可切换的atrous卷积检测对象。 2021年6月20日至25日在美国田纳西州纳什维尔举行的IEEE/CVF计算机视觉和模式识别会议记录; 第10213–10224页。 [ 谷歌学者 ] 江,B。; 罗,R。; 毛,J。; 肖,T。; Jiang,Y.准确目标检测的定位置信度获取。 2018年9月8日至14日,德国慕尼黑,《欧洲计算机视觉会议记录》。 [ 谷歌学者 ] Song,G。; 刘,Y。; Wang,X.重访目标探测器中的兄弟头。 《IEEE/CVF计算机视觉和模式识别(CVPR)会议记录》,美国华盛顿州西雅图,2020年6月13日至19日。 [ 谷歌学者 ] Wang,C.Y。; 博奇科夫斯基,A。; Liao,H.Y.M.Scaled-YOLOv4:缩放跨阶段部分网络。在美国田纳西州纳什维尔举行的IEEE/CFF计算机视觉和模式识别会议(CVPR)上,2021年6月20-25日; 第13029–13038页。 [ 谷歌学者 ] Wu,Y。; 陈,Y。; 袁,L。; 刘,Z。; Wang,L。; 李,H。; Fu,Y.重新思考目标检测的分类和定位。 《IEEE/CVF计算机视觉和模式识别(CVPR)会议记录》,美国华盛顿州西雅图,2020年6月13日至19日。 [ 谷歌学者 ] Wang,J。; 宋,L。; 李,Z。; Sun,H。; Sun,J。; Zheng,N.使用全卷积网络进行端到端目标检测。IEEE/CVF计算机视觉和模式识别会议论文集,美国田纳西州纳什维尔,2021年6月20日至25日; 第15849–15858页。 [ 谷歌学者 ] 陈,Q。; Wang,Y。; Yang,T。; 张,X。; 程,J。; Sun,J.你看起来只是一个级别的特征。 2021年6月20日至25日在美国田纳西州纳什维尔举行的IEEE/CVF计算机视觉和模式识别(CVPR)会议记录; 第13039–13048页。 [ 谷歌学者 ]