计算机科学››2024,第51卷››问题(5): 125-133.数字对象标识:10.11896/jsjkx.230300018

计算机图形学&多媒体 • 上一篇   下一篇

基于特征注意力提纯的显著性目标检测模型

白雪飞1,申悟呈1,王文剑1,2  

  1. 1山西大学计算机与信息技术学院 太原 030006
    2计算智能与中文信息处理教育部重点实验室(山西大学) 太原 030006
  • 收稿日期:2023-03-02 修回日期:2023-08-17 出版日期:2024-05-15 发布日期:2024-05-08
  • 通讯作者:王文剑(wjwang@sxu.edu.cn)
  • 作者简介:(baixuefei@sxu.edu.cn)
  • 基金资助:
    国家自然科学基金(61703252,U21A205136207615462276161);山西省重点研发项目(202102150401013);山西省回国留学人员科研资助项目(2022-008)

基于特征注意净化的显著目标检测

白雪飞1、沈武成1,王文健1,2  

  1. 1山西大学计算机与信息技术学院,太原030006
    2教育部计算智能与中文信息处理重点实验室(山西大学),太原030006
  • 收到:2023-03-02 修订过的:2023-08-17 在线:2024-05-15 出版:2024-05-08
  • 关于作者:白雪飞,1980年生,博士,副教授,中共党员(22413M)。她的主要研究兴趣包括图像处理和机器学习。
    王文健,1968年生,博士,教授,中共党员(中共16143D号)。她的主要研究兴趣包括图像处理、机器学习和计算智能。
  • 支持单位:
    国家自然科学基金项目(61703252,U21A205136207615462276161)、山西省重点研发计划项目(202102150401013)和山西省学者委员会资助的研究项目(2022-008)。

摘要:近年来,显著性目标检测技术取得了巨大进展,其中如何选择并有效集成多尺度特征扮演了重要角色。针对现有特征集成方法可能导致的信息冗余问题,提出了一种基于特征注意力提纯的显著性检测模型。首先,在解码器中采用一个全局特征注意力引导模块(GAGM)对带有语义信息的深层特征进行注意力机制处理,得到全局上下文信息;然后,通过全局引导流将其送入解码器各层进行监督训练;最后,利用多尺度特征融合模块(FAM)对编码器提取出的多尺度特征与全局上下文信息进行有效集成,并在网格状特征提纯模块(MFPM)中进行进一步细化,以生成清晰、完整的显著图。在5个公开数据集上进行实验,结果表明,所提模型优于现有的其他显著性检测方法,并且处理速度快,当处理 320 × 320 尺寸的图像时,能以 30帧以上的速度运行。

关键词: 显著性目标检测, 注意力机制, 多尺度特征融合, 特征选择, 网格状特征提纯

摘要:近年来,显著目标检测技术取得了很大进展,如何选择和有效集成多尺度特征起着重要作用。针对现有特征集成方法可能导致的信息冗余问题,提出了一种基于特征注意细化的显著性检测模型。首先,在解码器中,使用全局特征注意力引导模块(GAGM),通过注意力机制处理具有语义信息的深层特征,获得全局上下文信息,然后通过全局引导流序列将这些信息发送到解码器的每一层进行监督。然后使用多尺度特征聚合模块(FAM)将编码器提取的多尺度特征与全局上下文信息有效集成,并在网格特征净化模块(MFPM)中进一步细化,以生成清晰完整的显著特征。在5个公共数据集上的实验结果表明,该模型优于现有的其他显著性目标检测方法。此外,我们的方法的处理速度也很快,在处理320×320图像时可以以30 FPS以上的速度运行。

关键词: 突出物体检测, 注意机制, 多尺度特征融合, 特征选择, 网格特征净化

中图分类号: 

  • TP391型
[1] 姜浩,王杰,袁Z,等。显著目标检测:一种区分性区域特征集成方法[C]//IEEE计算机视觉与模式识别会议论文集。IEEE,2013:2083-2090。
[2] 李杰,傅可,赵S,等。用于航空视频显著性有效估计的时空知识提取[J]。IEEE图像处理汇刊,2019,29:1902-1914。
[3] GE S,LI J,YE Q,et al.用lle-cnns在野外检测蒙面人脸[C]//IEEE计算机视觉与模式识别会议论文集.2017:2682-2690。
[4] 李晓霞,强军,刘伟杰,等.基于双主干网的雾中交通目标检测方法研究[J]。重庆工商大学学报(自然科学版),2023,40(4):25-34。。
[5] GAO Y,WANG M,TAO D,等.3-D基于超图分析的对象检索与再认识[J]。IEEE图像处理汇刊,2012,21(9):4290-4303。
[6] 姚强,龚霞。基于显著性引导的弱和半监督语义切分自关注网络[J]。IEEE接入,2020,8:14413-14423。
[7] 陈明明,米特拉·N·J,黄X,等.基于全局对比度的显著区域检测[J]。IEEE模式分析和机器智能汇刊,2014,37(3):569-582。
[8] 姜Z,DAVIS L S.子模块显著区域检测[C]//IEEE计算机视觉与模式识别会议论文集。IEEE,2013:2043-2050。
[9] 何仕,刘瑞伟,刘伟,等.超像素离散卷积神经网络在显著目标检测中的应用[J]。国际计算机视觉杂志,2015115:330-344。
[10] 李刚,于云。基于多尺度深度特征的视觉显著性[C]//IEEE计算机视觉和模式识别会议论文集。IEEE,2015:5455-5463。
[11] HOU Q,CHENG M M,HU X,等.基于短连接的深度监督显著目标检测[C]//IEEE计算机视觉与模式识别会议论文集。IEEE,2017:3203-3212。
[12] 刘恩,韩J.Dhsnet:用于显著目标检测的深度层次显著网络[C]//IEEE计算机视觉和模式识别会议论文集。IEEE,2016:678-686。
[13] 张旭,王涛,齐杰,等。用于显著目标检测的渐进注意引导递归网络[C]//IEEE计算机视觉与模式识别会议论文集。IEEE,2018:714-722。
[14] 吴忠,苏力,黄琼。快速准确检测显著目标的级联部分解码器[C]//IEEE/CVF计算机视觉和模式识别会议论文集。IEEE,2019:3907-3916。
[15] 赵涛,吴霞。用于显著性检测的金字塔特征注意网络[C]//IEEE/CVF计算机视觉和模式识别会议论文集。IEEE,2019:3085-3094。
[16] 张鹏,王德,卢赫,等.护身符:聚集多级卷积特征用于显著目标检测[C]//IEEE国际计算机视觉会议论文集。IEEE,2017:202-211。
[17] 林天勇,多拉·R·P,GIRSHICK R,等。用于目标检测的特征金字塔网络[C]//IEEE计算机视觉和模式识别会议论文集。IEEE,2017:2117-2125。
[18] LIU J J,HOU Q,CHENG M M,et al.一种用于实时显著对象检测的基于池的简单设计[C]//IEEE/CFF计算机视觉和模式识别会议论文集。IEEE,2019:3917-3926。
[19] TAN M,PANG R,LE Q V.Efficientdet:可扩展和高效的目标检测[C]//IEEE/CVF计算机视觉和模式识别会议论文集。IEEE,2020:10781-10790。
[20] 乔斯,陈立中,尤利尔A.检测器:用递归特征金字塔和可切换的atrous卷积检测对象[C]//IEEE/CVF计算机视觉和模式识别会议论文集。IEEE,2021:10213-10224。
[21]刘俊杰,HOU Q,LIU Z A,等.Poolnet+:探索显著对象检测中池的潜力[J]。IEEE模式分析和机器智能汇刊,2022,45(1):887-904。
[22]ZEILER M D,FERGUS R.可视化和理解con-volution网络[C]//计算机视觉-ECCV 2014:13第13届欧洲会议,瑞士苏黎世,第一部分13.施普林格,2014:818-833。
[23]胡J,沈L,孙G.挤压和激励网络[C]//IEEE计算机视觉和模式识别会议论文集。IEEE,2018:7132-7141。
[24]CHEN L C,PAPANDREOU G,SCHROFF F,等.基于反褶积的语义图像分割的再思考[J].arXiv:1706.055872017。
[25]GE S,ZHAO S,LI C,等.基于选择性知识提取的野外低分辨率人脸识别[J]。IEEE图像处理汇刊,2018,28(4):2051-2062。
[26]张凯,张C,李斯,等.基于进化知识蒸馏的学生网络学习[J]。IEEE视频技术电路和系统汇刊,2021,32(4):2251-2263。
[27]王Z,SIMONCELLI E P,BOVIK A C.用于图像质量评估的多尺度结构相似性[C]//第三届第七届信号、系统和计算机Asilomar会议,2003。IEEE,2003:1398-1402。
[28]王L,卢H,王Y,等.学习用图像级监督检测显著物体[C]//IEEE计算机视觉和模式识别会议论文集。IEEE,2017:136-145。
[29]颜强,徐磊,史杰,等.层次显著性检测[C]//IEEE计算机视觉与模式识别会议论文集。IEEE,2013:1155-1162。
[30]LI Y,HOU X,KOCH C等。显著对象分割的秘密[C]//IEEE计算机视觉和模式识别会议论文集。IEEE,2014:280-287。
[31]YANG C,ZHANG L,LU H,et al.基于图形流形排序的显著性检测[C]//IEEE计算机视觉与模式识别会议论文集。IEEE,2013:3166-3173。
[32]HE K,ZHANG X,REN S,et al.用于图像识别的深度残差学习[C]//IEEE计算机视觉与模式识别会议论文集。IEEE,2016:770-778。
[33]张明,刘涛,朴毅,等.Auto-msfnet:搜索多尺度融合网络用于显著目标检测[C]//第29届ACM国际多媒体会议的进程。计算机协会。2021:667-676。
[34]吴忠,苏力,黄琦.显著目标检测的分解与完备网络[J]。IEEE图像处理汇刊,2021,30:6226-6239。
[35]刘恩,张恩,万凯,等.视觉显著性变换器[C]//IEEE/CVF国际计算机视觉会议论文集.2021:4722-4732。
[36]赵Z,夏C,谢C,等.快速准确检测显著目标的互补三边解码器[C]//第29届ACM国际多媒体会议论文集。计算机协会,2021:4967-4975。
[37]PANG Y,ZHAO X,ZHANG L,et al.用于显著目标检测的多尺度交互网络[C]//IEEE/CVF计算机视觉和模式识别会议论文集。IEEE,2020:9413-9422。
[38]魏J,王S,黄Q.F网络:突出目标检测的融合、反馈和聚焦[C]//AAAI人工智能会议论文集。AAAI,2020:12321-2328。
[39]ZHAO X,PANG Y,ZHANG L,et al.抑制与平衡:用于显著对象检测的简单门控网络[C]//计算机视觉-ECCV 2020:16欧洲会议,英国格拉斯哥,第二部分16.施普林格,2020:35-51。
[40]MOHAMMADI S,NOORI M,BAHRI A,等.CAGNet:显著目标检测的内容软件指南[J]。模式识别,2020103:107303。
[41]方X,朱J,邵X,等.LC3Net:用于显著目标检测的梯形上下文相关互补网络[J]。基于知识的系统,2022242:108372。
[42]秦X,张Z,黄C,等.Basnet:边界感知显著目标检测[C]//IEEE/CVF计算机视觉与模式识别会议论文集。IEEE,2019:7479-7489。
[43]赵J X,刘J J,范德平,等.EGNet:用于显著目标检测的边缘制导网络[C]//IEEE/CVF国际计算机视觉会议论文集。IEEE,2019:8779-8788。
[44]刘恩,韩J,杨美华.皮卡内特:学习像素级上下文注意用于显著性检测[C]//IEEE计算机视觉和模式识别会议论文集。IEEE,2018:3089-3098。
已查看
全文


摘要

引用

  共享   
  讨论   
找不到建议阅读的文章!