计算机应用》唯一官方网站››2024第44卷››问题(5): 1588-1596.内政部:10.11772/j.issn.1001-9081.2023050636

(一)   

基于全局依赖变压器的图像超分辨率网络

刘子涵(),周登文刘玉铠  

  1. 华北电力大学 控制与计算机工程学院,北京 102206
  • 收稿日期:2023-05-23年 收益率:2023-08-31 接受日期:2023-09-13 日本:2023-09-19年 出版日期:2024-05-10
  • 通讯作者:刘子涵
  • 作者简介:周登文(1965—),男,湖北黄梅人,教授,硕士,主要研究方向:图像去噪、图像超分辨率
    刘玉铠(1996—),男,河北衡水人,硕士研究生,主要研究方向:深度学习、计算机视觉。
    第一联系人:刘子涵(1997—),男,河北石家庄人,硕士研究生,主要研究方向:深度学习、计算机视觉

基于全局依赖变换的图像超分辨率网络

刘子汉(),周登文刘玉凯  

  1. 华北电力大学控制与计算机工程学院,北京102206
  • 收到:2023-05-23年 修订过的:2023-08-31 认可的:2023-09-13 在线:2023-09-19 出版:2024-05-10
  • 联系人:刘子汉
  • 关于作者:周登文,1965年生,硕士,教授。他的研究兴趣包括图像去噪、图像超分辨率。
    刘玉凯,1996年出生,硕士研究生。他的研究兴趣包括深度学习、计算机视觉。

摘要:

目前,基于深度学习的图像超分辨网络主要由卷积实现。相较于传统的卷积神经网络(CNN),变压器在图像超分辨率任务中的主要优势是它的长距离依赖建模能力;然而大多数基于变压器的图像超分辨率模型在参数量小、网络层数少的情况下无法建立全局依赖,限制了模型的性能。为了在超分辨率网络中建立全局依赖,提出了基于全局依赖变压器的图像超分辨率网络(GDTSR)专业人士(RSAWB)它的内部轴向窗口变压器残差层利用轴向窗口和自注意力,可以使每个像素与整个特征图建立起全局依赖。此外,目前大多数图像超分辨率模型的超分辨率图像重建模块都由卷积组成,为了动态整合提取到的特征信息,结合变压器与卷积,共同重建超分辨率图像。实验结果表明,GDTSR Set5、Set14、B100、Urban100和Manga109上的测试结果中,3个倍数(×2××4)信息(PSNR)和可靠性(SSIM)均达到了最优,特别是在大尺寸图像的城市100和Manga109数据集上模型性能的提升尤为明显。

关于: 图像超分辨率, 变压器, 自注意力, 全局依赖, 轴向窗口

摘要:

目前,基于深度学习的图像超分辨率网络主要是通过卷积实现的。与传统的卷积神经网络(CNN)相比,Transformer在图像超分辨率任务中的主要优势在于其远程相关性建模能力。然而,大多数基于Transformer的图像超分辨率模型无法建立参数小、网络层少的全局相关性,这限制了模型的性能。为了在超分辨率网络中建立全局相关性,提出了一种基于全局相关性变换器(GDTSR)的图像超分辨率网络。它的主要组成部分是残留方形轴向窗口块(RSAWB),在Transformer残留层中,使用轴向窗口和自聚焦使每个像素全局依赖于整个特征图。此外,目前大多数图像超分辨率模型的超分辨率图像重建模块都是由卷积组成的。为了对提取的特征信息进行动态集成,将Transformer和卷积相结合,共同重建超分辨率图像。实验结果表明,在Set5、Set14、B100、Urban100和Manga109五个标准测试集上,GDTSR的峰值信噪比(PSNR)和结构相似性指数(SSIM)对于三个倍数是最优的(×2××4)在大型数据集Urban100和Manga109上,性能改进尤其明显。

关键词: 图像超分辨率, 变压器, 自我关注, 全局依赖性, 轴向窗

中图分类号: