研究论文

用于图像超分辨率的高效双注意变换器

作者：
Soobin公园

韩国汉城汉阳大学

韩国汉城汉阳大学

https://orcid.org/0000-0002-5373-2219
查看个人资料

,
Yuna Jeong女士

韩国汉城汉阳大学

韩国汉城汉阳大学

https://orcid.org/0009-0005-3780-8657
查看个人资料

,
Yong Suk Choi先生

韩国汉城汉阳大学

韩国汉城汉阳大学

https://orcid.org/0000-0002-9042-0599
查看个人资料

作者信息和声明

SAC’24：第39届ACM/SIGAPP应用计算研讨会会议记录2024年4月第963–970页https://doi.org/10.1145/365098.3635991

出版：2024年5月21日出版历史

SAC’24：第39届ACM/SIGAPP应用计算研讨会会议记录

第963–970页

摘要

基于计算效率高的局部窗口自关注的研究在图像超分辨率（SR）领域取得了积极进展，导致性能显著提高。然而，在最近的研究中，局部窗口的自我关注只关注空间维度，而没有充分考虑渠道维度。此外，在保持局部窗口自注意效率的同时提取全局信息在图像SR中仍然是一项具有挑战性的任务。为了解决这些问题，我们提出了一种新的高效双注意变换器（EDAT）。我们的EDAT提供了一个双注意块（DAB），它不仅可以探索位于不同空间位置的功能之间的相互依赖性，还可以探索不同通道之间的相互依存性。此外，我们提出了一种全局注意块（GAB），通过减小键和值的空间大小来实现高效的全局特征提取。我们的大量实验表明，我们的DAB和GAB是相辅相成的，表现出协同效应。此外，基于DAB和GAB这两个注意块，我们的EDAT在五个基准数据集上取得了最先进的结果。

工具书类

Marco Bevilacqua、Aline Roumy、Christine Guillemot和Marie Line Alberi Morel。2012.基于非负邻域嵌入的低复杂度单幅图像超分辨率。(2012).谷歌学者
尼古拉斯·卡里昂、弗朗西斯科·马萨、加布里埃尔·辛纳维、尼古拉斯·乌苏尼尔、亚历山大·基里洛夫和谢尔盖·扎戈鲁科。2020年，使用变压器进行端到端物体检测。在欧洲计算机视觉会议。施普林格，213-229。谷歌学者数字图书馆
陈汉廷、王云和、郭天宇、徐昌、邓一萍、刘振华、马思伟、徐春静、徐超和文高。2021.预训练图像处理变压器。在IEEE/CVF计算机视觉和模式识别会议记录。12299--12310.谷歌学者交叉引用
陈强、吴奇曼、王健、胡庆浩、胡涛、丁二瑞、程健和王京东。2022.混音器：跨窗口和维度的混音功能。在IEEE/CVF计算机视觉和模式识别会议记录。5249--5259.谷歌学者交叉引用
郑晨，张玉伦，顾金进，孔凌河，袁欣，等.2022。用于图像恢复的交叉聚合变压器。神经信息处理系统研究进展35 (2022), 25478--25490.谷歌学者
朱湘祥、田志天、王玉清、张波、任海兵、魏小林、夏华霞和沈春华。2021.双胞胎：重新审视视觉变换器中的空间注意设计。神经信息处理系统研究进展34 (2021), 9355--9366.谷歌学者
戴涛、蔡建瑞、张永兵、夏树涛和张磊。2019.用于单图像超分辨率的二阶注意网络。在IEEE/CVF计算机视觉和模式识别会议记录。11065--11074.谷歌学者交叉引用
丁明宇（Mingyu Ding）、肖斌（Bin Xiao）、诺埃尔·科迪拉（Noel Codella）、罗萍（Ping Luo）、王京东（Jingdong Wang）和卢远（Lu Yuan）。2022.吊杆：双注意视觉变压器。在欧洲计算机视觉会议。施普林格，74-92。谷歌学者数字图书馆
Chao Dong、Chen Change Loy、Kaiming He和Xiaou Tang。2014.学习用于图像超分辨率的深度卷积网络。在2014年9月6日至12日在瑞士苏黎世举行的第13届欧洲计算机视觉会议，《会议记录》，第四部分，第13页。施普林格，184-199。谷歌学者
Chao Dong、Chen Change Loy、Kaiming He和Xiaou Tang。2015。使用深度卷积网络的图像超分辨率。IEEE模式分析和机器智能事务38, 2 (2015), 295--307.谷歌学者
Alexey Dosovitskiy、Lucas Beyer、Alexander Kolesnikov、Dirk Weissenborn、Xiaohua Zhai、Thomas Unterthiner、Mostafa Dehghani、Matthias Minderer、Georg Heigold、Sylvain Gelly等人，2020。一幅图像相当于16x16个单词：用于大规模图像识别的变形金刚。arXiv预印arXiv:2010.11929(2020).谷歌学者
黄家斌、阿布谢克·辛格和纳伦德拉·阿胡贾。2015.改造后的自拍相机的单图像超分辨率。在IEEE计算机视觉和模式识别会议记录。5197--5206.谷歌学者交叉引用
Jiwon Kim、Jung Kwon Lee和Kyong Mu Lee。2016.使用非常深的卷积网络实现精确的图像超分辨率。在IEEE计算机视觉和模式识别会议记录。1646--1654.谷歌学者交叉引用
Diederik P Kingma和Jimmy Ba.2014年。亚当：一种随机优化方法。arXiv预打印arXiv:1412.6980(2014).谷歌学者
Christian Ledig、Lucas Theis、Ferenc Huszár、Jose Caballero、Andrew Cunningham、Alejandro Acosta、Andrew-Aitken、Alykhan Tejani、Johannes Totz、Zehan Wang等，2017年。使用生成对抗网络的真实感照片单图像超分辨率IEEE计算机视觉和模式识别会议记录。4681--4690.谷歌学者交叉引用
梁静云、曹洁璋、孙国磊、张凯、吕克·范古尔和拉杜·蒂莫夫特。2021.Swinir：使用swin变压器恢复图像。在IEEE/CVF计算机视觉国际会议论文集。1833--1844.谷歌学者交叉引用
Bee Lim、Sanghyun Son、Heewon Kim、Seungjun Nah和Kyoung Mu Lee。2017.增强的深度残差网络用于单图像超分辨率。在IEEE计算机视觉和模式识别研讨会会议记录。136--144.谷歌学者交叉引用
刘泽、林宇通、曹岳、胡涵、魏一轩、张正、林士泰和郭白宁。2021.Swin transformer：使用移动窗口的分层视觉变换器。在IEEE/CVF计算机视觉国际会议论文集。10012--10022.谷歌学者交叉引用
大卫·马丁（David Martin）、查尔斯·福克斯（Charless Fowlkes）、多伦·塔尔（Doron Tal）和吉坦德拉·马利克（Jitendra Malik）。2001.人类分割自然图像数据库及其在评估分割算法和测量生态统计中的应用。在第八届IEEE计算机视觉国际会议论文集。ICCV 2001，第2卷。IEEE，416--423。谷歌学者交叉引用
松井裕介、伊藤晃太、荒木裕二、藤本阿祖马、小川彻、山崎俊彦和爱泽清纯。2017.使用manga109数据集进行基于草图的漫画检索。多媒体工具和应用程序76 (2017), 21811--21838.谷歌学者数字图书馆
梅依群、范玉晨和周玉谦。2021.非局部稀疏关注的图像超分辨率。在IEEE/CFF计算机视觉与模式识别会议论文集。3517--3526.谷歌学者交叉引用
本牛、文伟磊、任文琪、张祥德、杨连平、王淑珍、张开浩、曹晓春和沈海峰。2020年，通过整体关注网络实现单图像超分辨率计算机愿景—ECCV 2020：第16届欧洲会议，英国格拉斯哥，2020年8月23日至28日，会议记录，第十二部分16。施普林格，191-207。谷歌学者
Adam Paszke、Sam Gross、Soumith Chintala、Gregory Chanan、Edward Yang、Zachary DeVito、Zeming Lin、Alban Desmaison、Luca Antiga和Adam Lerer。2017.pytorch中的自动区分。(2017).谷歌学者
Radu Timofte、Eirikur Agustsson、Luc Van Gool、Ming-Hsuan Yang和Lei Zhang。2017年，Ntire 2017单图像超分辨率挑战：方法和结果。在IEEE计算机视觉和模式识别研讨会会议记录。114--125.谷歌学者交叉引用
王文孝、陈伟、邱启波、陈龙、吴伯喜、林斌、何晓飞和刘伟。2023.Crossformer++：一款多功能视觉变换器，专注于跨尺度注意力。arXiv预打印arXiv:2303.06908(2023).谷歌学者
王文海、谢恩泽、李翔、范登平、宋凯涛、丁亮、桐庐、罗萍和凌绍。2021.金字塔视觉变换器：无卷积密集预测的通用主干。在IEEE/CVF计算机视觉国际会议论文集。568--578.谷歌学者交叉引用
王新涛、柯瑜、吴世祥、顾金进、刘一浩、赵东、于乔和陈昌乐。2018年，Esrgan：增强超分辨率生成对抗网络。在欧洲计算机视觉会议（ECCV）研讨会会议记录。0--0.谷歌学者
Zhou Wang、Alan C Bovik、Hamid R Sheikh和Eero P Simoncelli。2004年。图像质量评估：从错误可见性到结构相似性。IEEE图像处理事务13, 4 (2004), 600--612.谷歌学者数字图书馆
Syed Waqas Zamir、Aditya Arora、Salman Khan、Munawar Hayat、Fahad Shahbaz Khan和Ming-Hsuan Yang。2022.还原器：用于高分辨率图像还原的高效变压器。在IEEE/CVF计算机视觉和模式识别会议记录。5728--5739.谷歌学者交叉引用
罗曼·泽德、迈克尔·埃拉德和马坦·普洛特。2012年。关于使用稀疏表示的单幅图像放大。在曲线和曲面：第七届国际会议，法国阿维尼翁，2010年6月24日至30日，修订论文集7。施普林格，711-730。谷歌学者数字图书馆
张嘉乐、张玉伦、顾金进、张永兵、孔凌河、袁欣。2022.使用引人注目的可伸缩变压器进行精确的图像恢复。arXiv预打印arXiv:2210.01427(2022).谷歌学者
张玉伦、李坤鹏、李凯、王立晨、钟碧能和傅云。2018年。使用非常深的剩余通道注意网络的图像超分辨率。在欧洲计算机视觉会议记录。286--301.谷歌学者数字图书馆
张玉伦、田亚鹏、余刚、钟彬能、傅云。2018.图像超分辨率剩余密集网络。在IEEE计算机视觉和模式识别会议记录。2472--2481.谷歌学者交叉引用

索引术语

用于图像超分辨率的高效双注意变换器
1. 计算方法
  1. 计算机图形
    1. 图像处理
      1. 图像处理

建议

用于高效图像超分辨率的非局部空间和全局信道变压器
多媒体建模
摘要
基于变换的方法在图像超分辨率（SR）方面取得了良好的突破，因为它具有捕获图像中长距离相关性的强大能力。然而，这些方法主要集中于捕捉空间交互。。。
阅读更多信息
用于图像字幕的双空间归一化变换器
摘要
自我注意模块在图像字幕中占据主导地位。然而，当前的自我关注模块没有充分考虑图像中对象之间的空间相关性，很容易受到分布偏移的影响。在这项工作中，我们的目标是。。。
集锦
- 为了增强空间相关性，提出了一种空间增强注意力（SEA）模块。
- 提出了一种门控规范化注意（GNA）模块来固定分布。
- SEA和GNA模块应用于Transformer架构，用于图像处理。。。
阅读更多信息
用于图像超分辨率的信息增长注意力网络
MM’21：第29届ACM国际多媒体会议记录

众所周知，与低分辨率（LR）图像相比，高分辨率（HR）图像包含更多生产信息，因此图像超分辨率（SR）满足信息增长过程。考虑到财产，我们试图。。。
阅读更多信息

登录选项

检查您是否可以通过登录凭据或您的机构访问本文。

完全访问权限

获取此出版物

发布于
SAC’24：第39届ACM/SIGAPP应用计算研讨会会议记录
2024年4月
1898页
国际标准图书编号：9798400702433
内政部：10.1145/3605098
主席：
洪纪曼,
项目主席：
朱元公园
版权所有©2024版权归所有人/作者所有。授权给ACM的出版权。
如果复制品不是为了盈利或商业利益而制作或分发的，并且复制品的第一页载有本通知和完整引文，则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重作者以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布，在服务器上发布或重新发布到列表，需要事先获得特定许可和/或付费。从请求权限[电子邮件保护].
赞助商
合作中
出版商
计算机协会
美国纽约州纽约市
出版历史
- 出版：2024年5月21日
检查更新
作者标记
图像超分辨率
低层视觉
视觉变压器
自我关注
计算机视觉
限定符
- 研究论文
会议

接受率
总体验收率1,650属于6,669提交，25%
资金来源
其他指标
查看文章指标

文章指标
- 0
  引文总数
  查看引文
- 8
  总下载次数
- 下载次数（过去12个月）8
- 下载次数（最近6周）8
其他指标
查看作者指标
引用人
本出版物尚未被引用

PDF格式

以PDF文件的形式查看或下载。

PDF格式

电子阅读器

使用eReader联机查看。

电子阅读器

用于图像超分辨率的高效双注意变换器

SAC’24：第39届ACM/SIGAPP应用计算研讨会会议记录

摘要

工具书类

引用人

索引术语

建议

用于高效图像超分辨率的非局部空间和全局信道变压器

用于图像字幕的双空间归一化变换器

用于图像超分辨率的信息增长注意力网络

评论

登录选项

完全访问权限

发布于

赞助商

合作中

出版商

出版历史

检查更新

作者标记

限定符

会议

接受率

资金来源

其他指标

文章指标

其他指标

引用人

PDF格式

电子阅读器

数字版

解说词

用于图像超分辨率的高效双注意变换器

SAC’24：第39届ACM/SIGAPP应用计算研讨会会议记录

摘要

工具书类

引用人

索引术语

建议

用于高效图像超分辨率的非局部空间和全局信道变压器

用于图像字幕的双空间归一化变换器

用于图像超分辨率的信息增长注意力网络

评论

登录选项

完全访问权限

发布于

赞助商

合作中

出版商

出版历史

检查更新

作者标记

限定符

会议

接受率

资金来源

文章指标

其他指标

PDF格式

电子阅读器

数字版

共享此出版物链接

在社交媒体上分享