Xformer: Hybrid X-Shaped Transformer for Image Denoising

Zhang, Jiale; Zhang, Yulun; Gu, Jinjin; Dong, Jiahua; Kong, Linghe; Yang, Xiaokang

计算机科学>计算机视觉和模式识别

arXiv公司：2303.06440（cs）

【于2023年3月11日提交(第1版)，上次修订日期：2024年2月25日（本版本，v2）]

标题：Xformer：用于图像去噪的混合X形变换器

作者：张嘉乐,张玉伦,顾锦锦（Jinjin Gu）,嘉华洞,凌河港,杨晓康

查看PDF HTML（实验性）

摘要：本文提出了一种混合X形视觉变换器Xformer，该变换器在图像去噪方面具有显著的性能。我们探索从不同范围加强代币的全球代表性。具体来说，我们采用了两种类型的变压器块。空间方面的Transformer块跨空间维度定义的标记执行细粒度的本地补丁交互。channel-wise Transformer块跨通道维度定义的标记执行直接全局上下文交互。基于并发网络结构，我们设计了两个分支来实现这两种交互方式。在每个分支中，我们使用编码器-解码器架构来捕获多尺度特征。此外，我们建议使用双向连接单元（BCU）来耦合这两个分支的学习表示，同时提供增强的信息融合。联合设计使我们的Xformer能够在空间和通道维度上进行全局信息建模。大量实验表明，Xformer在可比较的模型复杂度下，在合成和真实图像去噪任务中取得了最先进的性能。我们还提供代码和模型此https URL.

评论：	接受ICLR 2024。代码和型号可在此https URL
学科：	计算机视觉和模式识别（cs.CV）
引用为：	arXiv公司：2303.06440[cs.CV]
	（或 arXiv:2303.06440v2[cs.CV]对于此版本）
	https://doi.org/10.48550/arXiv.2303.06440

提交历史记录

发件人：张嘉乐[查看电子邮件]
[第1版]2023年3月11日星期六16:32:09 UTC（4056 KB）
[版本2]2024年2月25日星期日03:29:01 UTC（16925 KB）

计算机科学>计算机视觉和模式识别

标题：Xformer：用于图像去噪的混合X形变换器

提交历史记录

访问纸张：

参考文献和引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目

计算机科学>计算机视觉和模式识别

标题：Xformer：用于图像去噪的混合X形变换器

提交历史记录

访问纸张：

参考文献和引文

BibTeX格式的引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目