计算机科学>计算机视觉和模式识别
标题: Xformer:用于图像去噪的混合X形变换器
摘要: 本文提出了一种混合X形视觉变换器Xformer,该变换器在图像去噪方面具有显著的性能。 我们探索从不同范围加强代币的全球代表性。 具体来说,我们采用了两种类型的变压器块。 空间方面的Transformer块跨空间维度定义的标记执行细粒度的本地补丁交互。 channel-wise Transformer块跨通道维度定义的标记执行直接全局上下文交互。 基于并发网络结构,我们设计了两个分支来实现这两种交互方式。 在每个分支中,我们使用编码器-解码器架构来捕获多尺度特征。 此外,我们建议使用双向连接单元(BCU)来耦合这两个分支的学习表示,同时提供增强的信息融合。 联合设计使我们的Xformer能够在空间和通道维度上进行全局信息建模。 大量实验表明,Xformer在可比较的模型复杂度下,在合成和真实图像去噪任务中取得了最先进的性能。 我们还提供代码和模型 此https URL .