电气工程与系统科学>图像和视频处理
职务: Mamba-UNet:用于医学图像分割的UNet-Like纯视觉Mamba
摘要: 在医学图像分析的最新进展中,卷积神经网络(CNN)和视觉变换器(ViT)建立了重要的基准。 前者擅长通过卷积操作捕获局部特征,而后者通过利用自关注机制实现显著的全局上下文理解。 然而,这两种架构在有效地建模医学图像中的长程依赖性方面都存在局限性,这是精确分割的关键方面。 受Mamba体系结构的启发,我们提出了Mamba-UNet,这是一种新的体系结构,它将U-Net与Mamba在医学图像分割中的能力相结合。Mamba以其在处理长序列和全局上下文信息方面的熟练性而著称,并以状态空间模型(SSM)的计算效率提高。 Mamba-UNet采用纯Visual Mamba(VMamba)的编码器-解码器结构,并融入跳跃连接,以跨网络的不同规模保存空间信息。此设计有助于全面的特征学习过程,捕获医学图像中复杂的细节和更广泛的语义上下文。 我们在VMamba块中引入了一种新的集成机制,以确保编码器和解码器路径之间的无缝连接和信息流,从而提高分段性能。 我们在公开的ACDC MRI心脏分割数据集和Synapse CT腹部分割数据集上进行了实验。 结果表明,在相同的超参数设置下,Mamba-UNet在医学图像分割方面优于几种UNet。 源代码和基线实现可用。