计算机工程与应用››2024,第60卷››问题(7): 212-221.内政部:10.3778/j.issn.1002-8331.2211-0196

图形图像处理 • 上一篇   下一篇

结合混合注意力的双判别生成对抗网络

王磊,杨军,张驰宇,代在燕  

  1. 四川师范大学 计算机科学学院,成都 610101
  • 出版日期:2024-04-01 发布日期:2024-04-01

具有双重鉴别器和混合注意的生成性对抗网络

王磊、杨军、张驰宇、戴再燕  

  1. 四川师范大学计算机科学学院,成都610101
  • 在线:2024-04-01 出版:2024-04-01

摘要:图像生成任务中,如何提升生成图片的质量是一个关键问题。当前,生成对抗网络采用的多层卷积结构存在局部性归纳偏置的问题,无法准确聚焦关键信息,导致图像特征丢失严重,生成图像效果较差。为此,提出了结合混合注意力的双判别生成对抗网络(DDMA-GAN)设计了一种混合注意力机制,利用通道注意力和空间注意力模块,从两个维度充分捕获图像特征信息;为解决单判别器存在判别误差的问题,提出一种双判别器结构,使用融合系数将判定结果融合,使回传参数更具客观性,并嵌入数据增强模块,进一步提升模型鲁棒性;采用铰链损失作为模型损失函数,最大化真假样本间的距离,明确决策边界。模型在公开数据集LSUN和CelebA上进行验证,实验结果表明,DDMA-GAN公司生成的图像更加真实,纹理细节更加丰富,其FID和MMD值均显著降低且优于其他常见模型,证明了模型的有效性。

关键词: 图像生成, 卷积神经网络, 混合注意力, 双判别器, 数据增强, 生成对抗网络

摘要:在图像生成任务中,如何提高生成图像的质量是一个关键问题。目前,GAN采用的多层卷积结构存在局部诱导偏差的问题,无法集中于关键信息,导致在训练过程中丢失图像特征。本文提出了一种具有双重鉴别器和混合注意力的生成性对抗网络模型,称为DDMA-GAN。首先,DDMA-GAN设计了一种混合注意力机制,利用通道注意力和空间注意力来充分捕捉图像特征信息。其次,为了解决单鉴频器的鉴频误差问题,提出了一种双鉴频器结构。融合系数用于融合判断结果,使返回的参数更加客观,并嵌入数据增强模块,进一步提高模型的鲁棒性。最后,利用铰链损失作为损失函数,最大化真假样本之间的距离。该模型在公共数据集LSUN和CelebA上进行了验证。实验结果表明,DDMA-GAN在经典数据集上生成的图像更真实。DDMA-GAN的FID和MMD显著降低,充分说明了模型的有效性。

关键词: 图像生成, 卷积神经网络(CNN), 注意力混合, 双重鉴别器, 数据增强, 生成性对抗网络