×

StackGAN公司

swMATH编号: 42521
软件作者: 张涵、徐涛、李洪生、张少婷、王晓刚、黄晓蕾、Dimitris Metaxas
描述: StackGAN:使用堆叠生成对抗网络的文本到照片真实感图像合成。从文本描述合成高质量图像是计算机视觉中的一个挑战性问题,具有许多实际应用。现有的文本到图像方法生成的样本可以大致反映给定描述的含义,但它们没有包含必要的细节和生动的对象部分。在本文中,我们提出了堆叠生成对抗网络(Stacked Generative Adversarial Networks,StackGAN)来生成基于文本描述的256x256照片真实感图像。我们通过草图重定义过程将难题分解为更易于管理的子问题。第一阶段GAN根据给定的文本描述绘制对象的原始形状和颜色,生成第一阶段低分辨率图像。第二阶段GAN将第一阶段结果和文本描述作为输入,并生成具有照片真实感细节的高分辨率图像。它能够纠正第一阶段结果中的缺陷,并通过细化过程添加引人注目的细节。为了提高合成图像的多样性并稳定条件GAN的训练,我们引入了一种新的条件增强技术,该技术鼓励潜在条件流形的平滑性。在基准数据集上进行的大量实验和与现有技术的比较表明,该方法在生成基于文本描述的照片真实感图像方面取得了显著的改进。
主页: https://arxiv.org/abs/1612.03242
源代码:  https://github.com/hanzhanggit/StackGAN
相关软件: Wasserstein GAN公司;到岸价格;InfoGAN公司;像素x像素;CycleGAN公司;亚当;f-甘氨酸;ImageNet公司;比根;DualGAN公司;MS-COCO公司;斯塔根;MNIST公司;DARTS公司;LR-GAN公司;低碳所;蟒蛇;收件人:GAN;Caltech-UCSD鸟类;SeqGAN公司
引用于: 11文件

按年份列出的引文