StackGAN公司 swMATH编号: 42521 软件作者: 张涵、徐涛、李洪生、张少婷、王晓刚、黄晓蕾、Dimitris Metaxas 描述: StackGAN:使用堆叠生成对抗网络的文本到照片真实感图像合成。从文本描述合成高质量图像是计算机视觉中的一个挑战性问题,具有许多实际应用。现有的文本到图像方法生成的样本可以大致反映给定描述的含义,但它们没有包含必要的细节和生动的对象部分。在本文中,我们提出了堆叠生成对抗网络(Stacked Generative Adversarial Networks,StackGAN)来生成基于文本描述的256x256照片真实感图像。我们通过草图重定义过程将难题分解为更易于管理的子问题。第一阶段GAN根据给定的文本描述绘制对象的原始形状和颜色,生成第一阶段低分辨率图像。第二阶段GAN将第一阶段结果和文本描述作为输入,并生成具有照片真实感细节的高分辨率图像。它能够纠正第一阶段结果中的缺陷,并通过细化过程添加引人注目的细节。为了提高合成图像的多样性并稳定条件GAN的训练,我们引入了一种新的条件增强技术,该技术鼓励潜在条件流形的平滑性。在基准数据集上进行的大量实验和与现有技术的比较表明,该方法在生成基于文本描述的照片真实感图像方面取得了显著的改进。 主页: https://arxiv.org/abs/1612.03242 源代码: https://github.com/hanzhanggit/StackGAN 相关软件: Wasserstein GAN公司;到岸价格;InfoGAN公司;像素x像素;CycleGAN公司;亚当;f-甘氨酸;ImageNet公司;比根;DualGAN公司;MS-COCO公司;斯塔根;MNIST公司;DARTS公司;LR-GAN公司;低碳所;蟒蛇;收件人:GAN;Caltech-UCSD鸟类;SeqGAN公司 引用于: 11文件 全部的 前5名39位作者引用 1 阿巴斯·内贾德(M.Ehsan) 1 安,魏 1 莱杰拉·巴蒂纳 1 萨吉·本奈姆 1 亚尼夫·本尼 1 加法里·切利克 1 陈松灿 1 阿尔贝托·迪亚兹-阿尔瓦雷斯 1 托默·加兰蒂 1 马亨德拉·库马尔·古里萨里亚 1 郭勤伟 1 G.M.哈什瓦尔丹。 1 侯佳根 1 吉列尔莫·伊格莱西亚斯 1 孔一楠 1 刘金璐 1 刘玲乔 1 刘学军 1 吕洪强 1 塔潘·穆克吉 1 奈拉·穆赫塔尔 1 潘迪,曼朱沙 1 斯捷潘·皮切克 1 劳塔雷,悉达斯沼泽 1 施贾文 1 宋遂宏 1 理查德·塞利斯基 1 埃德加·塔拉维拉 1 穆罕默德·法提赫·塔鲁 1 安东·范登·亨格尔 1 狼,Lior 1 吴海洲 1 阿齐古里·乌拉木 1 杨刚(Yang,Gang) 1 于媛媛 1 张德政 1 张兆成 1 赵,陈 1 郑斌 全部的 前5名8篇连载文章中引用 2 国际计算机视觉杂志 2 计算机科学评论 1 计算机和流体 1 物理A 1 信息科学 1 计算地球科学 1 数学生物科学与工程 1 计算机科学课文 全部的 前5名在7个字段中引用 9 计算机科学(68至XX) 2 信息与通信理论、电路(94-XX) 1 统计学(62-XX) 1 流体力学(76-XX) 1 统计力学,物质结构(82-XX) 1 地球物理学(86-XX) 1 生物学和其他自然科学(92-XX) 按年份列出的引文