SeqGAN公司 swMATH ID: 26534 软件作者: 余兰涛、张卫南、王军、余勇 描述: SeqGAN:具有策略梯度的序列生成对抗网。生成对抗网(generative Adversarial Nets,GAN)作为一种新的生成模型训练方法,利用判别模型指导生成模型的训练,在生成真实数据方面取得了相当大的成功。然而,当目标是生成离散令牌序列时,它有局限性。一个主要原因是,生成模型的离散输出使得很难将梯度更新从判别模型传递到生成模型。此外,判别模型只能评估一个完整的序列,而对于部分生成的序列,在生成整个序列后,平衡其当前分数和未来分数是非常重要的。在本文中,我们提出了一个名为SeqGAN的序列生成框架来解决这些问题。SeqGAN将数据生成器建模为强化学习(RL)中的随机策略,通过直接执行梯度策略更新绕过生成器差异化问题。RL奖励信号来自根据完整序列判断的GAN鉴别器,并使用蒙特卡罗搜索传递回中间状态操作步骤。对合成数据和现实世界任务的大量实验表明,与强大的基线相比,它们有了显著的改进。 主页: https://arxiv.org/abs/1609.05473 源代码: https://github.com/LantaoYu/SeqGAN公司 相关软件: Wasserstein GAN公司;张紧器2传感器;像素x像素;循环GAN;亚当;比根;ImageNet公司;时尚GAN;OpenAI健身房;面具GAN;github;毫米-千克;InfoGAN公司;CIFAR公司;f-甘氨酸;StackGAN公司;UCI-毫升;AlexNet公司;GPT-3级;BERT(误码率) 引用于: 17文件 全部的 前5名72位作者引用 1 查鲁·C·阿加瓦尔。 1 穆沙里夫·艾哈迈德 1 安,魏 1 安东·巴赫金 1 安布林·巴诺 1 杰拉德·比亚 1 乔斯特·布鲁肯斯 1 蔡祥瑞 1 奥纳马利亚坎布鲁 1 曹树涵 1 陈松灿 1 邓云田 1 阿尔贝托·迪亚兹-阿尔瓦雷斯 1 丁晓科 1 韦斯利·吉福德。 1 玛丽特·杰尔斯达尔 1 格罗斯,萨姆 1 郭文雅 1 侯托马斯·伊昭 1 吉列尔莫·伊格莱西亚斯 1 姜锡坤 1 Jonker,天主教M。 1 乔治·埃姆·卡尼亚达基斯 1 Khan,Naurin Farooq先生 1 林嘉珍 1 威廉·H·K·林。 1 雷建成 1 佩德罗·伦卡斯特 1 李赞 1 佩德罗·林德(Pedro G.Lind)。 1 刘玲 1 刘学军 1 托马斯·卢卡西维奇 1 罗,袁 1 吕洪强 1 托马斯·莫兰(Thomas M.Moerland)。 1 古拉姆·穆尔塔扎 1 哈吉拉·穆尔塔扎 1 牛朝岳 1 米尔·奥特 1 阿斯克·普拉特 1 邱可欣 1 马克·阿雷里奥·兰扎托 1 莱昂纳多·雷丁·戈朗 1 马克西姆·桑尼尔 1 沙、雷 1 邵峰 1 邵、胡 1 宋婷婷 1 孙成杰 1 孙志伟 1 亚瑟·D·斯拉姆。 1 埃德加·塔拉维拉 1 乌戈·塔尼利安 1 王宝勋 1 Wang,软件狗 1 吴凡 1 吴海洲 1 徐、珍 1 杨,刘 1 阿尼斯·亚齐迪 1 杨庆民 1 英、陈浩 1 袁晓杰 1 萨阿德·扎法尔 1 张德元 1 张冬坤 1 张欢 1 张鹏川 1 张树茂 1 张颖 1 周宝航 全部的 前5名10篇连载文章中引用 三 机器学习研究杂志 2 物理A 2 信息科学 2 SIAM科学计算杂志 2 计算机科学评论 1 人工智能 1 计算机和流体 1 物理D 1 计算力学 1 机器学习的基础和趋势 全部的 前5名10个领域引用 11 计算机科学(68至XX) 5 统计学(62-XX) 三 统计力学,物质结构(82-XX) 1 常微分方程(34-XX) 1 概率论与随机过程(60-XX) 1 数值分析(65-XX) 1 流体力学(76-XX) 1 博弈论、经济学、金融和其他社会和行为科学(91-XX) 1 生物学和其他自然科学(92-XX) 1 信息与通信理论、电路(94-XX) 按年份列出的引文