×

波浪网

swMATH标识: 38795
软件作者: 亚伦·范登诺德、桑德·迪勒曼、海加·岑、卡伦·西蒙扬、奥利奥·维尼亚、亚历克斯·格雷夫斯、纳尔·卡尔什布伦纳、安德鲁·塞尔迪尔曼、科雷·卡武库格鲁
说明: WaveNet:原始音频的生成模型。本文介绍一种用于生成原始音频波形的深层神经网络WaveNet。该模型是完全概率和自回归的,每个音频样本的预测分布都是以之前所有样本为条件的;尽管如此,我们证明它可以有效地训练数据,每秒有成千上万的音频样本。当应用于文本到语音转换时,它产生了最先进的性能,人类听众认为它比英语和普通话的最佳参数和连接系统听起来更自然。一个单一的波网络可以以相同的保真度捕捉许多不同的说话人的特征,并且可以通过调节说话人的身份在它们之间切换。当我们被训练成音乐模型时,我们发现它能产生新颖的,通常是高度真实的音乐片段。我们还证明了它可以作为一个判别模型,为音素识别返回了很好的结果。
主页: https://arxiv.org/abs/1609.03499
关键词: 声音;arXiv公司;机器学习;arXiv公司;波浪网;原始音频;深层神经网络
相关软件: 亚当;图像网;亚历克斯内特;张量2传感器;火把;张量流;达奇;拜特尼特;甘瓦瑟斯坦;github;煤油;斯泰利根;像素2像素;基列根;PMTK公司;像素;GNMT公司;伯特;斯坦;不错
参考文献: 26种出版物
全部的 前5名

77位作者引用

2 侯佳根
2 木刻,塔潘
2 宋穗红
1 阿拉贾吉,法迪
1 阿拉米达·皮内达,泽维尔
1 阿库奇,罗塞拉
1 奥莉,迈克尔
1 碧,小雨
1 Bošnjak,马特科
1 约翰·布雷默
1 伯丽娜,菲利普
1 Büsing,拉尔斯
1 张旭婷
1 查蒂尼,菲利普
1 克劳托,迪迪埃
1 克兰默,凯尔
1 达什,提尔塔拉吉
1 德科尔,法比奥
1 迪亚德,朱利安
1 迪克斯特拉,亨克A。
1 多多夫,博伊科
1 杜瑞萨米,卡蒂克
1 埃利斯,凯文
1 樊建生
1 费希滕霍夫,克里斯托夫
1 菲尔德斯,罗伯特
1 加蒂,菲利波
1 格林,劳伦特
1 格兰杰,大卫
1 郭一科
1 霍夫,彼得D。
1 黄俊浩
1 黄磊
1 霍伯,托马斯
1 季水旺
1 加藤,Takuya
1 基尔古尔,迈克尔
1 诺布洛赫,罗伯特
1 科利,普什梅特
1 科恩,拉尔夫
1 克雷奇默,彼得
1 法律,西蒙
1 莱西格,克里斯蒂安
1 劳普,吉尔
1 马少辉
1 马里诺,约瑟夫
1 痛苦,克里斯托弗C。
1 帕特诺,让马克
1 保罗,威廉
1 帕维兹,胡安
1 帕维罗,达里奥
1 彭宁顿,杰弗里S。
1 普法,大卫
1 拉瓦特,瓦西姆
1 斋藤,Yohei
1 桑吉奥,马特奥
1 Sapsis,Themistoklis P。
1 塞尔格特,马雷克J。
1 西敏,莉娜
1 斯里尼瓦桑,阿什温
1 孙俊武
1 太阳,哀号
1 孙伟泽
1 弗拉西斯,尼古拉斯N。
1 万忠一
1 王,陈
1 王,伊珍
1 王佳吉
1 王胜瑞
1 王增辉
1 王正阳
1 威斯,马格努斯
1 沃拉,普拉蒂克
1 吴,平
1 徐佳阳
1 Yanchenko,安娜K。
1 张文杰

按年份引用出版物