×

波浪辉光

swMATH ID: 35020
软件作者: Ryan Prenger、Rafael Valle、Bryan Catanzaro
描述: WaveGlow:用于语音合成的基于流的生成网络。本文提出WaveGlow:一种基于流的网络,能够从梅尔谱图生成高质量语音。WaveGlow将Glow和WaveNet的见解结合在一起,以提供快速、高效和高质量的音频合成,而无需自动回归。WaveGlow仅使用单个网络实现,仅使用单个成本函数进行训练:最大化训练数据的可能性,从而使训练过程简单而稳定。我们的PyTorch实现在NVIDIA V100 GPU上以超过500 kHz的速率生成音频样本。平均意见得分表明,它提供的音频质量与最好的公开WaveNet实现一样好。所有代码将在网上公开。
主页: https://arxiv.org/abs/1811.00002
源代码:  https://github.com/CookiePP/waveglow
关键词: 声音(cs.SD);人工智能(cs.AI);机器学习(cs.LG);音频和语音处理(eess.AS);机器学习(stat.ML)
相关软件: 辉光;亚当;自然科学基金;n流量;FloWaveNet公司;低碳所;PyTorch公司;张紧器2传感器;PixelCNN(像素有线电视新闻网)++;流量++;峡湾;i-RevNet公司;DeepONet(深度网络);DGM公司;WaveNet公司;PMTK公司;深度演讲;塔斯奈特;波浪2vec;wav2字母++
引用于: 5文件

按年份列出的引文