国际标准协会 档案文件 2011年国际演讲
国际标准协会 档案文件 2011年国际演讲

改进的基于HNM的统计合成器声码器

Daniel Erro、Iñaki Sainz、Eva Navas、Inma Hernáez

统计参数合成器在过去几年中取得了很好的性能分数。然而,由于它们需要使用声码器来参数化语音(在训练期间)和重建波形(在合成期间),因此统计模型生成的语音缺乏一定程度的自然度。在之前的工作中,我们探讨了谐波加噪声模型在高质量语音编码器设计中的实用性。当这种声码器被集成到合成器中时,获得了非常有希望的结果。在本文中,我们描述了一些与激发参数有关的最新改进,特别是所谓的最大浊音频率。通过与其他著名方法的主观比较,它的估计和显式建模导致了更好的综合性能。


doi:10.21437/Interspeech.2011-35

引自:Error,D.,Sainz,I.,Navas,E.,Hernáez,I..(2011)用于统计合成器的改进的基于HNM的声码器。程序。Interspeech 20111809-1812,doi:10.21437/Interspeech.2011-35

@正在处理{erro11_interspeech,author={Daniel Erro和Iñaki Sainz以及Eva Navas和Inma Hernáez},title={{用于统计合成器的改进的基于HNM的声码器}},年份=2011,booktitle={Proc.Interspeech 2011},页数={1809--1812},doi={10.21437/Interspeech.2011-35},issn={2958-1796}}