Improved HNM-based vocoder for statistical synthesizers

Erro, Daniel; Sainz, Iñaki; Navas, Eva; Hernáez, Inma

doi:10.21437/Interspeech.2011-35

改进的基于HNM的统计合成器声码器

Daniel Erro、Iñaki Sainz、Eva Navas、Inma Hernáez

统计参数合成器在过去几年中取得了很好的性能分数。然而，由于它们需要使用声码器来参数化语音（在训练期间）和重建波形（在合成期间），因此统计模型生成的语音缺乏一定程度的自然度。在之前的工作中，我们探讨了谐波加噪声模型在高质量语音编码器设计中的实用性。当这种声码器被集成到合成器中时，获得了非常有希望的结果。在本文中，我们描述了一些与激发参数有关的最新改进，特别是所谓的最大浊音频率。通过与其他著名方法的主观比较，它的估计和显式建模导致了更好的综合性能。

doi:10.21437/Interspeech.2011-35

引自：Error，D.，Sainz，I.，Navas，E.，Hernáez，I..（2011）用于统计合成器的改进的基于HNM的声码器。程序。Interspeech 20111809-1812，doi:10.21437/Interspeech.2011-35

@正在处理{erro11_interspeech，author={Daniel Erro和Iñaki Sainz以及Eva Navas和Inma Hernáez}，title={{用于统计合成器的改进的基于HNM的声码器}}，年份=2011，booktitle={Proc.Interspeech 2011}，页数={1809--1812}，doi={10.21437/Interspeech.2011-35}，issn={2958-1796}}