国际标准协会 档案文件 2012年国际演讲
国际标准协会 档案文件 2012年国际演讲

将单语使用者转换为混合语言TTS的多语言使用者

Ji He、Yao Qian、Frank K.Soong、Sheng Zhao

我们提出了一种从说话人的单语录音中提取不同语言的语音句子的方法,用于构建混合编码TTS系统。首先通过扭曲频谱频率、消除F0变化和调整跨说话人和语言的语速来平衡英语和汉语等两种单语说话人语料库之间的差异。然后,英语使用者的汉语演讲通过轨迹平铺方法进行呈现。将汉语说话人的参数轨迹等效为英语说话人,用于指导搜索英语说话者录音中5ms波形“瓦片”的最佳序列。翻译后的英语使用者的汉语演讲和她自己的英语录音最终用于训练基于HMM的混合语言(英语-汉语)TTS。实验结果表明,该方法能够合成高质量的混合语言语音,这在客观和主观评价中都得到了验证。

索引术语:混合语言TTS、基于HMM的TTS、单元选择、轨迹平铺


doi:10.21437/Interspeech.2012-287

引用自:He,J.,Qian,Y.,Song,F.K.,Zhao,S.(2012)《将单语使用者转换为混合语言TTS的多语言使用者》。程序。Interspeech 2012,963-966,doi:10.21437/Interspeech.2012-287

@正在进行{he12_interspeech,author={纪和、姚谦、宋楚瑜和赵盛},title={{将单语使用者转换为混合语言TTS}}的多语言使用者,年份=2012年,booktitle={Proc.Interspeech 2012},页码={963-966},doi={10.21437/Interspeech.2012-287},issn={2958-1796}}