计算机科学>声音
标题: 端到端代码转换TTS中段落处理的文本增强
摘要: 当前的端到端代码切换文本到语音(TTS)已经可以使用单说话人双语语料库在同一话语中生成高质量的两种语言语音。 当双语语料库的说话人不同时,码转换TTS的自然性和一致性较差。 我们提出的跨语言嵌入层结构使不同语言中的相似音节具有相关性,从而提高了生成语音的自然度和一致性。 在端到端代码切换TTS中,合成段落文本时存在韵律不稳定的问题。 我们提出的文本增强方法使输入包含韵律信息和句子级上下文信息,从而提高段落文本的韵律稳定性。 实验结果证明了所提方法在自然度、一致性和韵律稳定性方面的有效性。 除了普通话和英语之外,我们还将这些方法应用于上海语和粤语语料库,证明了我们提出的方法可以扩展到其他语言,以构建端到端的码交换TTS系统。