国际标准协会 档案文件 2008年国际演讲
国际标准协会 档案文件 2008年国际演讲

对齐对语音转换性能的影响

Elina Helander、Jan Schwarz、Jani Nurminen、Hanna Silen、Moncef Gabbouj

目前大多数语音转换系统使用高斯混合模型对源和目标特征的联合密度进行建模。这种方法的一个固有特性是,源和目标特征必须针对训练进行适当调整。很明显,对齐的准确性对转换质量有一定影响,但文献中尚未对此问题进行彻底研究。对齐技术的示例包括使用带有强制对齐或动态时间扭曲(DTW)的语音识别器。本文通过大量实验研究了对齐对语音转换质量的影响,并讨论了应考虑的问题。该研究的主要结果是,对齐显然很重要,但通过简单的语音活动检测、DTW和一些限制,我们可以实现与手工标记标签相同的质量。


doi:10.21437/Interspeech.2008-419

引用自:Helander,E.,Schwarz,J.,Nurminen,J.、Silen,H.、Gabbouj,M.(2008)《对齐对语音转换性能的影响》。程序。Interspeech 2008,1453-1456,doi:10.21437/Interspeech.2008-419

@正在进行中{helander08_interspeech,author={Elina Helander和Jan Schwarz和Jani Nurminen以及Hanna Silen和Moncef Gabbouj},title={{关于对齐对语音转换性能的影响}},年份=2008,booktitle={Proc.Interspeech 2008},页数={1453--1456},doi={10.21437/Interspeech.2008-419},issn={2958-1796}}