国际标准协会 档案文件 2008年国际演讲
国际标准协会 档案文件 2008年国际演讲

孤立声调语言越南语连续语音识别的新方法

Hong Quang Nguyen、Pascal Nocera、Eric Castelli、Van Loan Trinh

本文提出了一种新的方法,将越南语的语言特征集成到为一些欧洲语言构建的大词汇量连续语音识别系统(LVCSR)中。首先,利用隐马尔可夫模型构造了一个新的声调识别模块。其次,应用多种方法将单音节词的文本语料库转换为多音节词的文本语料库,并利用新的文本语料库建立了多音节词的统计语言模型。最后,所有知识都已包含在LVCSR系统中,以便该系统适用于越南人。在VNSPEECHCORPUS上进行了实验。结果表明,利用越南语的语言特征,提高了越南语识别系统的准确性,单词错误率相对降低了46%。