国际标准协会 档案文件 2000年ICSLP
国际标准协会 档案文件 ICSLP 2000公司

葡萄牙语连续语音识别混合系统中音节分割信息的使用

雨果·梅内多(Hugo Meinedo)、若奥·P·内托(Joao P.Neto)

最近的工作表明,在语音识别系统中使用音节作为基本单位可能非常有用。这些工作介绍了利用音节信息的方法,以增加使用音素/电话作为基本单位的“传统”系统的鲁棒性。由于葡萄牙语是一种高度音节化的语言,我们希望音节信息能够在语音识别任务中带来潜在的好处。根据这些想法,我们首先开发了不同的自动音节分割方法。接下来,我们将最佳分割方法应用于我们的大词汇量连续语音语料库(BD-PUBLICO),获得了72%的准确率。我们开发了一个程序,在葡萄牙语基线语音识别器的声学模型中使用分段信息。改进后的识别系统对5k和27k词汇任务的结果表明,使用基本音节切分信息有助于系统的整体性能提高约10%。


doi:10.21437/ICSLP.2000-422

引自:Meinedo,H.,Neto,J.P.(2000)应用于葡萄牙语的连续语音识别混合系统中音节分割信息的使用。程序。第六届国际口语处理会议(ICSLP 2000),第2卷,927-930,doi:10.21437/ICSLP.2000-422

@正在进行{meinedo00_icslp,author={雨果·梅内多和若奥·P·内托},title={{应用于葡萄牙语的连续语音识别混合系统中音节分割信息的使用}},年份=2000,booktitle={Proc.第六届国际口语处理会议(ICSLP 2000)},页码={第2卷,927-930},doi={10.21437/ICSLP.2000-422},issn={2958-1796}}