×

广播新闻的大词汇量连续语音识别——飞利浦/RWTH方法。 (英语) Zbl 1005.68780号

摘要:实况广播新闻(BN)数据(Hub-4)的自动语音识别是近年来极具挑战性的研究课题。本文总结了我们在不增加额外复杂度和计算资源的情况下,为异构BN任务构建大词汇量连续语音识别系统所做的主要工作。这些关键工作包括:
\(\bullet\)将音频信号自动分割为语音;
\(\bullet \)使用look-ahead技术的高效单程三角译码;
\(bullet)使用判别模型组合(DMC)对各种声学和语言模型进行最优对数线性插值;
\(bullet)通过短语和距离语言模型处理自然语言和语言中的短程和弱长程相关性;
\(bullet)通过稳健的特征提取、信道归一化、自适应技术以及自动脚本选择和验证来改进声学建模。
系统开发的起点是飞利浦64k-NAB字内三音三角系统。在与扬声器无关但与话筒相关的NAB任务(阅读报纸文本的转录)中,我们获得了约10%的单词错误率。现在,在系统开发结束时,我们已经为飞利浦设计了一个基于DMC插值短语的纵横字谜4克系统。该系统转录BN数据,总单词错误率约为17%。

MSC公司:

68单位99 计算方法和应用
68吨10 模式识别、语音识别
PDF格式BibTeX公司 XML格式引用
全文: 内政部