文件Zbl 1005.68780-zbMATH Open

贝耶林，P。;奥伯特，X。;Haeb-Umbach，R。;M.哈里斯。;D.卡拉科。;A.温德穆斯。;莫劳，S。;H.奈伊。;迈克尔·皮茨;Sixtus，A。

广播新闻的大词汇量连续语音识别——飞利浦/RWTH方法。（英语） Zbl 1005.68780号

语音通信 37，编号1-2，109-131（2002）.

摘要：实况广播新闻（BN）数据（Hub-4）的自动语音识别是近年来极具挑战性的研究课题。本文总结了我们在不增加额外复杂度和计算资源的情况下，为异构BN任务构建大词汇量连续语音识别系统所做的主要工作。这些关键工作包括：
\（\bullet\）将音频信号自动分割为语音；
\（\bullet \）使用look-ahead技术的高效单程三角译码；
\（bullet）使用判别模型组合（DMC）对各种声学和语言模型进行最优对数线性插值；
\（bullet）通过短语和距离语言模型处理自然语言和语言中的短程和弱长程相关性；
\（bullet）通过稳健的特征提取、信道归一化、自适应技术以及自动脚本选择和验证来改进声学建模。
系统开发的起点是飞利浦64k-NAB字内三音三角系统。在与扬声器无关但与话筒相关的NAB任务（阅读报纸文本的转录）中，我们获得了约10%的单词错误率。现在，在系统开发结束时，我们已经为飞利浦设计了一个基于DMC插值短语的纵横字谜4克系统。该系统转录BN数据，总单词错误率约为17%。

MSC公司：

68单位99	计算方法和应用
68吨10	模式识别、语音识别

关键词：

广播新闻;轮毂-4;自动分割;说话人聚类;时间同步单通译码;语言模型外观;判别模型组合;对数线性插值;远程语言模型;短语;声道正常化;脚本验证

PDF格式 BibTeX公司 XML格式引用

全文：内政部

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b：book；一：图书文章）

一&b	逻辑和
一\|b	逻辑或
!ab公司	逻辑非
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

广播新闻的大词汇量连续语音识别——飞利浦/RWTH方法。（英语） Zbl 1005.68780号

MSC公司：

关键词：

示例

领域

操作员

广播新闻的大词汇量连续语音识别——飞利浦/RWTH方法。 （英语） Zbl 1005.68780号

MSC公司：

关键词：

广播新闻的大词汇量连续语音识别——飞利浦/RWTH方法。（英语） Zbl 1005.68780号