×

使用语音特征对病理性语音进行自动可懂度评估。 (英语) Zbl 1184.68445号

摘要:众所周知,单词或音素的可懂度是评估病态说话人沟通效率的一个重要标准。因此,人们在设计感知可懂度等级测试方面投入了大量精力。这些测试通常有一个缺点,即使用了不自然的言语材料(例如无意义的单词),并且不能完全排除由于听者偏见造成的错误。因此,应用客观自动语音识别技术实现可懂度评估的自动化越来越受到人们的关注。目前的研究正朝着自动化方法的设计方向发展,这种方法能够产生与精心设计和良好执行的感知测试结果相符的评级。在本文中,提出了一种基于先前工作(Middag等人,2008)的新方法。它利用语音特征、基于正常语音训练的声学模型的自动语音对齐、上下文相关的说话人特征提取以及基于可训练病理语音样本的小模型的可懂度预测。对新系统的实验评估表明,感知和计算可懂度之间差异的均方根误差在0到100的范围内可以低至8。

理学硕士:

68吨10 模式识别、语音识别
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[8] 数字对象标识代码:10.1159/000153433·数字对象标识代码:10.1159/000153433
[9] doi:10.1109/TASSP.1980.1163420·doi:10.1109/TASSP.1980.1163420
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。