国际标准协会 档案文件 2011年国际演讲
国际标准协会 档案文件 2011年国际演讲

基于连续情景记忆的发音动力学语音识别

塞巴斯蒂安·德曼吉(Sébastien Demange)、斯利姆·奥尼(Slim Ouni)

本文提出了一种基于发音动力学的语音识别系统。我们没有用任何明确的发音测量来扩展声学特征,而是把语音的发音动力学在结构上体现在情节记忆中。提出的识别器由不同的存储器组成,每个存储器专门用于特定的发音器。由于所有发音器对实现一个特定音素的贡献并不相等,因此对于每个音素,专门记忆的表现也不相等。我们通过电话串识别实验表明,结合不同发音专门记忆产生的识别假设,可以显著提高识别能力。


doi:10.21437/Interspeech.2011-612

引用:Demange,S.,Ouni,S.(2011)使用发音动力学的基于连续情景记忆的语音识别。程序。Interspeech 2011,2305-2308,doi:10.21437/Interspeech.2011-612

@正在进行{demange11_interspeech,author={Sébastien Demange和Slim Ouni},title={{使用发音动力学的基于连续情景记忆的语音识别}},年份=2011,booktitle={Proc.Interspeech 2011},页数={2305--2308},doi={10.21437/Interspeech.2011-612},issn={2958-1796}}