国际标准协会 档案文件 2012年国际演讲
国际标准协会 档案文件 2012年国际演讲

真实噪声混响环境下基于谱减法的去噪和去噪语音识别

Kyohei Odani、Longbiao Wang、Atsuhiko Kai

提出了一种基于多通道最小均方(MCLMS)算法的谱减法(SS)盲解扩方法。一个大词汇量连续语音识别(LVCSR)任务的结果表明,与传统的基于倒谱均值归一化(CMN)和波束形成的方法相比,该方法在无附加噪声的模拟混响环境中取得了显著的改进。在本文中,我们评估了在真实噪声混响环境中的盲解扩方法。我们提出了一种基于功率SS或广义SS(GSS)的去噪和去噪方法,并使用真实环境中的语音对我们提出的方法进行了评估。与传统的基于CMN和基于幂-SS的方法相比,基于GSS的方法平均相对字错误减少率分别为39.1%和11.5%。

索引词:免提语音识别、盲解扩、降噪、谱减法、真实环境


doi:10.21437/Interspeech.2012-384

引用:Odani,K.,Wang,L.,Kai,A.(2012)在真实的噪声混响环境中,通过基于谱减法的去噪和去混响进行语音识别。程序。Interspeech 20121251-1254,doi:10.21437/Interspeech.2012-384

@正在进行{odani12_interspeech,author={Kyohei Odani、Longbiao Wang和Atsuhiko Kai},title={{在真实噪声混响环境中基于谱减法的去噪和去噪语音识别}},年份=2012年,booktitle={Proc.Interspeech 2012},页数={1251--1254},doi={10.21437/Interspeech.2012-384},issn={2958-1796}}