×

一种新的基于信号分解的语音增强方法。 (英语) 兹比尔1186.94336

小结:听觉系统和视觉系统一样,可能对突然的刺激变化很敏感,而言语中的瞬态成分可能对言语感知特别关键。如果这一成分能够被识别并有选择性地放大,就有可能改善背景噪声中的语音感知。本文描述了一种将语音分解为音调、瞬态和残差分量的算法。采用改进的离散余弦变换(MDCT)捕捉色调分量,小波变换捕捉瞬态特征。应用隐马尔可夫链(HMC)模型和隐马尔可夫树(HMT)模型分别捕获MDCT系数之间和小波系数之间的统计相关性。通过小波变换识别出的瞬态分量被选择性放大,并与原始语音重新组合,生成修改后的语音,能量被调整为与原始语音的能量相等。使用改进的韵律协议对11名人类受试者的原始语音和修改语音的可懂度进行了评估。单词识别率结果表明,改进后的语音在低信噪比水平(-15分贝时提高了8%,-20分贝时降低了14%,-25分贝下提高了18%)下的可懂度,在较高信噪比下对可懂度的影响最小。

MSC公司:

94甲12 信号理论(表征、重建、滤波等)
PDF格式BibTeX公司 XML格式引用
全文: 内政部