文件Zbl 1186.94336-zbMATH打开

Tantibundhit，C。;波士顿，J.R。;李，C.C。;达兰特，J.D。;沙伊曼，S。;科瓦奇克，K。;El-Jaroudi，A。

一种新的基于信号分解的语音增强方法。（英语）兹比尔1186.94336

信号处理。 87，第11号，2607-2628（2007）.

小结：听觉系统和视觉系统一样，可能对突然的刺激变化很敏感，而言语中的瞬态成分可能对言语感知特别关键。如果这一成分能够被识别并有选择性地放大，就有可能改善背景噪声中的语音感知。本文描述了一种将语音分解为音调、瞬态和残差分量的算法。采用改进的离散余弦变换（MDCT）捕捉色调分量，小波变换捕捉瞬态特征。应用隐马尔可夫链（HMC）模型和隐马尔可夫树（HMT）模型分别捕获MDCT系数之间和小波系数之间的统计相关性。通过小波变换识别出的瞬态分量被选择性放大，并与原始语音重新组合，生成修改后的语音，能量被调整为与原始语音的能量相等。使用改进的韵律协议对11名人类受试者的原始语音和修改语音的可懂度进行了评估。单词识别率结果表明，改进后的语音在低信噪比水平（-15分贝时提高了8%，-20分贝时降低了14%，-25分贝下提高了18%）下的可懂度，在较高信噪比下对可懂度的影响最小。

引用于2文件

MSC公司：

94甲12

信号理论（表征、重建、滤波等）

关键词：

语音增强;音调成分;瞬态分量;残余成分;修改后的语音;改进的离散余弦变换（MDCT）;小波变换;隐马尔可夫链（HMC）模型;隐马尔可夫树模型;两个单变量高斯分布的混合;维特比算法;最大后验（MAP）算法;改进的rhym协议;混淆矩阵;心理声学测试;言语可懂度;言语感知

PDF格式 BibTeX公司 XML格式引用

全文：内政部

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

一种新的基于信号分解的语音增强方法。（英语）兹比尔1186.94336

MSC公司：

关键词：

示例

领域

操作员

一种新的基于信号分解的语音增强方法。 （英语） 兹比尔1186.94336

MSC公司：

关键词：

一种新的基于信号分解的语音增强方法。（英语）兹比尔1186.94336