Sadhana |印度科学院

1. 主页
2. 期刊销售
3. 萨达纳
4. 第36卷
5. 第5版
- 群延迟函数及其在语音技术中的应用
  
  赫马·A·默西 B耶格纳拉亚纳
  
  第36卷第5版 2011年10月第745-782页
- 全文
  
  单击此处查看全文PDF
  
  永久链接：
  https://www.ias.ac.in/article/fulltext/sadh/036/05/0745-0782
- 关键词
  
  傅里叶变换相位;群延迟函数;相位特征提取;特征切换;相互信息;$K-L$分歧。
- 摘要
  
  传统上，语音信号中的信息是根据短时傅立叶分析得出的特征来表示的。在此分析中，考虑了从傅里叶变换（FT）幅度中提取的特征，忽略了相位分量。尽管近三十年来的一些研究强调了FT相位的重要性，但由于相位计算和相位函数处理的困难，FT相位特征并未得到充分利用。短时FT相位函数中的信息可以通过处理FT相位的导数，即群延迟函数来提取。本文回顾了群延迟函数的性质，强调了FT相位对语音信号中信息表示的重要性。讨论了处理群延迟函数的方法，以共振峰的形式或通过修改的群延迟函数捕捉声道系统的特征。详细讨论了群延迟函数在语音处理中的应用。它们包括将语音分割成音节边界，利用群延迟函数的可加性和高分辨率特性。在语言识别、语音识别和说话人识别等应用中，证明了语音分割的有效性，以及从修改后的群延迟中获得的特征。因此，本文论证了开发群延迟函数潜力用于语音系统开发的必要性。
- 第一作者单位
  赫马·A·默西¹ B耶格纳拉亚纳²
  1. 印度马德拉斯理工学院计算机科学与工程系，印度钦奈
  2. 印度海得拉巴加奇博利国际信息技术研究所
- 日期
  
  出版
  2011年10月

萨达纳

2024年第49卷
所有文章
连续文章发布模式

Sadhana |新闻
- 关于连续文章出版的编辑注释
  
  2019年7月25日发布
  
  点击在这里有关CAP模式的编辑注释

全文

关键词

摘要

第一作者单位

日期

萨达纳

Sadhana |新闻

关于连续文章出版的编辑注释