• 全文

       

       单击此处查看全文PDF


      永久链接:
      https://www.ias.ac.in/article/fulltext/sadh/036/05/0745-0782

    • 关键词

       

      傅里叶变换相位;群延迟函数;相位特征提取;特征切换;相互信息;$K-L$分歧。

    • 摘要

       

      传统上,语音信号中的信息是根据短时傅立叶分析得出的特征来表示的。在此分析中,考虑了从傅里叶变换(FT)幅度中提取的特征,忽略了相位分量。尽管近三十年来的一些研究强调了FT相位的重要性,但由于相位计算和相位函数处理的困难,FT相位特征并未得到充分利用。短时FT相位函数中的信息可以通过处理FT相位的导数,即群延迟函数来提取。本文回顾了群延迟函数的性质,强调了FT相位对语音信号中信息表示的重要性。讨论了处理群延迟函数的方法,以共振峰的形式或通过修改的群延迟函数捕捉声道系统的特征。详细讨论了群延迟函数在语音处理中的应用。它们包括将语音分割成音节边界,利用群延迟函数的可加性和高分辨率特性。在语言识别、语音识别和说话人识别等应用中,证明了语音分割的有效性,以及从修改后的群延迟中获得的特征。因此,本文论证了开发群延迟函数潜力用于语音系统开发的必要性。

    • 第一作者单位

       

      赫马·A·默西1 B耶格纳拉亚纳2

      1. 印度马德拉斯理工学院计算机科学与工程系,印度钦奈
      2. 印度海得拉巴加奇博利国际信息技术研究所
    • 日期

       
  • Sadhana |新闻

    • 关于连续文章出版的编辑注释

      2019年7月25日发布

      点击在这里有关CAP模式的编辑注释

©2023-2024印度科学院,班加罗尔。