传统上,语音信号中的信息是根据短时傅立叶分析得出的特征来表示的。在此分析中,考虑了从傅里叶变换(FT)幅度中提取的特征,忽略了相位分量。尽管近三十年来的一些研究强调了FT相位的重要性,但由于相位计算和相位函数处理的困难,FT相位特征并未得到充分利用。短时FT相位函数中的信息可以通过处理FT相位的导数,即群延迟函数来提取。本文回顾了群延迟函数的性质,强调了FT相位对语音信号中信息表示的重要性。讨论了处理群延迟函数的方法,以共振峰的形式或通过修改的群延迟函数捕捉声道系统的特征。详细讨论了群延迟函数在语音处理中的应用。它们包括将语音分割成音节边界,利用群延迟函数的可加性和高分辨率特性。在语言识别、语音识别和说话人识别等应用中,证明了语音分割的有效性,以及从修改后的群延迟中获得的特征。因此,本文论证了开发群延迟函数潜力用于语音系统开发的必要性。