×

基于UPSO的语音信号序列RPSOVF预测模型。 (英语) Zbl 1419.94019号

摘要:本文提出了一种具有显式结构的语音信号序列非线性预测模型。为了克服一些固有的缺点,例如局部极小值陷阱、参数选择不当和收敛速度慢,这些缺点通常是由最小二乘法(LMS)在更新Volterra模型核系数时的低性能所产生的不当参数引起的,提出了一种均匀搜索粒子群优化算法(UPSO)来优化Volterra模型的核系数。利用英语音素、单词和短语,建立了基于UPSO的二阶Volterra滤波器(SOVF)语音预测模型。为了降低模型的复杂性,在给定用户设计的误差容限的情况下,提取简化的SOVF(RPSOVF)参数用于加速。实验结果表明,在单帧和多帧语音信号任务中,UPSO-SOVF和UPSO-RPSOVF在均方根误差(RMSE)和平均绝对偏差(MAD)方面均优于LMS-SOVF和PSO-SOVF。UPSO-SOVF和UPSO-RPSOVF能够更好地反映语音信号的趋势和规律,完全能够满足语音信号预测的要求。该模型为语音信号序列提供了一种非线性分析和有价值的模型结构,可进一步用于语音信号重构或压缩编码。

MSC公司:

94甲12 信号理论(表征、重建、滤波等)
62M20型 随机过程推断和预测
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Abarbanel,H.D.I.、Masuda,N.、Rabinovich,M.I.和Tumer,E.[2000]“相互信息的分配”,《物理学》。莱特。A281368-373·Zbl 0983.37102号
[2] Bazaraa,M.S.,Sherali,H.D.&Shetty,C.M.[2013]非线性规划:理论与算法(John Wiley&Sons)·Zbl 1140.90040号
[3] Cao,L.[1997]“确定标量时间序列最小嵌入维数的实用方法”,《物理学》D110,43-50·Zbl 0925.62385号
[4] Chang,W.D.[2012]“使用改进粒子群优化对非线性离散时间系统进行Volterra滤波器建模”,Digit。签名流程221056-1062。
[5] Chouikhi,N.、Ammar,B.、Rokbani,N.&Alimi,A.M.[2017]“用于时间序列预测的基于粒子群算法的回波状态网络参数分析”,Appl。软计算55211-225。
[6] Deng,L.,Hinton,G.&Kingsbury,B.[2013],“语音识别和相关应用的新型深度神经网络学习:概述”,IEEE Int.Conf.Acust。语音符号处理。,第8599-8603页。
[7] Guerin,A.、Faucon,G.和Bouquin-Jeannes,R.L.[2003]“基于Volterra滤波器的非线性回声抵消”,IEEE Trans。语音音频处理.11,672-683。
[8] Kocal,O.H.,Yuruklu,E.&Avcibas,I.[2008]“语音隐写分析的混沌类型特征”,IEEE Trans。通知。Forens公司。安全3,651-661。
[9] Kokkinos,I.、Maragos,P.和Kokkinos,I.[2005]“使用混沌系统模型进行非线性语音分析”,IEEE Trans。语音音频处理.131098-1109·兹比尔1159.68588
[10] Luka,M.K.、Frank,I.A.和Onwodi,G.[2012],“基于神经网络的豪萨语语音识别”,国际期刊高级研究报告,Artif。情报1,39-44。
[11] Ogorzalek,M.[2002]“基于离散时间混沌的信号编码和压缩:统计方法”,Proc。IEEE国际标准。《电路与系统》,第4卷,第IV-564-IV-567页。
[12] Rosenstein,M.T.,Collins,J.J.&Luca,C.J.D.[1993]“从小数据集计算最大Lyapunov指数的实用方法”,《物理学》D65,117-134·Zbl 0779.58030号
[13] Shi,Y.&Eberhart,R.C.[1998]粒子群优化中的参数选择,第1447卷(Springer,Berlin,Heidelberg),第591-600页。
[14] Sigrist,Z.、Grivel,E.和Alcoverro,B.[2012]“基于LMS变量或误差-变量方法从噪声测量中估算二阶Volterra系统参数”,符号过程921010-1020。
[15] Stavrakoudis,D.G.和Theocharis,J.B.[2007]“用于非线性自适应语音预测的流水线递归模糊神经网络”,IEEE Trans。系统。人类网络。B部分(Cybern.)37,1305-1320。
[16] Sun,J.,Zheng,N.&Wang,X.[2007]“基于非线性动力学的汉语语音增强”,符号处理872431-2445·Zbl 1186.94329号
[17] Thyssen,J.,Nielsen,H.&Hansen,S.D.[1994]“语音编码中的非线性短期预测”,IEEE国际会议Acoust。语音符号处理。,第1卷,第I/185-I/188页。
[18] Wei,R.X.,Han,C.Z.和Zhang,Z.L.[2005]“非线性Volterra系统的全解耦自适应滤波器”,《电子学报》。辛.33,656-659。
[19] Weng,C.,Yu,D.,Watanabe,S.&Juang,B.H.F.[2014]“用于鲁棒语音识别的递归深度神经网络”,IEEE Int.Conf.Acust。语音符号处理。,第5532-5536页。
[20] Wu,X.-J.,Yang,Z.Z.&Zhao,M.[2011]“统一搜索粒子群优化算法”,《电子学报》。辛.201261-1266。
[21] Zhang,S.,Li,H.&Xiao,X.[2005]“混沌时间序列的局部离散余弦变换域Volterra预测”,Chin。物理学。B14,49-54。
[22] Zhang,Y.M.,Wu,X.J.&Bai,S.L.[2013]“交通流序列的混沌特征分析和DFPSOVF预测模型”,《物理学报》。原罪612190509。
[23] Zhang,Y.,Hu,X.,Wu,X.、Bai,S.和Lu,G.[2015]“语音信号序列的Volterra预测模型”,《物理学报》。Sin.64200507年。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。