×

液体状态机的孤立词识别:案例研究。 (英语) Zbl 1184.68257号

概要:液体状态机(LSM)是最近开发的一种计算模型,具有有趣的特性。它可以用于模式分类、函数逼近和其他复杂任务。与大多数常见的计算模型相反,LSM不需要将信息存储在系统的某些稳定状态中:无记忆读出函数使用系统的固有动力学来计算输出。本文通过将基于递归尖峰神经网络的液体状态机应用于一个众所周知且已被广泛研究的问题:孤立数字的语音识别,对其性能进行了案例研究。我们评估了将语音编码为尖峰序列的不同方法。在其最佳配置中,LSM的性能接近于最先进的识别系统。另一个有趣的结论是,生物学上最逼真的编码比更传统的方法表现得更好。

MSC公司:

2010年第68季度 计算模式(非确定性、并行、交互式、概率性等)
68吨10 模式识别、语音识别
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Maass,W。;Natschläger,T。;Markram,H.,《无稳定状态的实时计算:基于扰动的神经计算的新框架》,《神经计算》。,14, 2531-2560 (2002) ·Zbl 1057.68618号
[2] H.Jaeger,《分析和训练递归神经网络的“回声状态”方法》,技术代表GMD报告148,德国国家信息技术研究中心,2001年;H.Jaeger,《分析和训练递归神经网络的“回声状态”方法》,技术代表GMD报告148,德国国家信息技术研究中心,2001年
[3] C.Fernando,S.Sojakka,《桶中的模式识别》,摘自:Proc。第七届欧洲人工生命大会,2003年,第588-597页;C.Fernando,S.Sojakka,《桶中的模式识别》,摘自:Proc。第七届欧洲人工生命大会,2003年,第588-597页
[4] T.Natschläger,N.Bertschinger,R.Legenstein,《混沌边缘:递归神经网络中的实时计算和自组织临界性》,摘自:Proc。NIPS,2004年,第145-152页;T.Natschläger,N.Bertschinger,R.Legenstein,《混沌边缘:递归神经网络中的实时计算和自组织临界性》,摘自:Proc。NIPS,2004年,第145-152页
[5] Vapnik,V.,《统计学习理论的本质》(1995),Springer-Verlag:Springer-Verlag纽约·Zbl 0833.62008号
[6] J.J.Steil,反向传播去关联:与\(O(N\);J.J.Steil,Backpropagation Decorrelation:在线循环学习
[7] W.Maass,H.Markram,《关于尖峰神经元循环回路的计算能力》,J.Physiol。,出版中;W.Maass,H.Markram,《关于尖峰神经元循环回路的计算能力》,J.Physiol。,出版中·Zbl 1076.68062号
[8] Natschläger,T。;Markram,H。;Maass,W.,《神经微电路的计算机模型和分析工具》,(Kötter,R.,《神经科学数据库和相关工具实用指南》(2002),Kluwer学术出版社:Kluwer-学术出版社波士顿),第9章
[9] Maass,W。;Natschläger,T。;Markram,H.,通用神经微电路中的实时计算模型,(NIPS Proc.of NIPS,vol.15(2003),麻省理工学院出版社:麻省理工学院出版社,马萨诸塞州剑桥),229-236
[10] 霍普菲尔德,J。;布罗迪,哥伦比亚特区,什么是时刻?短时间内“皮层”感觉整合,Proc。国家。阿卡德。科学。美国,97,13919-13924(2000)
[11] D.Verstraeten,Een studie van de Liquid State Machine:Een woordherkenner,根特大学ELIS系硕士论文,2004年;D.Verstraeten,《液态机器研究》:Een woordherkenner,根特大学ELIS系硕士论文,2004年
[12] 奥尔,P。;Burgsteiner,H。;Maass,W.,《减少神经网络中分布式学习的通信》(Dorronsoro,J.R.,《人工神经网络国际会议论文集》,《人工神经元网络国际会议文献集》,第2415卷(2002),《Springer-Verlag:Springer-Verlag Berlin》),123-128·Zbl 1013.68826号
[13] B.Schrauwen,J.Van Campenhout,BSA,一种快速准确的尖峰序列编码方案,见:Proc。IJCNN,2003年,第2825-2830页;B.Schrauwen,J.Van Campenhout,BSA,一种快速准确的尖峰序列编码方案,见:Proc。IJCNN,2003年,第2825-2830页
[14] 里昂,耳蜗中滤波、检测和压缩的计算模型,in:Proc。IEEE ICASSP,1982年,第1282-1285页;里昂,耳蜗中滤波、检测和压缩的计算模型,in:Proc。IEEE ICASSP,1982年,第1282-1285页
[15] Van Immerseel,L。;Martens,J.-P.,《用听觉模型测定音高和浊音/清音》,J.Acoustical Soc.Amer。,91, 6, 3511-3526 (1993)
[16] M.Slaney,里昂的耳蜗模型,技术代表13,先进技术集团,苹果电脑公司,1988年;M.Slaney,里昂的耳蜗模型,技术代表13,先进技术集团,苹果电脑公司,1988年
[17] Y.Deng,S.Chakrabartty,G.Cauwenberghs,鲁棒语音识别的模拟听觉感知模型,收录于:Proc。IJCNN,2004年,第1705-1710页;Y.Deng,S.Chakrabartty,G.Cauwenberghs,鲁棒语音识别的模拟听觉感知模型,收录于:Proc。IJCNN,2004年,第1705-1710页
[18] W.Walker、P.Lamere、P.Kwok、B.Raj、R.Singh、E.Gouvea、P.Wolf、J.Woelfel、Sphinx-4:语音识别的灵活开源框架,技术代表,太阳微系统公司,2004年;W.Walker、P.Lamere、P.Kwok、B.Raj、R.Singh、E.Gouvea、P.Wolf、J.Woelfel、Sphinx-4:语音识别的灵活开源框架,技术代表,Sun Microsystems Inc.,2004年
[19] A.Graves,D.Eck,N.Beringer,J.Schmidhuber,《LSTM神经网络生物似然语音识别》,摘自:Proc。Bio-ADIT,2004年,第127-136页;A.Graves,D.Eck,N.Beringer,J.Schmidhuber,《LSTM神经网络生物似然语音识别》,摘自:Proc。Bio-ADIT,2004年,第127-136页
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。