×

隐马尔可夫模型的调整维特比训练。 (英语) 兹比尔1168.60033

研究了隐马尔可夫模型((X_n,Y_n),(n=1,2,dots\)的有效参数估计问题。这里,(Y_n),(n=1,2,dots)是不可观测的时间齐次马氏链,具有状态空间(S=(1,dots,K),转移矩阵(P_{ij}){i,j\在S}中)和初始分布(pi=\pi\mathbb{P}\)。当\(Y_n\)处于状态\(l\ in S\)时,在\(x_n\ in mathbb{R}^D\)上的观测值\(x_n\)以分布密度\(f(x|theta_l)\发出,该分布密度直到参数化\(theta_l\ in theta\subseteq\mathbb}R}^D\)为止是已知的,并且与其他任何东西无关。
给定观测值(x_1,x_2,dots,x_n),问题是估计矩阵(mathbb{P})和参数(theta_1,dots和theta_K)。主要工具是EM程序。应用程序通常使用计算量较小的Viterbi训练过程,但它是有偏差的,不满足定点属性(初始化为真实参数时,它可以远离初始点)。在本文调整的维特比训练中,提出了一种恢复不动点性质的新方法。通过分析和仿真研究了这种改进方法的优点。

理学硕士:

60J22型 马尔可夫链中的计算方法
65立方厘米40 马尔可夫链的数值分析或方法
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Baum,L.E.和Petrie,T.(1966年)。有限状态马尔可夫链概率函数的统计推断。,安。数学。统计师。37 1554-1563. ·Zbl 0144.40902号 ·doi:10.1214/网址/1177799147
[2] Bilmes,J.(1998)。EM算法及其在高斯混合模型和隐马尔可夫模型参数估计中的应用的温和教程。技术报告97-021,国际计算机科学研究所,伯克利,加利福尼亚州,美国。
[3] Brémaud,P.(1999)。,马尔可夫链:吉布斯场、蒙特卡罗模拟和队列。纽约:施普林格·Zbl 0949.60009号
[4] Bryant,P.和Williamson,J.(1978年)。分类最大似然估计的渐近行为。,生物特征65 273-281·Zbl 0393.62011号 ·doi:10.1093/biomet/65.2.273
[5] Caliebe,A.(2006年)。隐马尔可夫模型中最大后验路径估计量的性质。,IEEE传输。通知。理论52 41-51·兹比尔1286.62070 ·doi:10.1109/TIT.2005.860425
[6] Caliebe,A.(2007年)。私人通信。
[7] Caliebe,A.和Rösler,U.(2002年)。隐马尔可夫模型中最大后验路径估计的收敛性。,IEEE传输。通知。理论48 1750-1758·Zbl 1060.62091号 ·doi:10.1109/TIT.2002.1013123
[8] Cappé,O.,Moulines,E.和Rydén,T.(2005)。,隐马尔可夫模型中的推理。纽约:施普林格·Zbl 1080.62065号
[9] Celeux,G.和Govaert,G.(1992年)。一种用于聚类的分类EM算法和两种随机版本。,计算。统计师。数据分析。14 315-332. ·Zbl 0937.62605号 ·doi:10.1016/0167-9473(92)90042-E
[10] Chou,P.、Lookbaugh,T.和Gray,R.(1989年)。熵约束矢量量化。,IEEE传输。阿库斯特。语音信号处理。37 31-42. ·doi:10.1109/29.17498
[11] Durbin,R.、Eddy,S.、Krogh,A.和Mitchison,G.(1998)。,生物序列分析:蛋白质和核酸的概率模型。剑桥大学出版社·Zbl 0929.92010号 ·doi:10.1017/CBO9780511790492
[12] Eddy,S.(2004年)。什么是隐马尔可夫模型?,自然生物技术22 1315-1316。
[13] Ehret,G.、Reichenbach,P.、Schindler,U.等人(2001年)。不同STAT蛋白的DNA结合特异性。,生物学杂志。化学。276 6675-6688.
[14] Ephraim,Y.和Merhav,N.(2002年)。隐马尔可夫过程。,IEEE传输。通知。理论48 1518-1569·Zbl 1061.94560号 ·doi:10.1109/TIT.2002.1003838
[15] Fraley,C.和Raftery,A.E.(2002年)。基于模型的聚类、判别分析和密度估计。,J.Amer。统计师。协会97 611-631。JSTOR公司:·Zbl 1073.62545号 ·doi:10.19198/0162114502760047131
[16] Genon-Catalot,V.、Jeantheau,T.和Larédo,C.(2000)。随机波动率模型作为隐马尔可夫模型和统计应用。,伯努利6号,邮编:1051-1079·Zbl 0966.62048号 ·doi:10.2307/3318471
[17] Green,P.J.和Richardson,S.(2002年)。隐马尔可夫模型和疾病映射。,J.Amer。统计师。协会97 1055-1070。JSTOR公司:·Zbl 1046.62117号 ·doi:10.1198/016214502388618870
[18] Huang,X.、Ariki,Y.和Jack,M.(1990)。,语音识别的隐马尔可夫模型。爱丁堡大学出版社。
[19] Jelinek,F.(1976年)。用统计方法进行连续语音识别。,程序。IEEE 64 532-556。
[20] 杰利内克,F.(2001)。,语音识别的统计方法。麻省理工学院出版社。
[21] Ji,G.和Bilmes,J.(2006)。使用部分观察数据回退模型训练:应用于对话动作标记。在,程序。人类语言技术会议NAACL,主要会议280-287。美国纽约市:计算语言学协会。可在http://www.aclweb.org/选集/N/N06/N06-036。
[22] Juang,B.-H.和Rabiner,L.(1990年)。隐马尔可夫模型参数估计的分段K-均值算法。,IEEE传输。阿库斯特。语音信号处理。38 1639-1641. ·Zbl 0708.62076号 ·doi:10.1109/29.60082
[23] Kogan,J.A.(1996年)。通过维特比算法中最具信息量的停止时间进行隐马尔可夫模型估计。在,图像模型(及其语音模型表亲)(明尼阿波利斯,明尼苏达州,1993/1994)。IMA卷数学。申请。80 115-130. 纽约:施普林格·Zbl 0895.62087号
[24] Koloydenko,A.、Käärik,M.和Lember,J.(2007年)。关于调整后的维特比训练。,实际应用。数学。96 309-326·Zbl 1116.62082号 ·数字对象标识代码:10.1007/s10440-007-9102-5
[25] Krogh,A.(1998)。,分子生物学中的计算方法。阿姆斯特丹:荷兰北部。
[26] Lember,J.和Koloydenko,A.(2007年)。调整了隐马尔可夫模型的维特比训练。诺丁汉大学数学科学学院技术报告07-01,网址:,http://arxiv.org/abs/0709.2317v1。 ·Zbl 1120.62075号 ·doi:10.1017/S0269964807000083
[27] Lember,J.和Koloydenko,A.(2007年)。调整后的维特比训练:概念证明。,普罗巴伯。工程信息科学。21 451-475. ·兹比尔1120.62075 ·doi:10.1017/S0269964807000083
[28] Lember,J.和Koloydenko,A.(2007年)。两状态隐马尔可夫模型中的无限维特比比对。在,程序。第八届Tartu Conf.多元统计·Zbl 1166.62062号
[29] Leroux,B.G.(1992年)。隐马尔可夫模型的极大似然估计。,随机过程。申请。40 127-143. ·Zbl 0738.62081号 ·doi:10.1016/0304-4149(92)90141-C
[30] Li,J.、Gray,R.M.和Olshen,R.A.(2000年)。基于二维隐马尔可夫模型分层建模的多分辨率图像分类。,IEEE传输。通知。理论46 1826-1841·Zbl 1002.94002号 ·数字对象标识代码:10.1109/18.857794
[31] Lindgren,G.(1978年)。混合分布和切换回归的马尔可夫状态模型。,扫描。J.统计。5 81-91. ·Zbl 0382.62073号
[32] McDermott,E.和Hazen,T.(2004)。用于实时连续语音识别的地标模型的最小分类误差训练。在,程序。ICASSP。
[33] McLachlan,G.和Peel,D.(2000)。,有限混合模型。纽约:Wiley·Zbl 0963.62061号
[34] Merhav,N.和Ephraim,Y.(1991年)。使用主导状态序列的隐马尔可夫模型及其在语音识别中的应用。,计算。演讲语言5 327-339。
[35] Ney,H.、Steinbiss,V.、Haeb-Umbach,R.等人(1994年)。飞利浦大词汇量连续语音识别研究系统概述。,国际J模式识别。Artif公司。因特尔。8 33-70.
[36] Och,F.和Ney,H.(2000)。改进了统计对齐模型。在,程序。38安。见面。关联计算。语言学家。440-447. 计算语言学协会。
[37] Ohler,U。、Niemann,H。、Liao,G和Rubin,G。(2001年)。DNA序列和物理特性的联合建模以提高真核生物启动子识别。,生物信息学17 S199-S206。
[38] Padmanabhan,M.和Picheny,M.(2002年)。大范围语音识别算法。,计算机35 42-50。
[39] Rabiner,L.(1989)。语音识别中的隐马尔可夫模型和选定应用教程。,程序。IEEE 77 257-286标准。
[40] Rabiner,L.和Juang,B.(1993)。,语音识别基础。新泽西州上鞍河:普伦蒂斯·霍尔·Zbl 0762.62036号
[41] Rabiner,L.、Wilpon,J.和Juang,B.(1986年)。节段K表示连接词识别的训练过程。,美国电话电报公司技术期刊64 21-40。
[42] Ryden,T.(1993)。隐马尔可夫模型的一致渐近正态参数估计。,安。统计师。22 1884-1895. ·Zbl 0831.62060号 ·doi:10.1214操作系统/1176325762
[43] Sabin,M.和Gray,R.(1986年)。广义Lloyd算法的全局收敛性和经验一致性。,IEEE传输。信息论32 148-155·Zbl 0593.94002号 ·doi:10.1109/TIT.1986.1057168
[44] Sclove,S.(1983年)。条件种群混合模型在图像分割中的应用。,IEEE传输。模式分析。机器。因特尔。5 428-433. ·Zbl 0514.62065号 ·doi:10.1109/TPAMI.1983.4767412
[45] Sclove,S.(1984)。作者回复。,IEEE传输。模式分析。机器。因特尔。5 657-658.
[46] Shu,I.、Hetherington,L.和Glass,J.(2003)。基于分段语音识别的Baum-Welch训练。在,《IEEE 2003自动语音识别与理解研讨会论文集》43-48。
[47] Steinbiss,V.、Ney,H.、Aubert,X.等人(1995年)。飞利浦连续语音识别研究系统。,飞利浦J.Res.49 317-352。
[48] Ström,N.、Hetherington,L.、Hazen,T.、Sandness,E.和Glass,J.(1999)。基于分段的语音识别器中的声学建模改进。在,IEEE 1999自动语音识别和理解研讨会139-142的会议记录。
[49] 蒂特林顿,D.M.(1984)。关于“条件种群混合模型在图像分割中的应用”的评论。,IEEE传输。模式分析。机器。因特尔。6 656-657.
[50] Wessel,F.和Ney,H.(2005)。大词汇量连续语音识别声学模型的无监督训练。,IEEE传输。语音音频处理。13 23-31.
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。