×

具有状态特定图形模型的高维隐马尔可夫模型中的惩罚估计。 (英文) 兹比尔1283.62174

摘要:我们考虑了具有多元正态观测值的隐马尔可夫模型(HMM)中的惩罚估计。在中等到大维度的环境中,由于状态的隐藏性质引起了一些担忧,HMM的估计在实践中仍然具有挑战性。我们通过对状态特定的逆协方差矩阵进行惩罚来解决这些问题。惩罚估计导致稀疏的逆协方差矩阵,可以解释为状态特定的条件独立图。
在这种潜在的变量设置中,惩罚是很重要的;我们提出了一种惩罚机制,它可以自动适应状态数(K)和特定于状态的样本大小,并可以处理未知状态引起的缩放问题。该方法具有自适应性和通用性,尤其适用于低维和高维设置,无需手动调整。此外,我们的方法有助于通过对连续候选值(K)的耦合估计来探索状态数(K)。仿真实例的实验结果证明了该方法的有效性。在基因组生物学的一个具有挑战性的实际数据示例中,我们证明了我们的方法能够提高预测能力,并提供比现有方法更丰富的估计。

MSC公司:

2005年6月2日 马尔可夫过程:估计;隐马尔可夫模型
2009年6月26日 非马尔可夫过程:估计
62页第10页 统计学在生物学和医学中的应用;元分析
65C60个 统计中的计算问题(MSC2010)
05C90年 图论的应用
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Barron,A.、Huang,C.、Li,J.Q.和Luo,X.(2008)。MDL原理、惩罚可能性和统计风险。麻省理工学院出版社。芬兰坦佩雷坦佩雷大学出版社。
[2] Bicego,M.、Murino,V.和Figueiredo,M.A.T.(2003)。一种用于选择隐马尔可夫模型中状态数的序列剪枝策略。模式识别字母24 1395-1407·Zbl 1020.62071号 ·doi:10.1016/S0167-8655(02)00380-X
[3] Bühlmann,P.和van de Geer,S.(2011)。高维数据统计:方法、理论和应用。海德堡施普林格·Zbl 1273.62015年
[4] Donoho,D.L.和Johnstone,I.M.(1994年)。通过小波收缩实现理想的空间自适应。生物特征81 425-455·Zbl 0815.62019号 ·doi:10.1093/biomet/81.3.425
[5] Durbin,R.、Eddy,S.R.、Krogh,A.和Mitchison,G.J.(1998年)。生物序列分析:蛋白质和核酸的概率模型。剑桥大学出版社,剑桥·Zbl 0929.92010号
[6] ENCODE项目联盟(2012年)。人类基因组中DNA元素的综合百科全书。自然489 57-74。
[7] Ernst,J.和Kellis,M.(2010年)。人类基因组系统注释染色质状态的发现和表征。自然生物技术。28 817-825.
[8] Figueiredo,M.A.T.和Jain,A.K.(2000)。有限混合模型的无监督学习。IEEE模式分析和机器智能汇刊24 381-396。
[9] Figueiredo,M.A.T.、Leitáo,J.M.N.和Jain,A.K.(1999)。关于拟合混合模型。第二届计算机视觉和模式识别中能量最小化方法国际研讨会论文集,EMMCVPR’99 54-69。柏林施普林格。
[10] Filion,G.J.、van Bemmel,J.G.、Braunschweig,U.、Talhout,W.、Kind,J.、Ward,L.D.、Brugman,W.,de Castro,I.J.,Kerkhoven,R.M.、Bussemaker,H.J.和van Steensel,B.(2010年)。系统蛋白质定位图揭示了果蝇细胞中的五种主要染色质类型。手机143 212-224。
[11] Fraley,C.和Raftery,A.E.(2002年)。基于模型的聚类、判别分析和密度估计。J.Amer。统计师。协会97 611-631·Zbl 1073.62545号 ·doi:10.19198/0162114502760047131
[12] Fraley,C.和Raftery,A.E.(2006年)。MCLUST第3版R:正态混合建模和基于模型的聚类。技术报告504,华盛顿大学统计系,西雅图,华盛顿州。
[13] Friedman,J.、Hastie,T.和Tibshirani,R.(2008)。用图形套索进行稀疏逆协方差估计。生物统计学9 432-441·Zbl 1143.62076号 ·doi:10.1093/biostatistics/kxm045
[14] Grünwald,P.D.(2007)。最小描述长度原则。麻省理工学院出版社,马萨诸塞州剑桥。
[15] Hennig,C.和Liao,T.F.(2013)。如何为混合型变量找到合适的聚类,并应用于社会经济分层。J.R.统计社会服务。C.应用。统计数字62 309-369·文件编号:10.1111/j.1467-9876.2012.01066.x
[16] Hill,S.M.和Mukherjee,S.(2013)。混合L1优化高斯图形模型的基于网络的聚类:一项实证研究。可从获取。1301.2194
[17] Khalili,A.和Chen,J.(2007年)。回归模型有限混合中的变量选择。J.Amer。统计师。协会102 1025-1038·Zbl 1469.62306号 ·doi:10.1198/0162145000000590
[18] Krogh,A.、Mian,I.S.和Haussler,D.(1994年)。在大肠杆菌DNA中发现基因的隐马尔可夫模型。核酸研究22 4768-4778。
[19] Meinshausen,N.和Bühlmann,P.(2006)。高维图和用套索选择变量。Ann.Statist公司。34 1436-1462. ·Zbl 1113.62082号 ·doi:10.1214/0090536000000281
[20] Pan,W.和Shen,X.(2007)。基于惩罚模型的聚类及其在变量选择中的应用。J.马赫。学习。第8号决议1145-1164·Zbl 1222.68279号
[21] Park,P.(2009)。ChIP-seq:成熟技术的优势和挑战。《自然评论遗传学》10 669-680。
[22] Rothman,A.J.、Bickel,P.J.、Levina,E.和Zhu,J.(2008)。稀疏置换不变协方差估计。电子。《美国联邦法律大全》第2卷第494-515页·Zbl 1320.62135号 ·doi:10.1214/08-EJS176
[23] Städler,N.、Bühlmann,P.和van de Geer,S.(2010年)\混合回归模型的(ell{1})惩罚。测试19 209-256·Zbl 1203.62128号 ·doi:10.1007/s11749-010-0197-z
[24] Städler,N.和Mukherjee,S.(2013年)。补充“具有状态特定图形模型的高维隐马尔可夫模型中的惩罚估计”·Zbl 1283.62174号
[25] Sun,T.和Zhang,C.-H.(2012)。缩放稀疏线性回归。生物特征99 879-898·Zbl 1452.62515号 ·doi:10.1093/biomet/ass043
[26] Tibshirani,R.(1996)。通过套索回归收缩和选择。J.R.统计社会服务。B统计方法。58 267-288. ·兹比尔0850.62538
[27] van Steensel,B.和Henikoff,S.(2000年)。使用系链dam甲基转移酶鉴定染色质蛋白的体内DNA靶点。自然生物技术。18 424-428.
[28] Yuan,M.和Lin,Y.(2007)。高斯图形模型中的模型选择和估计。生物特征94 19-35·Zbl 1142.62408号 ·doi:10.1093/biomet/asm018
[29] Zhang,C.-H.(2010)。极小极大凹惩罚下的几乎无偏变量选择。安。统计师。38 894-942. ·Zbl 1183.62120号 ·doi:10.1214/09-AOS729
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不声称其完整性或完全匹配。