尼古拉斯·施特勒;萨克·穆克吉 具有状态特定图形模型的高维隐马尔可夫模型中的惩罚估计。 (英文) 兹比尔1283.62174 附录申请。斯达。 7,第4期,2157-2179(2013). 摘要:我们考虑了具有多元正态观测值的隐马尔可夫模型(HMM)中的惩罚估计。在中等到大维度的环境中,由于状态的隐藏性质引起了一些担忧,HMM的估计在实践中仍然具有挑战性。我们通过对状态特定的逆协方差矩阵进行惩罚来解决这些问题。惩罚估计导致稀疏的逆协方差矩阵,可以解释为状态特定的条件独立图。在这种潜在的变量设置中,惩罚是很重要的;我们提出了一种惩罚机制,它可以自动适应状态数(K)和特定于状态的样本大小,并可以处理未知状态引起的缩放问题。该方法具有自适应性和通用性,尤其适用于低维和高维设置,无需手动调整。此外,我们的方法有助于通过对连续候选值(K)的耦合估计来探索状态数(K)。仿真实例的实验结果证明了该方法的有效性。在基因组生物学的一个具有挑战性的实际数据示例中,我们证明了我们的方法能够提高预测能力,并提供比现有方法更丰富的估计。 引用于2文件 MSC公司: 2005年6月2日 马尔可夫过程:估计;隐马尔可夫模型 2009年6月26日 非马尔可夫过程:估计 62页第10页 统计学在生物学和医学中的应用;元分析 65C60个 统计中的计算问题(MSC2010) 05C90年 图论的应用 关键词:隐马尔可夫模型;图形拉索;普遍正则化;型号选择;MMDL公司;贪婪反向修剪;基因组生物学;染色质模型 软件:麦克卢斯特;玻璃制品 PDF格式BibTeX公司 XML格式引用 \textit{N.Städler}和\textit{S.Mukherjee},Ann.Appl。Stat.7,No.4,2157--2179(2013;Zbl 1283.62174) 全文: 内政部 arXiv公司 欧几里得 参考文献: [1] Barron,A.、Huang,C.、Li,J.Q.和Luo,X.(2008)。MDL原理、惩罚可能性和统计风险。麻省理工学院出版社。芬兰坦佩雷坦佩雷大学出版社。 [2] Bicego,M.、Murino,V.和Figueiredo,M.A.T.(2003)。一种用于选择隐马尔可夫模型中状态数的序列剪枝策略。模式识别字母24 1395-1407·Zbl 1020.62071号 ·doi:10.1016/S0167-8655(02)00380-X [3] Bühlmann,P.和van de Geer,S.(2011)。高维数据统计:方法、理论和应用。海德堡施普林格·Zbl 1273.62015年 [4] Donoho,D.L.和Johnstone,I.M.(1994年)。通过小波收缩实现理想的空间自适应。生物特征81 425-455·Zbl 0815.62019号 ·doi:10.1093/biomet/81.3.425 [5] Durbin,R.、Eddy,S.R.、Krogh,A.和Mitchison,G.J.(1998年)。生物序列分析:蛋白质和核酸的概率模型。剑桥大学出版社,剑桥·Zbl 0929.92010号 [6] ENCODE项目联盟(2012年)。人类基因组中DNA元素的综合百科全书。自然489 57-74。 [7] Ernst,J.和Kellis,M.(2010年)。人类基因组系统注释染色质状态的发现和表征。自然生物技术。28 817-825. [8] Figueiredo,M.A.T.和Jain,A.K.(2000)。有限混合模型的无监督学习。IEEE模式分析和机器智能汇刊24 381-396。 [9] Figueiredo,M.A.T.、Leitáo,J.M.N.和Jain,A.K.(1999)。关于拟合混合模型。第二届计算机视觉和模式识别中能量最小化方法国际研讨会论文集,EMMCVPR’99 54-69。柏林施普林格。 [10] Filion,G.J.、van Bemmel,J.G.、Braunschweig,U.、Talhout,W.、Kind,J.、Ward,L.D.、Brugman,W.,de Castro,I.J.,Kerkhoven,R.M.、Bussemaker,H.J.和van Steensel,B.(2010年)。系统蛋白质定位图揭示了果蝇细胞中的五种主要染色质类型。手机143 212-224。 [11] Fraley,C.和Raftery,A.E.(2002年)。基于模型的聚类、判别分析和密度估计。J.Amer。统计师。协会97 611-631·Zbl 1073.62545号 ·doi:10.19198/0162114502760047131 [12] Fraley,C.和Raftery,A.E.(2006年)。MCLUST第3版R:正态混合建模和基于模型的聚类。技术报告504,华盛顿大学统计系,西雅图,华盛顿州。 [13] Friedman,J.、Hastie,T.和Tibshirani,R.(2008)。用图形套索进行稀疏逆协方差估计。生物统计学9 432-441·Zbl 1143.62076号 ·doi:10.1093/biostatistics/kxm045 [14] Grünwald,P.D.(2007)。最小描述长度原则。麻省理工学院出版社,马萨诸塞州剑桥。 [15] Hennig,C.和Liao,T.F.(2013)。如何为混合型变量找到合适的聚类,并应用于社会经济分层。J.R.统计社会服务。C.应用。统计数字62 309-369·文件编号:10.1111/j.1467-9876.2012.01066.x [16] Hill,S.M.和Mukherjee,S.(2013)。混合L1优化高斯图形模型的基于网络的聚类:一项实证研究。可从获取。1301.2194 [17] Khalili,A.和Chen,J.(2007年)。回归模型有限混合中的变量选择。J.Amer。统计师。协会102 1025-1038·Zbl 1469.62306号 ·doi:10.1198/0162145000000590 [18] Krogh,A.、Mian,I.S.和Haussler,D.(1994年)。在大肠杆菌DNA中发现基因的隐马尔可夫模型。核酸研究22 4768-4778。 [19] Meinshausen,N.和Bühlmann,P.(2006)。高维图和用套索选择变量。Ann.Statist公司。34 1436-1462. ·Zbl 1113.62082号 ·doi:10.1214/0090536000000281 [20] Pan,W.和Shen,X.(2007)。基于惩罚模型的聚类及其在变量选择中的应用。J.马赫。学习。第8号决议1145-1164·Zbl 1222.68279号 [21] Park,P.(2009)。ChIP-seq:成熟技术的优势和挑战。《自然评论遗传学》10 669-680。 [22] Rothman,A.J.、Bickel,P.J.、Levina,E.和Zhu,J.(2008)。稀疏置换不变协方差估计。电子。《美国联邦法律大全》第2卷第494-515页·Zbl 1320.62135号 ·doi:10.1214/08-EJS176 [23] Städler,N.、Bühlmann,P.和van de Geer,S.(2010年)\混合回归模型的(ell{1})惩罚。测试19 209-256·Zbl 1203.62128号 ·doi:10.1007/s11749-010-0197-z [24] Städler,N.和Mukherjee,S.(2013年)。补充“具有状态特定图形模型的高维隐马尔可夫模型中的惩罚估计”·Zbl 1283.62174号 [25] Sun,T.和Zhang,C.-H.(2012)。缩放稀疏线性回归。生物特征99 879-898·Zbl 1452.62515号 ·doi:10.1093/biomet/ass043 [26] Tibshirani,R.(1996)。通过套索回归收缩和选择。J.R.统计社会服务。B统计方法。58 267-288. ·兹比尔0850.62538 [27] van Steensel,B.和Henikoff,S.(2000年)。使用系链dam甲基转移酶鉴定染色质蛋白的体内DNA靶点。自然生物技术。18 424-428. [28] Yuan,M.和Lin,Y.(2007)。高斯图形模型中的模型选择和估计。生物特征94 19-35·Zbl 1142.62408号 ·doi:10.1093/biomet/asm018 [29] Zhang,C.-H.(2010)。极小极大凹惩罚下的几乎无偏变量选择。安。统计师。38 894-942. ·Zbl 1183.62120号 ·doi:10.1214/09-AOS729 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不声称其完整性或完全匹配。