×

通过实际EM型算法对偏斜Student-\(t\)-正态分布混合物的最大似然推理。 (英语) Zbl 1322.62087号

摘要:本文讨论了混合斜交Student正态分布的最大似然估计问题,这是一种新的基于模型的工具,用于在存在斜交和重尾结果的情况下聚类异质(多组)数据。我们提出了两种用于迭代计算最大似然估计的分析简单EM型算法。为了获得参数估计的渐近标准误差,导出了观测信息矩阵。进行了一项小型模拟研究,以证明与偏斜分布相比,偏斜学生-(t\)-正态分布的优越性。提出的方法对于分析流式细胞术等主要生物技术平台产生的多模态不对称数据特别有用。我们通过一个示例提供了这样的应用程序。

MSC公司:

10层62层 点估计
2012年12月62日 参数估计量的渐近性质
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿扎里尼,A.:偏正态分布和相关的多变量家族(与讨论)。扫描。《美国联邦法律大全》第32卷第159-188页(2005年)·Zbl 1091.62046号 ·数字对象标识代码:10.1111/j.1467-9469.2005.00426.x
[2] Azzalini,A.,Capitaino,A.:对称扰动产生的分布,强调多元斜t分布。J.R.Stat.Soc.B 65,367–389(2003)·Zbl 1065.62094号 ·数字对象标识代码:10.1111/1467-9868.00391
[3] Barndorff-Nielsen,O.E.:正态逆高斯分布和随机波动率建模。扫描。J.Stat.24,1-13(1997)·Zbl 0934.62109号 ·doi:10.1111/1467-9469.t01-1-00045
[4] Basford,K.E.,Greenway,D.R.,McLachlan,G.J.,Peel,D.:正常混合物下拟合平均值的标准误差。计算。《法律总汇》第12卷,第1-17页(1997年)·Zbl 0924.62055号
[5] Bishop,C.M.:模式识别和机器学习。新加坡施普林格(2006)·Zbl 1107.68072号
[6] Cabral,C.R.B.,Bolfarine,H.,Pereira,J.R.G.:使用斜交学生正态混合物的贝叶斯密度估计。计算。统计数据分析。52, 5075–5090 (2008) ·Zbl 1452.62263号 ·doi:10.1016/j.csda.2008.05.003
[7] Dempster,A.P.,Laird,N.M.,Rubin,D.B.:通过EM算法从不完整数据中获得最大似然(带讨论)。J.R.Stat.Soc.B 39,1–38(1977年)·Zbl 0364.62022号
[8] 弗雷利,C.,拉弗瑞,A.E.:有几个集群?哪种聚类方法?通过基于模型的聚类分析回答。计算。J.41,578–588(1998)·兹伯利0920.68038 ·doi:10.1093/comjnl/41.8.578
[9] Fraley,C.、Raftery,A.E.:基于模型的聚类、判别分析和密度估计。《美国统计协会期刊》97、611–612(2002)·Zbl 1073.62545号 ·doi:10.1198/016214502760047131
[10] Frühwirth-Schnatter,S.:有限混合和马尔可夫切换模型。施普林格,纽约(2006)·Zbl 1108.6202号
[11] Frühwirth-Schnatter,S.,Pyne,S.:一元和多元斜正态分布和斜t分布有限混合的贝叶斯推断。生物统计学11,317–336(2010)·doi:10.1093/biostatistics/kxp062
[12] Glynn,E.F.:FCS萃取实用程序。斯托尔斯医学研究所。在线访问:http://research.stowers-institute.org/efg/ScientificSoftware/Utility/FCSExtract/ (2006)
[13] Gómez,H.W.,Venegas,O.,Bolfarine,H.:正态分布的分布函数产生的不对称分布。环境计量18,395–407(2007)·doi:10.1002/env.817
[14] Hahne,F.,LeMeur,N.,Brinkman,R.R.,Ellis,B.,Haaland,P.,Sarkar,D.,Spidlen,J.,Strain,E.,Gentleman,R.:flowCore:高通量流式细胞术的生物导体包。BMC生物信息。10, 106 (2009) ·数字对象标识代码:10.1186/1471-2105-106
[15] Karlis,D.,Santourian,A.:具有非椭圆轮廓分布的基于模型的聚类。统计计算。19, 73–83 (2009) ·doi:10.1007/s11222-008-9072-0
[16] Keribin,C.:混合模型阶数的一致估计。Sankhyá62、49–66(2000)·Zbl 1081.62516号
[17] Li,J.Q.,Barron,A.R.:混合物密度估算。主题:神经信息处理系统进展12。麻省理工学院出版社,剑桥(2000)
[18] Lin,T.I.:多元正态混合模型的最大似然估计。J.多变量。分析。100, 257–265 (2009) ·Zbl 1152.62034号 ·doi:10.1016/j.jmva.2008.04.010
[19] Lin,T.I.:使用多元斜T分布的稳健混合建模。统计计算。20, 343–356 (2010) ·doi:10.1007/s11222-009-9128-9
[20] Lin,T.I.,Lee,J.C.,Hsieh,W.J.:使用斜T分布的稳健混合建模。统计计算。17、81–92(2007a)·doi:10.1007/s11222-006-9005-8
[21] Lin,T.I.,Lee,J.C.,Yen,S.Y.:使用斜正态分布的有限混合建模。统计正弦。17909–927(2007b)·Zbl 1133.62012年
[22] Liu,C.H.,Rubin,D.B.:ECME算法:EM和ECM的简单扩展,具有更快的单调收敛性。《生物特征》81、633–648(1994)·Zbl 0812.62028号 ·doi:10.1093/biomet/81.4.633
[23] Louis,T.A.:使用EM算法时查找观测信息矩阵。J.R.Stat.Soc.B 44,226–233(1982)·Zbl 0488.62018号
[24] McLachlan,G.J.,Basford,K.E.:《混合模型:聚类的推断和应用》,Dekker,纽约(1988)·Zbl 0697.62050号
[25] McLachlan,G.J.,Krishnan,T.:EM算法和扩展,第2版。威利,纽约(2008)·Zbl 1165.62019号
[26] McLachlan,G.J.,Peel,D.:有限混合模型。威利,纽约(2000年)·Zbl 0963.62061号
[27] McNicholas,P.D.,Murphy,T.B.:简约高斯混合模型。统计计算。18, 285–296 (2008) ·doi:10.1007/s11222-008-9056-0
[28] Meinike,P.、Brodag,T.、Fricke,W.F.、Waack,S.:基于P值的密码子使用数据可视化。算法分子生物学。1, 10 (2006) ·doi:10.186/1748-7188-1-10
[29] Meng,X.L.,Rubin,D.B.:通过ECM算法的最大似然估计:一般框架。生物特征80,267–278(1993)·Zbl 0778.62022号 ·doi:10.1093/biomet/80.2.267
[30] Nadarajah,S.,Kotz,S.:正常内核生成的扭曲分布。统计概率。莱特。65, 269–277 (2003) ·兹比尔1048.62014 ·doi:10.1016/j.spl.2003.07.013
[31] Pyne,S.,Hu,X.,Wang,K.,Rossin,E.,Lin,T.I.,Maier,L.,Baecher-Allan,C.,McLachlan,G.J.,Tamayo,P.,Hafler,D.A.,De Jager,P.L.,Mesirov,J.P.:自动化高维流式细胞术数据分析。程序。国家。阿卡德。科学。美国106、8519–8524(2009)·doi:10.1073/pnas.0903028106
[32] R开发核心团队:R:统计计算的语言和环境。R统计计算基金会,维也纳(2008年)
[33] Sahu,S.K.,Dey,D.K.,Branco,M.D.:一类新的多元偏态分布及其在贝叶斯回归模型中的应用。可以。J.Stat.31,129–150(2003)·Zbl 1039.62047号 ·doi:10.2307/3316064
[34] Schwarz,G.:估算模型的维数。Ann.Stat.6,461–464(1978)·Zbl 0379.62005年 ·doi:10.1214/aos/1176344136
[35] Titterington,D.M.,Smith,A.F.M.,Markov,U.E.:有限混合分布的统计分析。威利,纽约(1985年)·Zbl 0646.62013.中
[36] Vlassis,N.,Likas,A.:用于高斯混合学习的贪婪EM算法。神经过程。莱特。15, 77–87 (2002) ·Zbl 1008.68734号 ·doi:10.1023/A:1013844811137
[37] Wang,K.,Ng,S.K.,McLachlan,G.J.:多变量斜t混合模型:荧光激活细胞分类数据的应用。在:《2009年DICTA会议记录》,数字图像计算:技术与应用会议,墨尔本,第526–531页。IEEE计算机学会,洛斯阿拉米托斯(2009)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。