×

正态混合模型的假设检验:EM方法。 (英语) Zbl 1173.62007年

总结:正态混合物分布可以说是最重要的混合物模型,也是最具技术挑战性的模型。基于一组随机样本,正态混合模型的似然函数是无界的,除非对其分量方差参数设置了人工界。此外,该模型不具有很强的可识别性,因此很难区分由混合物的存在引起的过度分散和由大方差引起的过度离散,并且具有关于混合比例的无限Fisher信息。对有限正态混合模型已经进行了广泛的研究,但其中大部分研究仅涉及点估计的一致性或有用的实际过程,并且许多结果需要对参数空间进行不期望的限制。
我们表明,在有限正态混合物的情况下,均匀性的EM测试可以有效地克服许多挑战。我们发现,当混合方差相等但未知时,EM检验的极限分布是(0.5chi{0}^{2}+0.5chi{1}^{2])和(chi{1{2})分布的简单函数,而当方差不相等且未知时,极限分布则是(chi{2}^{2})的简单函数。仿真结果表明,极限分布很好地逼近了有限样本分布。使用了两个遗传示例来说明EM测试的应用。

MSC公司:

62F03型 参数假设检验
65C60个 统计中的计算问题(MSC2010)
62E20型 统计学中的渐近分布理论
62F05型 参数检验的渐近性质
62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Cai,T.、Jin,J.和Low,M.(2007)。稀疏正态混合的估计和置信集。安。统计师。35 2421-2449. ·兹比尔1360.62113 ·doi:10.1214/00905360700000334
[2] Charnigo,R.和Sun,J.(2004)。通过竞争模型之间的L2距离测试混合分布的均匀性。J.Amer。统计师。协会99 488-498·Zbl 1117.62307号 ·doi:10.1198/016214500000494
[3] Chen,H.和Chen,J.(2003)。存在结构参数的正常混合物的均匀性试验。统计师。中国13 351-365·Zbl 1015.62015号
[4] Chen,H.、Chen,J.和Kalbfleisch,J.D.(2001)。有限混合模型中均匀性的改进似然比。J.R.统计社会服务。B统计方法。63 19-29. ·Zbl 0976.62011号 ·doi:10.1111/1467-9868.00273
[5] Chen,J.(1995)。有限混合模型中的最优收敛速度。安。统计师。23 221-234. ·Zbl 0821.62023号 ·doi:10.1214/aos/1176324464
[6] Chen,J.和Kalbfleisch,J.D.(2005年)。具有结构参数的有限混合模型中的改进似然比检验。J.统计学家。计划。推断129 93-107·Zbl 1058.62020号 ·doi:10.1016/j.jspi.2004.06.041
[7] Chen,J.和Li,P.(2008)。正态混合物模型中的均匀性检验:EM方法。技术报告,不列颠哥伦比亚大学。
[8] Chen,J.、Tan,X.和Zhang,R.(2008)。均值和方差的正态混合推断。统计师。西尼卡。18 443-465. ·Zbl 1135.62018号
[9] Dacunha-Castelle,D.和Gassiat,E.(1999)。使用局部二次曲线参数化测试模型的阶数:总体混合和平稳ARMA过程。安。统计师。27 1178-1209. ·Zbl 0957.62073号 ·doi:10.1214/aos/1017938921
[10] Efron,B.(2004)。大规模模拟假设检验:选择一个无效假设。J.Amer。统计师。协会99 96-104·Zbl 1089.62502号 ·doi:10.198/01621454000000089
[11] Everitt,B.S.(1996年)。有限混合分布简介。统计师。方法医学研究5 107-127。
[12] Everitt,B.S.、Landau,S.和Leese,M.(2001)。《聚类分析》,第四版,牛津大学出版社,纽约州纽约市·Zbl 1205.62076号
[13] Feng,Z.D.和McCulloch,C.E.(1994年)。关于方差不等的正态混合物中成分数量的似然比检验统计量。生物统计学50 1158-1162·Zbl 0825.62375号 ·doi:10.2307/2533453
[14] Garel,B.(2005)。用于识别混合物的似然比检验的渐近理论。J.统计学家。计划。推论131 271-296·Zbl 1061.62028号 ·doi:10.1016/j.jspi.2004.01.006
[15] Ghosh,J.K.和Sen,P.K.(1985年)。关于混合模型对数似然比统计量的渐近性能和相关结果。《伯克利纪念杰里·内曼(Jerzy Neyman)和杰克·基弗(Jack Kiefer)会议记录》(L.LeCam和R.A.Olshen,eds.)2 789-806。加利福尼亚州蒙特利市沃兹沃斯·Zbl 1373.62075号
[16] Hall,P.和Stewart,M.(2005年)。双组分正态混合模型中功率的理论分析。J.统计学家。计划。推论134 158-179·Zbl 1066.62031号 ·doi:10.1016/j.jspi.2004.04.003
[17] Hartigan,J.A.(1985)。正态混合的似然渐近失效。《伯克利纪念杰里·内曼(Jerzy Neyman)和杰克·基弗(Jack Kiefer)会议记录》(L.LeCam和R.A.Olshen,eds.)2 807-810。加利福尼亚州蒙特利市沃兹沃斯·Zbl 1373.62070号
[18] Hathaway,R.J.(1985)。正态混合分布极大似然估计的约束公式。安。统计师。13 795-800. ·Zbl 0576.62039号 ·doi:10.1214/aos/1176349557
[19] Kon,S.(1984)。股票收益模型——比较。财务杂志39 147-165。
[20] Levine,R.(1981)。精神分裂症的性别差异:时间或亚型?心理公报90 432-444。
[21] Li,P.、Chen,J.和Marriott,P.(2008)。非有限Fisher信息和同质性:EM方法。生物特征。
[22] Liu,X.,Pasarica,C.和Shao,Y.(2003)。在伽马混合模型中测试均匀性。扫描。J.统计学家。30 227-239. ·Zbl 1034.62010年 ·数字对象标识代码:10.1111/1467-9469.00328
[23] Liu,X.和Shao,Y.Z.(2004)。可识别性损失下似然比检验的渐近性。安。统计师。31 807-832. ·Zbl 1032.62014年 ·doi:10.1214操作系统/1056562463
[24] Liu,X.和Shao,Y.Z.(2004)。二元正态混合模型中似然比检验的渐近性。J.统计学家。计划。推论123 61-81·Zbl 1050.62025号 ·doi:10.1016/S0378-3758(03)00138-1
[25] Loisel,P.、Goffinet,B.、Monod,H.和Montes De Oca,G.(1994年)。检测F2群体中的一个主要基因。生物统计学50 512-516·Zbl 0825.62767号 ·doi:10.2307/2533394
[26] MacKenzie,S.A.和Bassett,M.J.(1987)。细胞质不育菜豆育性恢复的遗传学I.核恢复基因引起的细胞质改变。理论与应用遗传学74 642-645。
[27] Marriott,P.(2007)。扩展局部混合模型。Ann.Inst.Statist公司。数学。59 95-110. ·Zbl 1108.62004号 ·doi:10.1007/s10463-006-0100-6
[28] McLachlan,G.J.(1987)。自举时,正常混合物中成分数量的似然比检验统计量。应用统计学36 318-324。
[29] McLachlan,G.J.、Bean,R.W.和Ben Tovim Jones,L.(2006年)。多类微阵列中差异基因表达的正常混合方法的简单实现。生物信息学22 1608-1615。
[30] McLaren,C.E.(1996)。血液学混合模型:一系列案例研究。统计方法医学研究5 129-153。
[31] Pearson,K.(1894年)。对进化数学理论的贡献。伦敦皇家学会哲学学报A 185 71-110。
[32] Raftery,A.E.和Dean,N.(2006年)。基于模型聚类的变量选择。J.Amer。统计师。协会101 168-178·Zbl 1118.62339号 ·doi:10.1198/016214500000113
[33] Roeder,K.(1994)。用于确定混合法线中组件数量的图形技术。J.Amer。统计师。协会89 487-495·Zbl 0798.62004号 ·doi:10.2307/2290850
[34] Schork,N.J.、Allison,D.B.和Thiel,B.(1996)。人类遗传学研究中的混合分布。Stat.Methods Med.Res.5 155-178.《统计学方法》,医学研究,第5卷,第155-178页。
[35] Sun,W.和Cai,T.T.(2007)。Oracle和自适应复合决策规则用于错误发现率控制。J.Amer。统计师。协会102 901-912·Zbl 1469.62318号 ·doi:10.1198/0162145000000545
[36] Tadesse,M.、Sha,N.和Vannucci,M.(2005)。高维数据聚类中的贝叶斯变量选择。J.Amer。统计师。协会100 602-617·Zbl 1117.62433号 ·doi:10.1198/0162145000001565
[37] Wolfe,J.H.(1971)。多正态分布混合物似然比抽样分布的蒙特卡罗研究。技术公告STB 72-2,海军人员和训练研究实验室,圣地亚哥。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。