×

拟合(k)-分量单变量正态混合物时的最小距离估计与EM算法的比较。 (英语) Zbl 1416.62148号

摘要:使用EM-算法拟合正态分布有限混合的最大似然法是公认的估计方法,因为它已被证明优于矩法。最近的书籍证明了这一点。然而,对于这一问题的最大似然法一直存在批评,主要的批评是,当成分分布的方差不相等时,似然实际上是无界的,并且可能存在多个局部极大值。另一个主要批评是,最大似然估计量不稳健。作为处理第一个问题的一种方法,已经提出了几种替代的最小距离估计方法。本文讨论了其中一个估计量,它不仅由于其鲁棒性而优越,而且事实上即使在模型分布的数值研究中也具有优势。重要的是,当数据实际上是正态混合时,EM算法的稳健替代方案(表面上拟合(t)分布)与所选的最小距离估计器相比,在正态混合模型中也没有竞争力。例如,根据中心极限定理,自然过程应导致成分分布为正态的混合物。另一方面,正如稳健性研究中通常假设的那样,由于外来源,数据可能会受到污染。这就需要一个稳健的估计器。

MSC公司:

10层62层 点估计
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Amemiya T(1985)《高级计量经济学》。哈佛大学出版社,剑桥
[2] Benaglia T,Chauveau D,Hunter DR,Young D(2009)Mixtools:分析有限混合模型的R包。J Stat Soft杂志32(6):1-29·doi:10.18637/jss.v032.i06
[3] Basford KE,Greenway DR,McLachlan GJ,Peel D(1997)正常混合物下拟合平均值的标准误差。计算统计12:1-17·Zbl 0924.62055号
[4] Biernacki C,Chretien S(2003)单变量高斯混合模型最大似然估计中的退化·Zbl 1038.62023号 ·doi:10.1016/S0167-7152(02)00396-6
[5] Biernacki C,Celeux G,Govaert G(2003)混合模型中获得最大可能性的策略。客座编辑:Böhning和Seidel。计算统计数据分析41:561-575·Zbl 1429.62235号 ·doi:10.1016/S0167-9473(02)00163-9
[6] Choi K,Bulgren WG(1968)混合分布的估计程序。J R统计Soc B 30:444-460·Zbl 0187.15804号
[7] Clarke BR(1989)两个正态分布混合中比例参数的无偏最小距离估计。统计调查报告7(4):275-281·Zbl 0667.62015年 ·doi:10.1016/0167-7152(89)90105-3
[8] Clarke BR(2000)《可微性与稳健性的关系及其在地震数据分析中的应用》。PINSA 66A:467-482
[9] Clarke BR、Heathcote CR(1978)对Quandt,R.E.和Ramsey,J.B.J Am Stat Assoc 73:749-750的“正态分布和切换回归混合估计”的评论·doi:10.1080/01621459.1978.10480092
[10] Clarke BR,Heathcote CR(1994),k分量单变量正态混合物的稳健估计。Ann Inst统计数学46:83-93·Zbl 0802.62039号 ·doi:10.1007/BF00773595
[11] Clarke BR,Futshik A(2007)关于估计高维参数时牛顿方法的收敛性。多变量分析杂志98:916-931·Zbl 1118.65004号 ·doi:10.1016/j.jmva.2006.12.002
[12] Cutler A,Cordiero-BrañA OI(1996)有限混合模型的最小Hellinger距离估计。美国统计学会杂志91:1716-1723·Zbl 0881.62035号 ·doi:10.1080/01621459.1996.10476743
[13] Dempster AP,Laird NM,Rubin DP(1977)通过EM算法从不完整数据中获得的最大似然(带讨论)。J R统计社会学B 39:1-38·兹比尔0364.62022
[14] Depraeter N,Vandebroek M(2014)线性回归有限混合中的顺序选择。统计帕普55:871-911·Zbl 1334.62138号 ·doi:10.1007/s00362-013-0534-x
[15] Fisher RA(1947)关于部分和整体之间关系的协方差分析方法。生物统计学3:65-68·doi:10.2307/3001641
[16] Fryer JG,Robertson CA(1972)估计混合正态分布的一些方法的比较。生物计量学59:639-648·Zbl 0255.62033号 ·doi:10.1093/biomet/59.3639
[17] Hasselman B(2013)nleqslv:求解非线性方程组。R包版本2.0
[18] Huber PJ,Ronchetti EM(2009)稳健统计,第2版。霍博肯·威利·Zbl 1276.62022号 ·doi:10.1002/9780470434697
[19] Klar B,Meintanis SG(2005)基于经验特征函数的正常混合物试验。计算统计数据分析49:227-242·Zbl 1429.62156号 ·doi:10.1016/j.csda.2004.05.011
[20] Lee SX,McLachlan GJ(2013),关于斜正态分布和斜t分布的混合。高级数据分析分类7(3):241-266·Zbl 1273.62115号 ·doi:10.1007/s11634-013-0132-8
[21] Lee SX,McLachlan GJ(2014)EMMIXuskew:通过EM算法拟合多元斜t分布混合物的R包。J Stat Soft杂志55(12):1-22
[22] Macdonald PDM(1971)Choi,K.和Bulgren,W.G.J R Stat Soc B 33:326-329的论文评论
[23] McLachlan GJ,Krishnan T(2008)EM算法和扩展,第2版。纽约威利·Zbl 1165.62019号 ·doi:10.1002/9780470191613
[24] McLachlan GJ,Peel D(2000)有限混合模型。纽约威利·Zbl 0963.62061号 ·doi:10.1002/0471721182
[25] McLachlan GJ,Peel D,Basford KE,Adams P(1999)EMMIX软件,用于拟合正常分量和t分量的混合物。J统计软件4(2):1-14·doi:10.18637/jss.v004.i02
[26] Pearson K(1894)对进化数学理论的贡献。菲洛斯Trans R Soc Lond A 185(1887-1895):71-110·JFM 25.0347.02号 ·doi:10.1098/rsta.1894.0003
[27] Peel D,McLachlan GJ(2000)使用t分布的稳健混合建模。统计计算10:339-348·doi:10.1023/A:1008981510081
[28] Quandt RE,Ramsey JB(1978)估计正态分布和切换回归的混合。美国统计协会杂志73:730-738·Zbl 0401.62024号 ·doi:10.1080/016214519978.10480085
[29] R开发核心团队(2014)R:统计计算的语言和环境。R统计计算基金会,奥地利维也纳,ISBN 3-900051-07-0。http://www.r-project.org/ ·Zbl 1429.62235号
[30] Redner RA、Walker HF(1984)《混合密度、最大似然和EM算法》。SIAM版本26:195-239·Zbl 0536.62021号 ·数字对象标识代码:10.1137/1026034
[31] Seidel W,Mosler K,Alker M(2000)关于混合模型中似然比检验的注意事项。Ann Inst统计数学52:481-487·Zbl 0960.62025号 ·doi:10.1023/A:100411419204
[32] Seidel W,ŠevíkováH(2004)混合模型中的极大似然类型及其对测试性能的影响。Ann Inst统计数学56:631-654·Zbl 1078.62014号 ·doi:10.1007/BF02506480
[33] Tan WY,Chang WC(1972)在估计两种正态密度混合物的参数时,对矩法和最大似然法进行了一些比较。美国统计协会杂志67:702-708·Zbl 0245.62039号 ·doi:10.1080/01621459.1972.10481282
[34] Titterington DM、Smith AFM、Makov UE(1985)有限混合分布的统计分析。纽约威利·Zbl 0646.62013.中
[35] Wang K,McLachlan GJ,Ng A,Peel D(2009)多元斜态正态/t分布混合的EMMIX-skew EM算法。EMMIX最初由David Peel用Fortran编写,R包版本1.0.20。http://www.maths.uq.edu.au/gjm/mix_soft/EMMIX-skew
[36] Woodward WA,Parr WC,Schucany WR,Lindsey H(1984)混合比例最小距离和最大似然估计的比较。美国统计协会杂志79:590-598·Zbl 0547.62017号 ·doi:10.1080/01621459.1984.10478085
[37] Wu CFJ(1983)关于EM算法的收敛性。安统计11:95-103·Zbl 0517.62035号 ·doi:10.1214/aos/1176346060
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。