文件Zbl 1416.62148-zbMATH Open

拟合（k）-分量单变量正态混合物时的最小距离估计与EM算法的比较。（英语） Zbl 1416.62148号

统计Pap。 58，第4期，1247-1266（2017）.

摘要：使用EM-算法拟合正态分布有限混合的最大似然法是公认的估计方法，因为它已被证明优于矩法。最近的书籍证明了这一点。然而，对于这一问题的最大似然法一直存在批评，主要的批评是，当成分分布的方差不相等时，似然实际上是无界的，并且可能存在多个局部极大值。另一个主要批评是，最大似然估计量不稳健。作为处理第一个问题的一种方法，已经提出了几种替代的最小距离估计方法。本文讨论了其中一个估计量，它不仅由于其鲁棒性而优越，而且事实上即使在模型分布的数值研究中也具有优势。重要的是，当数据实际上是正态混合时，EM算法的稳健替代方案（表面上拟合（t）分布）与所选的最小距离估计器相比，在正态混合模型中也没有竞争力。例如，根据中心极限定理，自然过程应导致成分分布为正态的混合物。另一方面，正如稳健性研究中通常假设的那样，由于外来源，数据可能会受到污染。这就需要一个稳健的估计器。

引用于1文件

MSC公司：

10层62层	点估计
62H30型	分类和区分；聚类分析（统计方面）

关键词：

EM算法;最小距离估计;稳健估计;蒙特卡罗模拟

软件：

R（右）;混合工具;二合一;Emmixuskew公司;nleqslv公司;EMMIX偏斜

PDF格式 BibTeX公司 XML格式引用

全文：内政部

参考文献：

[1]	Amemiya T（1985）《高级计量经济学》。哈佛大学出版社，剑桥
[2]	Benaglia T，Chauveau D，Hunter DR，Young D（2009）Mixtools:分析有限混合模型的R包。J Stat Soft杂志32（6）：1-29·doi:10.18637/jss.v032.i06
[3]	Basford KE，Greenway DR，McLachlan GJ，Peel D（1997）正常混合物下拟合平均值的标准误差。计算统计12:1-17·Zbl 0924.62055号
[4]	Biernacki C，Chretien S（2003）单变量高斯混合模型最大似然估计中的退化·Zbl 1038.62023号 ·doi:10.1016/S0167-7152（02）00396-6
[5]	Biernacki C，Celeux G，Govaert G（2003）混合模型中获得最大可能性的策略。客座编辑：Böhning和Seidel。计算统计数据分析41:561-575·Zbl 1429.62235号 ·doi:10.1016/S0167-9473（02）00163-9
[6]	Choi K，Bulgren WG（1968）混合分布的估计程序。J R统计Soc B 30:444-460·Zbl 0187.15804号
[7]	Clarke BR（1989）两个正态分布混合中比例参数的无偏最小距离估计。统计调查报告7（4）：275-281·Zbl 0667.62015年 ·doi:10.1016/0167-7152（89）90105-3
[8]	Clarke BR（2000）《可微性与稳健性的关系及其在地震数据分析中的应用》。PINSA 66A:467-482
[9]	Clarke BR、Heathcote CR（1978）对Quandt，R.E.和Ramsey，J.B.J Am Stat Assoc 73:749-750的“正态分布和切换回归混合估计”的评论·doi:10.1080/01621459.1978.10480092
[10]	Clarke BR，Heathcote CR（1994），k分量单变量正态混合物的稳健估计。Ann Inst统计数学46:83-93·Zbl 0802.62039号 ·doi:10.1007/BF00773595
[11]	Clarke BR，Futshik A（2007）关于估计高维参数时牛顿方法的收敛性。多变量分析杂志98:916-931·Zbl 1118.65004号 ·doi:10.1016/j.jmva.2006.12.002
[12]	Cutler A，Cordiero-BrañA OI（1996）有限混合模型的最小Hellinger距离估计。美国统计学会杂志91:1716-1723·Zbl 0881.62035号 ·doi:10.1080/01621459.1996.10476743
[13]	Dempster AP，Laird NM，Rubin DP（1977）通过EM算法从不完整数据中获得的最大似然（带讨论）。J R统计社会学B 39:1-38·兹比尔0364.62022
[14]	Depraeter N，Vandebroek M（2014）线性回归有限混合中的顺序选择。统计帕普55:871-911·Zbl 1334.62138号 ·doi:10.1007/s00362-013-0534-x
[15]	Fisher RA（1947）关于部分和整体之间关系的协方差分析方法。生物统计学3:65-68·doi:10.2307/3001641
[16]	Fryer JG，Robertson CA（1972）估计混合正态分布的一些方法的比较。生物计量学59:639-648·Zbl 0255.62033号 ·doi:10.1093/biomet/59.3639
[17]	Hasselman B（2013）nleqslv：求解非线性方程组。R包版本2.0
[18]	Huber PJ，Ronchetti EM（2009）稳健统计，第2版。霍博肯·威利·Zbl 1276.62022号 ·doi:10.1002/9780470434697
[19]	Klar B，Meintanis SG（2005）基于经验特征函数的正常混合物试验。计算统计数据分析49:227-242·Zbl 1429.62156号 ·doi:10.1016/j.csda.2004.05.011
[20]	Lee SX，McLachlan GJ（2013），关于斜正态分布和斜t分布的混合。高级数据分析分类7（3）：241-266·Zbl 1273.62115号 ·doi:10.1007/s11634-013-0132-8
[21]	Lee SX，McLachlan GJ（2014）EMMIXuskew：通过EM算法拟合多元斜t分布混合物的R包。J Stat Soft杂志55（12）：1-22
[22]	Macdonald PDM（1971）Choi，K.和Bulgren，W.G.J R Stat Soc B 33:326-329的论文评论
[23]	McLachlan GJ，Krishnan T（2008）EM算法和扩展，第2版。纽约威利·Zbl 1165.62019号 ·doi:10.1002/9780470191613
[24]	McLachlan GJ，Peel D（2000）有限混合模型。纽约威利·Zbl 0963.62061号 ·doi:10.1002/0471721182
[25]	McLachlan GJ，Peel D，Basford KE，Adams P（1999）EMMIX软件，用于拟合正常分量和t分量的混合物。J统计软件4（2）：1-14·doi:10.18637/jss.v004.i02
[26]	Pearson K（1894）对进化数学理论的贡献。菲洛斯Trans R Soc Lond A 185（1887-1895）：71-110·JFM 25.0347.02号 ·doi:10.1098/rsta.1894.0003
[27]	Peel D，McLachlan GJ（2000）使用t分布的稳健混合建模。统计计算10:339-348·doi:10.1023/A:1008981510081
[28]	Quandt RE，Ramsey JB（1978）估计正态分布和切换回归的混合。美国统计协会杂志73:730-738·Zbl 0401.62024号 ·doi:10.1080/016214519978.10480085
[29]	R开发核心团队（2014）R：统计计算的语言和环境。R统计计算基金会，奥地利维也纳，ISBN 3-900051-07-0。http://www.r-project.org/ ·Zbl 1429.62235号
[30]	Redner RA、Walker HF（1984）《混合密度、最大似然和EM算法》。SIAM版本26:195-239·Zbl 0536.62021号 ·数字对象标识代码：10.1137/1026034
[31]	Seidel W，Mosler K，Alker M（2000）关于混合模型中似然比检验的注意事项。Ann Inst统计数学52:481-487·Zbl 0960.62025号 ·doi:10.1023/A:100411419204
[32]	Seidel W，ŠevíkováH（2004）混合模型中的极大似然类型及其对测试性能的影响。Ann Inst统计数学56:631-654·Zbl 1078.62014号 ·doi:10.1007/BF02506480
[33]	Tan WY，Chang WC（1972）在估计两种正态密度混合物的参数时，对矩法和最大似然法进行了一些比较。美国统计协会杂志67:702-708·Zbl 0245.62039号 ·doi:10.1080/01621459.1972.10481282
[34]	Titterington DM、Smith AFM、Makov UE（1985）有限混合分布的统计分析。纽约威利·Zbl 0646.62013.中
[35]	Wang K，McLachlan GJ，Ng A，Peel D（2009）多元斜态正态/t分布混合的EMMIX-skew EM算法。EMMIX最初由David Peel用Fortran编写，R包版本1.0.20。http://www.maths.uq.edu.au/gjm/mix_soft/EMMIX-skew
[36]	Woodward WA，Parr WC，Schucany WR，Lindsey H（1984）混合比例最小距离和最大似然估计的比较。美国统计协会杂志79:590-598·Zbl 0547.62017号 ·doi:10.1080/01621459.1984.10478085
[37]	Wu CFJ（1983）关于EM算法的收敛性。安统计11:95-103·Zbl 0517.62035号 ·doi:10.1214/aos/1176346060

此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配，并且可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
拉	语言
所以	来源
ab公司	综述，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

拟合（k）-分量单变量正态混合物时的最小距离估计与EM算法的比较。（英语） Zbl 1416.62148号

MSC公司：

关键词：

软件：

参考文献：

示例

领域

操作员

拟合（k）-分量单变量正态混合物时的最小距离估计与EM算法的比较。 （英语） Zbl 1416.62148号

MSC公司：

关键词：

软件：

参考文献：

拟合（k）-分量单变量正态混合物时的最小距离估计与EM算法的比较。（英语） Zbl 1416.62148号