×

为EM算法选择初始值,以获得多元高斯混合模型中的最大似然。 (英语) Zbl 1429.62235号

总结:比较了EM算法在混合模型中选择合理起始值以获得最大似然参数估计的简单方法。它们基于随机初始化,使用分类EM算法(CEM)、随机EM算法或EM本身以前的短期运行。这些初始化包含在搜索/运行/选择策略中,可以通过重复这三个步骤来实现。基于在目标迭代次数下对模拟数据集和实际数据集进行的数值实验,在多元高斯混合背景下对它们进行了比较。这些数值实验的主要结论如下。简单的随机初始化可能是最常用的启动EM的方法,但在运行EM之前,使用CEM、SEM或短运行EM的策略通常表现得更好。此外,复合通常是有利可图的,因为使用一次运行EM通常会导致次优解决方案。否则,没有一种实验策略可以被视为最佳策略,并且很难描述特定策略有望优于其他策略的情况。然而,可以推荐使用短期EM启动EM的策略。据我们所知,这一策略在本研究之前没有使用过,它具有一些优势。它很简单,在许多情况下都能很好地执行,前提是没有特定形式的混合物适合于数据,并且似乎对噪声数据不太敏感。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Akaike,H.,统计识别模型的新视角,IEEE Trans。自动化。控制,19716-723(1974)·Zbl 0314.62039号
[2] Böhning,D.,《混合物的计算机辅助分析与应用:荟萃分析、疾病绘图及其他》(1999),查普曼和霍尔出版社:纽约查普曼与霍尔出版社
[3] Celeux,G。;Govaert,G.,分类EM算法和两个随机版本,计算。统计数据分析。,14, 315-332 (1992) ·兹比尔0937.62605
[4] Celeux,G。;克雷蒂安,S。;福布斯,F。;Mkhadri,A.,混合物的组件式EM算法,J.Compute。图表。《统计》,第10卷,第699-712页(2001年)
[5] Dasgupta,A。;Raftery,A.E.,《通过基于模型的聚类检测杂波空间点过程中的特征》,美国统计协会,93,294-302(1998)·Zbl 0906.62105号
[6] Dempster,A.P。;新墨西哥州莱尔德。;Rubin,D.B.,《通过EM算法从不完整数据中获得最大似然》,J.Roy Stat.Soc.B,39,1-38(1977),附讨论·Zbl 0364.62022号
[7] 林赛,B.G.,1995年。混合模型:理论、几何和应用。NSF-CBMS概率统计区域会议系列,第5卷。加利福尼亚数学统计研究所。;林赛,B.G.,1995年。混合模型:理论、几何和应用。NSF-CBMS概率统计区域会议系列,第5卷。加利福尼亚州数理统计研究所·兹比尔1163.62326
[8] Liu,C.,Sun,D.X.,1997年。使用ECME加速混合模型的EM算法。ASA统计公司程序。会议,第109-114页。;Liu,C.,Sun,D.X.,1997年。使用ECME加速混合模型的EM算法。ASA统计公司程序。会议,第109-114页。
[9] MacQueen,J.,《多元观测分类和分析的一些方法》,(LeCam,L.M.;Neyman,J.《第五届伯克利数理统计与概率研讨会论文集》(1967年),加利福尼亚大学出版社:加利福尼亚大学出版社),281-297·Zbl 0214.46201号
[10] McLachlan,G.J。;Krishnam,T.,《EM算法和扩展》(1997),威利出版社:威利纽约·Zbl 0882.62012号
[11] McLachlan,G.J。;Peel,D.,有限混合模型(2000),Wiley:Wiley纽约·Zbl 0963.62061号
[12] 梅拉,M。;Heckerman,D.,基于模型的聚类方法的实验比较,Mach。学习,42,9-29(2001)·Zbl 0970.68075号
[13] Pilla,R.S。;Lindsay,B.G.,非参数有限混合模型的替代EM方法,Biometrika,88,535-550(2001)·Zbl 0984.62024号
[14] Sandor,G.,Sémiologie Biologique des Protéines Sériques(1976),马洛因:巴黎马洛因
[15] Soubiran,C.,《银河系恒星群的运动学》,《天文学》。天体物理学。,274, 181-188 (1993)
[16] Ueda,N。;Nakano,R.,确定性退火EM算法,神经网络,11271-282(1998)
[17] 韦纳布尔斯,W.N。;Ripley,B.D.,现代应用统计学与S-plus(1994),施普林格:施普林格纽约·Zbl 0806.62002号
[18] 魏,G.C.G。;Tanner,M.A.,EM算法和穷人数据增强算法的蒙特卡罗实现,美国统计协会,85,699-704(1990)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。