×

在多元高斯混合模型中选择EM算法的初始值以获得最大似然。 (英语) Zbl 1429.62235

总结:比较了EM算法在混合模型中选择合理初始值以获得最大似然参数估计的简单方法。它们基于随机初始化,使用分类EM算法(CEM)、随机EM算法(SEM)或EM本身以前的短期运行。这些初始化包含在搜索/运行/选择策略中,可以通过重复这三个步骤来组合。在多变量高斯混合背景下,通过对模拟数据集和实际数据集在目标迭代次数下的数值实验,对它们进行了比较。这些数值实验的主要结论如下。简单的随机初始化可能是最常用的启动EM的方式,但在运行EM之前使用CEM、SEM或emshortruns的策略往往表现得更好。而且,复合通常是有利可图的,因为使用一次EM运行通常会导致次优解。否则,任何一种实验策略都不能被视为最佳策略,并且很难描述一种特定策略可能优于其他策略的情况。然而,可以推荐用短时间运行EM来启动EM的策略。据我们所知,这种策略在本研究之前没有使用过,它有一些优点。它很简单,在很多情况下都能很好的表现,前提是没有特定形式的混合物适合于数据,而且似乎对噪声数据不太敏感。

理学硕士:

62小时30分 分类和区分;聚类分析(统计方面)

软件:

S-加;R
PDF格式 BibTeX公司 XML 引用
全文: 内政部

参考文献:

[1] Akaike,H.,《统计识别模型的新观点》,IEEE trans。自动装置。控制,19716-723,(1974年)·Zbl 0314.62039
[2] Böhning,D.,《混合物和应用的计算机辅助分析:荟萃分析、疾病绘图和其他》(1999年),查普曼和霍尔纽约
[3] 塞勒克斯,G。;Govaert,G.,分类EM算法和两个随机版本,计算机。统计数据分析。,14315-332,(1992年)·Zbl 0937.62605
[4] 塞勒克斯,G。;Chrétien,S。;福布斯,F。;Mkhadri,A.,《混合物的组件式电磁算法》,J.comput。图表。stat.,10699-712,(2001年)
[5] 达斯库塔,A。;Raftery,A.E.,基于杂波模型聚类的空间点过程特征检测,J.am。统计协会,93294-302,(1998年)·Zbl 0906.62105
[6] 邓普斯特,A.P。;莱尔德,新墨西哥州。;Rubin,D.B.,通过EM算法从不完全数据中获得最大似然,J.roy stat.soc.B,39,1-38,(1977),与讨论·Zbl 0364.62022
[7] 林赛,B.G.,1995。混合模型:理论、几何和应用。NSF-CBMS概率与统计区域会议系列,第5卷,数理统计研究所,加利福尼亚·Zbl 1163.62326
[8] Liu,C.,Sun,D.X.,1997.混合模型的EM算法加速。美国国家统计局会议记录。会议,第109-114页。
[9] 李国平,等.多元观测值分类与分析的若干方法,(),第281-297页·Zbl 0214.46201
[10] 麦克拉克伦,G.J。;Krishnam,T.,EM算法和扩展,(1997),Wiley纽约
[11] 麦克拉克伦,G.J。;皮尔,D.,有限混合模型,(2000),威利纽约·Zbl 0963.62061
[12] 梅拉,M。;Heckerman,D.,基于模型的聚类方法的实验比较,Mach。学习,42,9-29,(2001)·Zbl 0970.68075
[13] 皮拉,R.S。;林赛,B.G.,非参数有限混合模型的替代EM方法,生物计量学,88535-550,(2001)·Zbl 0984.62024
[14] Sandor,G.,Sémiologie biologique des protéines Sériques(1976年),巴黎马洛因
[15] Soubiran,C.,《天体学》中星系斯特勒粒子群的运动学。天体物理学。,274181-188,(1993年)
[16] 北乌伊达。;Nakano,R.,确定性退火EM算法,神经网络,11271-282,(1998)
[17] 维纳布尔斯,W.N。;Ripley,B.D.,现代应用统计学与S-plus(1994),Springer纽约·Zbl 0806.62002
[18] 魏国庆。;谭纳,M.A.,EM算法和穷人数据扩充算法的蒙特卡罗实现,J.am。统计协会,85699-704,(1990年)
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。