×

在成分数目未知的高斯混合模型中初始化EM算法。 (英语) Zbl 1246.65025号

摘要:提出了一种在成分数目未知的多元高斯混合模型中初始化期望最大化(EM)算法的方法。由于EM算法通常对初始参数向量的选择敏感,因此有效的初始化是算法未来收敛到似然函数的最佳局部极大值的重要前期过程。我们提出了一种通过选择具有较高邻域浓度的点并使用截断正态分布来初始化平均向量的策略,用于色散矩阵的初步估计。通过实例说明了该方法,并与其他几种初始化方法进行了比较。

MSC公司:

65C60个 统计中的计算问题(MSC2010)
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Akaike,H.,《信息论和最大似然原理的扩展》。摘自:第二届信息理论国际研讨会,第267-281页。;Akaike,H.,《信息论和最大似然原理的扩展》。摘自:第二届信息理论国际研讨会,第267-281页·Zbl 0283.62006号
[2] 安德鲁斯,J.L。;医学博士麦克尼古拉斯。;Subedi,S.,《通过多元分布混合进行基于模型的分类》,计算统计与数据分析,55,520-529(2011)·Zbl 1247.62151号
[3] 比尔纳基,C。;Celeux,G。;Govaert,G.,为EM算法选择初始值以获得多元高斯混合模型中的最大似然,计算统计与数据分析,413561-575(2003)·Zbl 1429.62235号
[4] 比尔纳基,C。;Govaert,G.,《使用分类似然选择聚类数》,《计算科学与统计》,29451-457(1997)
[5] Bouveyron,C。;Girard,S。;Schmid,C.,高维数据聚类,计算统计与数据分析,52,502-519(2007)·Zbl 1452.62433号
[6] Cordunenu,A.,Bishop,C.M.,2001年。混合分布的变分贝叶斯模型选择。摘自:《第八届国际人工智能与统计会议论文集》,第27-34页。;Cordunenu,A.,Bishop,C.M.,2001年。混合分布的变分贝叶斯模型选择。摘自:《第八届国际人工智能与统计会议论文集》,第27-34页。
[7] Dempster,A.P。;新墨西哥州莱尔德。;Rubin,D.B.,《通过EM算法获得不完整数据的最大可能性》(带讨论),英国皇家统计学会Jouna,B辑,39,1-38(1977)·Zbl 0364.62022号
[8] Forgy,E.,《多元数据的聚类分析:分类的效率与可解释性》,生物统计学,21768-780(1965)
[9] Fraley,C.,基于模型的高斯层次聚类算法,SIAM科学计算杂志,20270-281(1998)·Zbl 0911.62052号
[10] Fraley,C.,Raftery,A.E.,2006年。MCLUST第3版R:正态混合建模和基于模型的聚类,技术报告504,华盛顿大学统计系,西雅图,华盛顿州。;Fraley,C.,Raftery,A.E.,2006年。MCLUST第3版R:正态混合建模和基于模型的聚类,技术报告504,华盛顿大学统计系,西雅图,华盛顿州。
[11] Freisleben,B.,Schrader,A.,1997年。使用混合遗传算法进行颜色量化。摘自:第六届IEEE图像处理及其应用国际会议记录,第89-93页。;Freisleben,B.,Schrader,A.,1997年。使用混合遗传算法进行颜色量化。摘自:第六届IEEE图像处理及其应用国际会议记录,第89-93页。
[12] 休伯特,L。;Arabie,P.,比较分区,分类杂志,2193-218(1985)
[13] Karlis,D。;Xekalaki,E.,为有限混合物的EM算法选择初始值,计算统计和数据分析,41577-590(2003)·Zbl 1429.62082号
[14] 考夫曼,L。;Rousseuw,P.J.,《在数据中发现群体》(1990),John Wiley&Sons:John Willey&Sons New York·兹比尔1345.62009
[15] Kiefer,N.M.,《离散参数变化:切换回归模型的有效估计》,《计量经济学》,46,427-434(1978)·Zbl 0408.62058号
[16] Lin,T.I.,多元正态混合模型的最大似然估计,多元分析杂志,100257-265(2009)·Zbl 1152.62034号
[17] Lin,T.I。;Lee,J.C。;Yen,S.Y.,《使用斜正态分布的有限混合建模》,《中国统计》,第17期,第909-927页(2007年)·Zbl 1133.62012年
[18] Li,J.等人。;Zha,H.,用于同时进行文档分类和单词聚类的双向泊松混合模型,计算统计和数据分析,50,163-180(2006)·Zbl 1429.62253号
[19] MacQueen,J.,《多元观测分类和分析的一些方法》。摘自:《第五届伯克利研讨会论文集》,1967年第1卷,第281-297页。;MacQueen,J.,《多元观测分类和分析的一些方法》。摘自:《第五届伯克利研讨会论文集》,1967年第1卷,第281-297页·Zbl 0214.46201号
[20] Maitra,R.,初始化分区优化算法,IEEE/ACM计算生物学和生物信息学汇刊,6144-157(2009)
[21] Maitra,R。;Faden,D.,震级MR数据集中的噪声估计,IEEE医学成像汇刊,291615-1622(2009)
[22] Maitra,R。;Melnykov,V.,《模拟数据以研究有限混合建模和聚类算法的性能》,《计算与图形统计杂志》,19,354-376(2010)
[23] McGrory,C。;Titterington,D.,有限混合分布贝叶斯模型选择中的变分近似,计算统计与数据分析,51,5352-5367(2007),混合模型进展·Zbl 1445.62050号
[24] McLachlan,G.,关于正态混合物中成分数量的似然比检验统计量的自举,应用统计学,36318-324(1987)
[25] 麦克拉克伦,G。;Peel,D.,《有限混合模型》(2000),John Wiley and Sons,Inc.:纽约John Willey and Sons公司·Zbl 0963.62061号
[26] 麦克拉克伦,G。;果皮,G。;Basford,K。;Adams,P.,正态分量和(t)分量混合物的拟合,《统计软件杂志》,4,2(1999)
[27] 梅利尼科夫,V。;Maitra,R.,《有限混合模型和基于模型的聚类》,《统计调查》,480-116(2010)·Zbl 1190.62121号
[28] 梅利尼科夫,V。;Maitra,R.,CARP:找出良好聚类算法的软件,《机器学习研究杂志》,第12期,第69-73页(2011年)·Zbl 1280.68183号
[29] Pearson,K.,《进化数学理论的贡献》,《皇家学会哲学学报》,18571-110(1894)·JFM 25.0347.02号
[30] Rand,W.M.,《聚类方法评估的客观标准》,《美国统计协会杂志》,66,846-850(1971)
[31] Schwarz,G.,估算模型的维度,《统计年鉴》,第6461-464页(1978年)·Zbl 0379.62005年
[32] Sneath,P.,《计算机在分类学中的应用》,《普通微生物学杂志》,17,201-226(1957)
[33] 索卡尔·R。;Michener,C.,《评估系统关系的统计方法》,堪萨斯大学科学通报,381409-1438(1958)
[34] Sorensen,T.,《基于物种含量相似性在植物社会学中建立等幅群的方法及其在丹麦公地植被分析中的应用》,Biologiske Skrifter,5,1-34(1948)
[35] 瓦尔迪,Y。;Shepp,洛杉矶。;Kaufman,L.A.,正电子发射断层成像的统计模型,美国统计协会杂志,80,8-37(1985)·Zbl 0561.62094号
[36] 王,B。;Titterington,D.,计算正态混合模型变分贝叶斯估计的通用算法的收敛性,贝叶斯分析,1625-650(2006)·Zbl 1331.62168号
[37] 王,H。;张,Q。;罗,B。;Wei,S.,使用缺失信息的多元(t)分布进行稳健混合建模,《模式识别快报》,25,701-710(2004)
[38] Ward,J.H.,优化目标函数的分层分组,美国统计协会杂志,58236-244(1963)
[39] Wolfe,J.H.,1967年。NORMIX:多元正态混合分布参数估计的计算方法,USNPRA SRM技术公报,第68-2页。;Wolfe,J.H.,1967年。NORMIX:多元正态混合分布参数估计的计算方法,USNPRA SRM技术公报,第68-2页。
[40] Yeung,K.Y。;Ruzzo,W.L.,聚类基因表达数据的主成分分析,生物信息学,17,763-774(2001)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。