×

使用精确的积分完全似然准则选择有限混合模型中的簇数。 (英语) Zbl 1329.62277号

摘要:通过自动选择混合模型中的簇数,集成完全似然(ICL)准则已被证明是基于模型的聚类中非常流行的方法。这种方法有效地最大化了完整数据的可能性,从而将观测值分配到模型选择标准中的集群中。然而,在实际实施中,需要引入近似值以估计ICL。我们在这里的贡献是说明,通过使用共轭先验可以导出ICL的精确表达式,从而避免任何近似。此外,我们还说明了如何在一个算法框架中找到簇数和观测值的最佳分配。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Aitkin,M.:混合物的可能性和贝叶斯分析。统计模型。1(4), 287-304 (2001) ·doi:10.1191/147108201128212
[2] Baudry,J.P.,Raftery,A.E.,Celeux,G.,Lo,K.,Gottardo,R.:组合混合成分进行聚类。J.计算。图表。《美国联邦法律大全》第19卷第(2)、332-353页(2010年)·Zbl 0704.62103号
[3] 贝萨格,J.:关于脏照片的统计分析。J.R.统计社会服务。B(Methodol.)48(3),259-302(1986)·兹比尔0609.62150
[4] Biernacki,C.,Celeux,G.,Govaert,G.:评估具有综合完全似然的聚类混合模型。IEEE传输。模式分析。机器。智力。22(7), 719-725 (2000) ·doi:10.1109/34.865189
[5] Biernacki,C.,Celeux,G.,Govaert,G.:潜在类模型综合可能性的精确和蒙特卡罗计算。J.统计计划。推理140(11),2991-3002(2010)·Zbl 1203.62027 ·doi:10.1016/j.jspi.2010.03.042
[6] Cóme,E.,Latouche,P.:具有精确集成完整数据可能性的随机块模型中的模型选择和聚类(2013年)。arXiv:1303.2962·Zbl 07259003号
[7] Fraley,C.、Raftery,A.E.:基于模型的聚类、判别分析和密度估计。《美国统计协会期刊》97(458),611-631(2002)·Zbl 1073.62545号 ·doi:10.1198/016214502760047131
[8] Fraley,C.,Raftery,A.E.:MCLUST第3版:正常混合建模和基于模型聚类的R包。技术代表DTIC文件(2006)·Zbl 0861.62023号
[9] Green,P.J.:可逆跳跃马尔可夫链蒙特卡罗计算和贝叶斯模型确定。生物特征82(4),711-732(1995)·兹比尔0861.62023 ·doi:10.1093/biomet/82.4.711
[10] Jasra,A.,Holmes,C.C.,Stephens,D.A.:马尔可夫链蒙特卡罗方法和贝叶斯混合建模中的标签切换问题。统计科学。20(1), 50-67 (2005) ·Zbl 1100.62032号
[11] Jeffreys,H.:估计问题中先验概率的不变形式。程序。R.Soc.伦敦。序列号。数学。物理学。科学。186(1007), 453-461 (1946) ·Zbl 0063.03050号 ·doi:10.1098/rspa.1946.0056
[12] Maitra,R.,Melnykov,V.:评估有限混合模型的重要性。Citeser技术代表(2010年)·Zbl 1190.62121号
[13] McDaid,A.F.,Murphy,T.B.,Friel,N.,Hurley,N.J.:随机块模型的改进贝叶斯推断,应用于大型网络。计算。统计数据分析。60, 12-31 (2013) ·Zbl 1365.62241号 ·doi:10.1016/j.csda.2012.10.021
[14] Mengersen,K.,Robert,C.,Titterington,M.:混合物:估算与应用,第896卷。威利,纽约(2011)·Zbl 1218.62003号
[15] Newman,M.E.J.:检测网络中社区结构的快速算法。物理学。版本E 69(6),066133(2004)·doi:10.1103/PhysRevE.69.066133
[16] Nobile,A.,Fearnside,A.T.:成分数量未知的贝叶斯有限混合:分配采样器。统计计算。17(2), 147-162 (2007) ·doi:10.1007/s11222-006-9014-7
[17] Richardson,S.,Green,P.J.:关于成分数量未知的混合物的贝叶斯分析(附讨论)。J.R.统计社会服务。B 59(4),731-792(1997)·Zbl 0891.62020号 ·数字标识代码:10.1111/1467-9868.00095
[18] Roeder,K.:以超星系团和星系空洞为例的置信集密度估计。《美国统计协会期刊》85(411),617-624(1990)·Zbl 0704.62103号 ·doi:10.1080/01621459.1990.10474918
[19] Steele,R.J.,Raftery,A.E.:高斯混合模型的贝叶斯模型选择标准的性能。《统计决策和贝叶斯分析前沿》,第4.1章,第113-130页。施普林格,纽约(2010)
[20] Tessier,D.,Schoenauer,M.,Biernacki,C.,Celeux,G.,Govaert,G.:定性数据的进化潜在类聚类。INRIA技术报告RR-6082,第24页(2006年)
[21] Wyse,J.,Friel,N.:具有塌陷潜在块模型的块聚类。统计计算。22(2), 415-428 (2012) ·Zbl 1322.62046号 ·doi:10.1007/s11222-011-9233-4
[22] Wyse,J.、Friel,N.、Latouche,P.:使用潜在块模型和精确ICL推断二部网络中的结构(2014)。arXiv:1404.2911
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。