×

稳定且可视化的高斯简约聚类模型。 (英语) Zbl 1332.62199号

摘要:基于高斯混合模型的聚类现在是确定连续数据中假设基础结构的标准工具。然而,许多常用的节约型模型,尽管它们具有诱人的几何解释或处理高维数据的能力,但由于投影后约束的尺度依赖性或不可持续性,它们都存在着重大缺陷。在这项工作中,我们基于协方差矩阵的方差相关分解,提出了一类新的简约高斯模型。当投影到标准平面时,这些新模型是稳定的,因此在低维中可以忠实地表示。通过修改数据的测量单位,它们也是稳定的,并且这种修改不会改变基于似然标准的模型选择。我们通过每个模型的特定图形表示来强调所有这些稳定性属性。对于每个模型推理,还提供了详细的广义EM(GEM)算法。然后,在生物和地质数据方面,我们将我们的稳定模型与标准模型(几何模型和因子分析器模型)进行了比较,这突出了获得无单位模型的所有利润。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Akaike,H.:统计模型识别的新视角。IEEE传输。自动。控制19,716-723(1974)·Zbl 0314.62039号 ·doi:10.1109/TAC.1974.1100705
[2] Atkinson,A.,Riani,M.:多元数据聚类的探索工具。计算。统计数据分析。52(1), 272-285 (2007) ·Zbl 1452.62028号 ·doi:10.1016/j.csda.2006.12.034
[3] Banfield,J.D.,Raftery,A.E.:基于模型的高斯和非高斯聚类。生物统计学49,803-821(1993)·Zbl 0794.62034号 ·doi:10.2307/2532201
[4] Baudry,J.-P.:基于模型的聚类和条件分类可能性的估计和模型选择(2012年)。arXiv:1205.4123v2[math.ST]
[5] Biernacki,C.,Govaert,G.:在基于模型的聚类和判别分析中选择模型。J.统计计算。模拟。64(1), 49-71 (1999) ·Zbl 1156.62335号 ·网址:10.1080/00949659908811966
[6] Biernacki,C.,Celeux,G.,Govaert,G.:评估具有综合完全可能性的聚类混合。IEEE传输。模式分析。机器。因特尔。22719-725(2000年)·doi:10.1109/34.865189
[7] Biernacki,C.、Celeux,G.、Govaert,G.和Langrognet,F.:使用mixmod软件进行基于模型的聚类和判别分析。计算。统计数据分析。51(2), 587-600 (2006) ·兹比尔1157.62431 ·doi:10.1016/j.csda.2005.12.015
[8] Bouveyron,C.,Brunet,C.:基于模型的高维数据聚类:综述。计算。统计数据分析。(2013). doi:10.1016/j.csda.2012.12.008·兹比尔1273.62137 ·doi:10.1016/j.csda.2012.12.008
[9] Bouveyron,C.,Girard,S.,Schmid,C.:高维数据聚类。计算。统计数据分析。52(1), 502-519 (2007) ·Zbl 1452.62433号 ·doi:10.1016/j.csda.2007.02.009
[10] Browne,R.P.,McNicholas,P.D.:混合模型中特征分解协方差参数估计的正交Stiefel流形优化。统计计算。(2012). doi:10.1007/s11222-012-9364-2·Zbl 1325.62008号 ·doi:10.1007/s11222-012-9364-2
[11] Celeux,G.,Govaert,G.:高斯简约聚类模型。模式识别器。28(5), 781-793 (1995) ·doi:10.1016/0031-3203(94)00125-6
[12] Dempster,A.P.,Laird,N.M.,Rubin,D.B.:通过EM算法获得不完整数据的最大似然。J.R.Stat.Soc.B 39(1),1-38(1977)·Zbl 0364.62022号
[13] Fraley,C.、Raftery,A.E.、Murphy,T.B.、Scrucca,L.:mclust第4版R:基于模型的聚类、分类和密度估计的正态混合建模。华盛顿大学统计系第597号技术报告(2012年)·Zbl 1520.62002号
[14] Ghahramani,Z.,Hinton,G.E.:因子分析仪的EM算法。多伦多大学技术报告CRG-TR-96-1(1997)·Zbl 1081.62516号
[15] Govaert,G.:数据分析。威利,纽约(2009)·Zbl 1328.62024号 ·数字对象标识代码:10.1002/9780470611777
[16] Greselin,F.,Ingrassia,S.,Punzo,A.:通过增强多重测试程序评估协方差矩阵的模式。统计方法应用。20, 141-170 (2011) ·Zbl 1232.62090号 ·doi:10.1007/s10260-010-0157-5
[17] Jacques,J.,Bouveyron,C.,Girard,S.,Devos,O.,Duponchel,L.,Ruckebusch,C.:用于高维振动光谱数据分类的高斯混合模型。《化学杂志》。24(11-12), 719-727 (2010) ·doi:10.1002/cem.1355
[18] Keribin,C.:混合模型阶数的一致估计。Sankhya,塞尔维亚。A 62(1),49-66(2000)·Zbl 1081.62516号
[19] Leroux,B.G.:混合分布的一致估计。Ann.Stat.20(3),1350-1360(1992)·Zbl 0763.62015号 ·doi:10.1214/aos/1176348772
[20] Maugis,C.,Michel,B.:数据驱动惩罚校准:高斯模型选择的案例研究。ESAIM概率。《统计》第15卷,第320-339页(2011年)·Zbl 1395.62163号 ·doi:10.1051/ps/201002
[21] Maugis,C.,Martin-Magniette,M.L.,Celeux,G.:高斯混合模型聚类的变量选择。生物统计学65(3),701-709(2009)·Zbl 1172.62021号 ·doi:10.1111/j.1541-0420.2008.0160.x
[22] McLachlan,G.,Peel,D.:有限混合模型。威利,纽约(2000a)·Zbl 0963.62061号 ·doi:10.1002/0471721182
[23] 麦克拉克伦,G。;皮,D。;Langley,P.(编辑),因子分析仪的混合物,旧金山
[24] McNicholas,P.D.,Murphy,T.B.:简约高斯混合模型。统计计算。18, 285-296 (2008) ·doi:10.1007/s11222-008-9056-0
[25] McNicholas,P.D.,Murphy,T.B.:通过潜在高斯混合模型对微阵列表达数据进行基于模型的聚类。生物信息学26(21),2705-2712(2010a)·Zbl 1203.82150号 ·doi:10.1093/bioinformatics/btq498
[26] McNicholas,P.D.,Murphy,T.B.:基于模型的纵向数据聚类。可以。《美国联邦法律大全》38(1),153-168(2010b)·兹比尔1190.62120
[27] McNicholas,P.D.,Jampani,K.R.,McDaid,A.F.,Murphy,T.B.,Banks,L.:pgmm版本1.0,用于通过潜在高斯混合模型进行基于模型的聚类和分类。加拿大安大略省圭尔夫大学数学与统计系2011-320年技术报告(2011年)·Zbl 1156.62335号
[28] Schwarz,G.:估算模型的维数。Ann.Stat.6,461-464(1978年)·Zbl 0379.62005年 ·doi:10.1214/aos/1176344136
[29] Thibault,J.C.,Bretagnolle,V.,Rabouam,C.:科里的剪刀水枪。BWP更新1,75-98(1997)
[30] Tipping,M.E.,Bishop,C.M.:概率主成分分析仪的混合物。神经计算。11, 443-482 (1999) ·doi:10.1162/0899766999300016728
[31] Venables,W.N.,Ripley,B.D.:《现代应用统计学与S》,第4版。斯普林格,纽约(2002)·Zbl 1006.62003号 ·doi:10.1007/978-0-387-21706-2
[32] Xie,B.,Pan,W.,Shen,X.:惩罚因子分析仪的混合物,并应用于聚类高维微阵列数据。生物信息学26(4),501-508(2010)·doi:10.1093/bioinformatics/btp707
[33] Yeung,K.Y.,Fraley,C.,Murua,A.,Raftery,A.E.,Ruzzo,W.L.:基因表达数据的基于模型的聚类和数据转换。生物信息学17(10),977-987(2001)·doi:10.1093/bioinformatics/17.10.977
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。