×

混合模型特征分解协方差参数估计的正交Stiefel流形优化。 (英语) Zbl 1325.62008号

摘要:在基于混合模型的聚类文献中,具有特征分解成分协方差矩阵的简约模型占据主导地位已有十多年。虽然最初是作为一个由十四个成员组成的模型系列引入的,但目前的最新技术是仅使用其中的十个模型;不使用其他四个模型的理由通常围绕参数估计困难。在仔细检查这四个模型之后,我们发现其中两个实际上使用现有算法很容易实现,但这两个模型受益于一种新的方法。我们提出并实现了在正交Stiefel流形上使用加速线搜索进行优化的算法。此外,我们还表明,当应用于两个基准数据集时,这些分解促进的“额外”模型的性能优于当前的技术水平。

MSC公司:

62-07 数据分析(统计)(MSC2010)
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Absil,P.-A.,Mahony,R.,Sepulchre,R.:矩阵流形上的优化算法。普林斯顿大学出版社,普林斯顿(2008)·Zbl 1147.65043号
[2] 安德森:加斯佩半岛的虹膜。牛市。Am.Iris Soc.59,2-5(1935年)
[3] Andrews,J.L.,McNicholas,P.D.:通过多元t分布的混合物进行基于模型的聚类、分类和判别分析。统计计算。22(5), 1021–1029 (2012) ·Zbl 1252.62062号 ·doi:10.1007/s11222-011-9272-x
[4] Banfield,J.D.,Raftery,A.E.:基于模型的高斯和非高斯聚类。生物统计学49(3),803-821(1993)·Zbl 0794.62034号 ·doi:10.2307/2532201
[5] Biernacki,C.、Celeux,G.、Govaert,G.和Langrognet,F.:使用MIXMOD软件进行基于模型的聚类分析和判别分析。计算。统计数据分析。51, 587–600 (2006) ·兹比尔1157.62431 ·doi:10.1016/j.csda.2005.12.015
[6] Celeux,G.,Govaert,G.:高斯简约聚类模型。模式识别器。28(5), 781–793 (1995) ·Zbl 05480211号 ·doi:10.1016/0031-3203(94)00125-6
[7] Dasgupta,A.,Raftery,A.E.:通过基于模型的聚类检测杂波空间点过程中的特征。《美国统计协会杂志》93,294–302(1998)·兹比尔0906.62105 ·数字标识代码:10.1080/01621459.1998.10474110
[8] Dean,N.,Murphy,T.B.,Downey,G.:使用未标记的数据更新分类规则,以应用于食品真实性研究。J.R.Stat.Soc.,塞尔维亚。C 55(1),1-14(2006)·Zbl 1490.62155号 ·文件编号:10.1111/j.1467-9876.200526.x
[9] Dempster,A.P.,Laird,N.M.,Rubin,D.B.:通过EM算法获得不完整数据的最大似然。J.R.Stat.Soc.,塞尔维亚。B 39(1),1–38(1977)·Zbl 0364.62022号
[10] Fisher,R.A.:分类问题中多重测量的使用。每年。欧根。7(2), 179–188 (1936) ·文件编号:10.1111/j.1469-1809.1936.tb02137.x
[11] Flury,B.W.,Gautschi,W.:将几个正定对称矩阵同时正交变换为近似对角形式的算法。SIAM J.Sci。统计计算。7(1), 169–184 (1986) ·Zbl 0614.65043号 ·doi:10.1137/0907013
[12] Forina,M.、Armanino,C.、Castino,M.和Ubigli,M.:多元数据分析作为葡萄酒原产地的判别方法。Vitis 25189-201(1986)
[13] 弗雷利,C.,拉弗瑞,A.E.:有几个集群?哪些聚类方法?通过基于模型的聚类分析回答。计算。J.41(8),578–588(1998)·Zbl 0920.68038号 ·doi:10.1093/comjnl/41.8.578
[14] Fraley,C.,Raftery,A.E.:MCLUST:基于模型的聚类分析软件。J.分类。16, 297–306 (1999) ·Zbl 0951.91500号 ·数字标识代码:10.1007/s003579900058
[15] Fraley,C.、Raftery,A.E.:基于模型的聚类、判别分析和密度估计。《美国统计协会期刊》97(458),611-631(2002)·Zbl 1073.62545号 ·doi:10.1198/016214502760047131
[16] Hastie,T.,Tibshirani,R.:高斯混合判别分析。J.R.Stat.Soc.,塞尔维亚。B 58(1),155–176(1996)·兹比尔0850.62476
[17] Hubert,L.,Arabie,P.:比较分区。J.分类。2(1), 193–218 (1985) ·Zbl 0587.62128号 ·doi:10.1007/BF01908075
[18] Hurley,C.:多元数据的聚类可视化。J.计算。图表。Stat.13(4),788–806(2004)·doi:10.19198/106186004X12425
[19] 克里宾(Keribin),C.:模型的估计一致性。C.R.学院。科学。,Sér。1数学。326(2), 243–248 (1998) ·Zbl 0954.62023号
[20] Keribin,C.:混合模型阶数的一致估计。Sankhya桑赫亚62(1),49–66(2000)·Zbl 1081.62516号
[21] Lebret,R.,Iovleff,S.,Langrognet,F.:Rmixmod:混合模式包装。R包版本1.1.1(2012)
[22] Murtagh,F.,Raftery,A.E.:将直线拟合到点图案。模式识别器。17(5), 479–483 (1984) ·doi:10.1016/0031-3203(84)90045-1
[23] R开发核心团队:R:统计计算的语言和环境。R统计计算基金会,维也纳(2011年)
[24] Raftery,A.E.,Dean,N.:基于模型聚类的变量选择,《美国统计协会期刊》101(473),168-178(2006)·Zbl 1118.62339号 ·doi:10.1198/016214500000113
[25] Schwarz,G.:估算模型的维数。Ann.Stat.6(2),461-464(1978)·Zbl 0379.62005年 ·doi:10.1214/aos/1176344136
[26] Venables,W.N.,Ripley,B.D.:现代应用统计学与S-PLUS。柏林施普林格(1999)·Zbl 0927.62002号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。