×

高斯混合模型的聚集性评估。 (英语) Zbl 1341.62187号

摘要:有很多方法都是根据给定数据分组的显著性和簇间分离来评估其质量的。然而,在确定实际聚类之前,似乎没有有效的方法来评估数据内部结构的显著性(聚类性)。基于最近的研究结果,我们针对适当转换的数据提出了协方差矩阵分解的此类度量。假设数据来自高斯混合模型。该转换重塑了数据,因此主成分分析的无监督技术能够揭示直接指示数据聚类特征的信息。在这项工作中,我们提出了测量方法,并解释了动机以及与监督结构区分系数的关系。我们还展示了如何将度量应用于集群数量和特征选择任务。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62H25个 因子分析和主成分;对应分析
94甲15 信息论(总论)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[3] Cuevas,A。;费布雷罗,M。;Fraiman,R.,《估算簇数》,加拿大。J.Stat./La Rev.加拿大。《统计》,第28、2、367-382页(2000年)<http://www.jstor.org/stable/3315985> ·兹伯利0981.62054
[4] McCullagh,P。;Yang,J.,多少簇?,贝叶斯分析。,3, 1, 101-120 (2008) ·Zbl 1330.62033号
[5] 弗雷利,C。;Raftery,A.E.,多少簇?哪种聚类方法?通过基于模型的聚类分析,Comput。J.,41,8,578-588(1998)·Zbl 0920.68038号
[6] Tibshirani,R。;Walther,G。;Hastie,T.,《通过间隙统计估算数据集中的簇数》,J.R.Stat.Soc.:Ser。B(Stat.Methodol.),63,2,411-423(2001),http://dx.doi.org/10.111/1467-9868.00293 ·Zbl 0979.62046号
[7] 安德森,T.W。;Bahadur,R.R.,分类为具有不同协方差矩阵的两个多元正态分布,Ann.Math。Stat.,33,2,420-431(1962)·Zbl 0113.13702号
[8] Ray,S。;Lindsay,B.G.,《多元正态混合物的地形》,《Ann.Stat.》,33,5,2042-2065(2005)·Zbl 1086.62066号
[10] Sun,H。;Wang,S.,测量高斯混合模型中的成分重叠,Data Min.Knowl。发现。,23, 3, 479-502 (2011) ·Zbl 1235.68194号
[14] Arora,S。;Kannan,R.,《分离的非球面高斯函数的混合学习》,Ann.Appl。概率。,15、1A、69-92(2005)·Zbl 1059.62062号
[15] 布兰德,M。;Huang,K.,谱嵌入和聚类的统一定理,(Bishop,C.M.;Frey,B.J.,《第九届人工智能与统计国际研讨会论文集》(2003),人工智能与统计学学会)
[17] Achlioptas,D。;McSherry,F.,关于混合分布的谱学习,(学习理论,学习理论,计算机科学讲义,第3559卷(2005),Springer:Springer-Berlin),458-469·Zbl 1137.68512号
[18] Kannan,R。;Salmasian,H。;Vempala,S.,《一般混合模型的谱方法》,(Auer,P.;Meir,R.,《学习理论》,《计算机科学讲义》,第3559卷(2005年),Springer:Springer Berlin,Heidelberg),444-457·Zbl 1137.68543号
[19] 布鲁贝克,S。;Vempala,S.,《各向同性主成分分析和仿射不变聚类》,(Grötschel,M.;Katona,G.;Sági,G.,《建筑桥梁》,Bolyai Society Mathematical Studies,第19卷(2008),Springer:Springer Berlin,Heidelberg),241-281·Zbl 1159.68542号
[21] Mardia,K.V。;肯特,J.T。;Bibby,J.M.,多元分析。《多元分析、概率和数理统计:一系列专著和教科书》(1979年),学术出版社[Harcourt Brace Jovanovich,出版商]·Zbl 0432.62029号
[22] 哈斯蒂,T。;Tibshirani,R。;Friedman,J.,《统计学习的要素》。数据挖掘、推断和预测。统计学习的要素。数据挖掘、推理和预测,斯普林格统计系列(2009),斯普林格:斯普林格纽约·Zbl 1273.62005年
[23] Lipovetsky,S.,《加法和乘法混合正态分布与寻找簇中心》,国际期刊Mach。学习。赛博。,4, 1, 1-11 (2013)
[24] Lipovetsky,S.,《通过多项式参数化寻找簇中心和大小》,Appl。数学。计算。,221, 571-580 (2013) ·Zbl 1329.62284号
[25] Fukunaga,K.,《统计模式识别导论》。计算机科学和科学计算(1990),学术出版社:学术出版社,马萨诸塞州波士顿·兹比尔0711.62052
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。