×

易于处理的多分区群集。 (英语) Zbl 1507.62127号

摘要:在基于模型的聚类框架中,提出了一个允许多个潜在类变量的模型。该模型假设观测数据的分布可以分解为几个独立的变量块。假设每个块都遵循一个潜在的类模型(即。,与条件独立性假设的混合)。该模型包括变量选择,作为一种特殊情况,能够处理混合数据设置。模型的简单性允许同时估计将变量重新划分为块和混合参数,从而避免对每个可能的变量重新划分成块运行EM算法。对于该方法,模型由块数、每个块内的簇数和变量重新划分为块来定义。模型选择可以用两个信息标准,即BIC和MICL来完成,为此提出了一种有效的优化方法。利用模拟数据和实际数据对模型的性能进行了研究。结果表明,所提出的方法对手头的数据集给出了丰富的解释(即。,分析将变量重新划分为块,并分析每个变量块产生的簇)。

MSC公司:

62-08 统计问题的计算方法
62H30型 分类和区分;聚类分析(统计方面)
10层62层 点估计
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 奥尔曼,E。;马蒂亚斯,C。;Rhodes,J.,具有多个观测变量的潜在结构模型中参数的可识别性,Ann.Statist。,37、6A、3099-3132(2009)·Zbl 1191.62003号
[2] 比尔纳基,C。;Celeux,G。;Govaert,G.,《用综合完全似然评估聚类的混合模型》,IEEE Trans。模式分析。机器。智力。,22, 7, 719-725 (2000)
[3] Dempster,A。;莱尔德,N。;Rubin,D.,《通过EM算法从不完整数据中获得最大似然》,J.R.Stat.Soc.Ser。B统计方法。,39, 1, 1-38 (1977) ·Zbl 0364.62022号
[4] 福里纳,M。;阿玛尼诺,C。;M.卡斯蒂诺。;Ubigli,M.,多元数据分析作为葡萄酒原产地的判别方法,Vitis,25,3189-201(1986)
[5] 加林贝蒂,G。;Manisi,A。;Soffritti,G.,《变量在基于模型的聚类分析中的作用建模》,Stat.Comput。,28, 1, 145-169 (2018) ·Zbl 1384.62195号
[6] 加林贝蒂,G。;Soffriti,G.,识别数据集中多个集群结构的基于模型的方法,计算。统计师。数据分析。,52, 1, 520-536 (2007) ·Zbl 1452.62442号
[7] 戈瓦特,G。;Nadif,M.,用块混合模型聚类,模式识别。,36, 2, 463-473 (2003)
[8] Green,P.J.,《关于使用em进行惩罚似然估计》,J.R.Stat.Soc.Ser。B统计方法。,443-452 (1990) ·Zbl 0706.62022号
[9] Hand,D。;Y.Keming,《白痴贝叶斯》,终究没那么蠢吗?,国际统计版次,69,3,385-398(2001)·Zbl 1213.62010年
[10] 马尔巴克,M。;帕廷,E。;Sedki,M.,混合数据聚类的变量选择:基于模型的方法,J.Classification(2018),(出版中)
[11] 马尔巴克,M。;Sedki,M.,《使用综合完整数据可能性进行基于模型聚类的变量选择》,《统计计算》。,27, 4, 1049-1063 (2017) ·Zbl 1384.62199号
[12] 毛吉斯,C。;Celeux,G。;Martin-Magniete,M.-L.,高斯混合模型聚类的变量选择,生物计量学,65,3,701-709(2009)·Zbl 1172.62021号
[13] 麦克拉克伦,G。;Krishnan,T.,《EM算法》(Wiley Series in Probability and Statistics:Applied Probability and Statisticals(1997),Wiley-Interscience:Wiley-Interscience New York)·Zbl 0882.62012号
[14] 麦克拉克伦,G。;Peel,D.,《有限混合模型》(Wiley Series in Probability and Statistics:Apllied Probability and Statisticals,2000),Wiley-Interscience:Wiley-Interscience New York)·Zbl 0963.62061号
[15] McNicholas,P.D.,ElSherbiny,A.,McDaid,A.F.,Murphy,T.B.,2018年。pgmm:解析高斯混合模型,R包版本1.2.2。;McNicholas,P.D.,ElSherbiny,A.,McDaid,A.F.,Murphy,T.B.,2018年。pgmm:简约高斯混合模型,R包版本1.2.2。
[16] McNicholas,医学博士。;Murphy,T.B.,简约高斯混合模型,统计计算。,18, 3, 285-296 (2008)
[17] 穆斯塔基,I。;Papageorgiou,I.,混合变量的潜在类模型及其在考古、计算中的应用。统计数据分析。,48, 3, 659-675 (2005) ·Zbl 1430.62254号
[18] Poon,L.K。;Zhang,N.L。;刘,T。;Liu,A.H.,高维数据的基于模型的聚类:变量选择与方面确定,国际。J.近似原因。,54, 1, 196-215 (2013) ·兹比尔1266.68160
[19] Raftery,A.E。;Dean,N.,基于模型聚类的变量选择,J.Amer。统计师。协会,101,473,168-178(2006)·Zbl 1118.62339号
[20] Schwarz,G.,估算模型的维数,Ann.Statist。,6, 2, 461-464 (1978) ·Zbl 0379.62005年
[21] Teicher,H.,有限混合的可识别性,《数学年鉴》。统计,1265-1269(1963)·Zbl 0137.12704号
[22] Teicher,H.,乘积测度混合物的可识别性,《数学年鉴》。Stat.,38,1300-1302(1967)·Zbl 0153.47904号
[23] Witten,D.M。;Tibshirani,R.,《聚类中的特征选择框架》,J.Amer。统计师。协会,105,490,713-726(2010)·Zbl 1392.62194号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。