×

带有协变量和噪声分量的高斯简约聚类模型。 (英语) Zbl 1474.62240号

总结:通过提出MoEClust模型套件,我们考虑了基于模型的聚类方法,用于连续相关数据,这些数据考虑了混合型固定协变量存在时可用的外部信息。这些模型通过将混合物参数建模为协变量的函数,允许不同的协变量子集影响组分重量和/或组分密度。还容纳了分量协方差矩阵的常见约束特征分解参数范围。因此,本文提出了在高斯简约聚类模型中包含协方差和在高斯混合专家框架的所有特殊情况中包含简约协方差结构的等效目标。MoEClust模型在单变量和多变量数据集的应用方面都显示出了显著的改进。还提出了新的扩展,包括用于捕获离群值的均匀噪声分量,以及EM算法的初始化、模型选择和结果可视化。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62H25个 因子分析和主成分;对应分析
62J12型 广义线性模型(逻辑模型)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 安德鲁斯,JL;McNicholas,PD,基于模型的聚类、分类和通过多元(t)分布混合的判别分析:(t)EIGEN家族,统计计算,22,5,1021-1029(2012)·Zbl 1252.62062号
[2] 班菲尔德,J。;Raftery,AE,基于模型的高斯和非高斯聚类,生物统计学,49,3,803-821(1993)·Zbl 0794.62034号
[3] Benaglia,T。;乔沃,D。;亨特博士;Young,D.,mixtools:分析有限混合模型的R包,J Stat Softw,32,6,1-29(2009)
[4] 比尔纳基,C。;Celeux,G。;Govaert,G.,《用综合完全似然评估聚类的混合模型》,IEEE Trans-Pattern Ana Mach Intell,22,7,719-725(2000)
[5] Bishop,CM,模式识别和机器学习(2006),纽约:施普林格,纽约·Zbl 1107.68072号
[6] Böhning,D。;迪茨,E。;Schaub,R.等人。;施拉特曼,P。;Lindsay,BG,单参数指数族密度混合物的似然比分布,Ann Inst Stat Math,46,2,373-388(1994)·Zbl 0802.62017年
[7] Celeux,G。;Govaert,G.,高斯简约聚类模型,模式识别,28,5,781-793(1995)
[8] 库克,RD;Weisberg,S.,回归图形介绍(1994),纽约:威利,纽约·Zbl 0925.62287号
[9] UJ Dang;麦克尼古拉斯,PD;莫里尼,I。;Minerva,T。;Vichi,M.,回归模型的节约型有限混合族,数据分析统计模型的进展:分类研究,73-84(2015),瑞士:施普林格国际出版公司,瑞士
[10] UJ Dang;Punzo,A。;麦克尼古拉斯,PD;Ingrassia,S.公司。;Browne,RP,高斯加权模型的多元响应和简约性,J Classif,34,1,4-34(2017)·Zbl 1364.62149号
[11] 戴顿,CM;Macready,GB,伴随变量潜在类模型,J Am Stat Assoc,83,401,173-178(1988)
[12] 美联社登普斯特;新墨西哥州莱尔德;Rubin,DB,通过EM算法从不完整数据中获得最大似然,J R Stat Soc Ser B,39,1,1-38(1977)·Zbl 0364.62022号
[13] 弗雷利,C。;Raftery,AE,正态混合估计和基于模型聚类的贝叶斯正则化,J Classif,24,2,155-181(2007)·Zbl 1159.62302号
[14] 加西亚·埃斯库德罗,洛杉矶;Gordaliza,A。;格雷塞林,F。;Ingrassia,S.公司。;Mayo-Iscar,A.,混合建模中的特征值和约束:几何和计算问题,Adv Data Ana Classif,12,2,203-233(2018)·Zbl 1414.62071号
[15] Geweke,J。;Keane,M.,《平稳混合回归》,《经济学杂志》,138,1,252-290(2007)·Zbl 1418.62455号
[16] Gormley IC,Murphy TB(2010)使用社会人口学协变量对偏好数据进行聚类排序。S.Hess&A.Daly主编,《选择建模:最先进和最实用的状态》,第25章,第543-569页。翡翠的
[17] IC Gormley;墨菲,TB;Mengersen,K。;罗伯特·C。;蒂特林顿,DM,混合专家建模与社会科学应用,混合:估计和应用,第9章,101-121(2011),纽约:威利,纽约
[18] Grün,B。;Leisch,F.,在R中拟合广义线性回归的有限混合,计算统计数据分析,51,11,5247-5252(2007)·Zbl 1445.62192号
[19] Grün,B。;Leisch,F.,FlexMix第2版:具有伴随变量和变参数及常数的有限混合,J Stat Softw,28,4,1-35(2008)
[20] Hennig,C.,聚类线性回归模型的可识别性,J Classif,17,2,273-296(2000)·Zbl 1017.62058号
[21] Hennig,C。;科雷托,P。;Preisach,C。;Burkhardt,H。;Schmidt-Thieme,L。;Decker,R.,基于模型的聚类分析中的噪声成分,数据分析,127-138(2008),柏林:施普林格出版社,柏林
[22] 休伯特,L。;Arabie,P.,比较分区,J Classif,2,1,193-218(1985)
[23] Hurn,M。;Justel,A。;Robert,CP,估计回归混合,J计算图统计,12,1,55-79(2003)
[24] Ingrassia,S.公司。;米诺蒂,SC;Vittadini,G.,通过椭圆分布的聚类加权方法进行局部统计建模,J Classif,29,3,363-401(2012)·Zbl 1360.62335号
[25] Ingrassia,S.公司。;Punzo,A。;维塔迪尼,G。;Minotti,SC,广义线性混合聚类加权模型,J Classif,32,1,85-113(2015)·Zbl 1331.62310号
[26] 雅各布斯,RA;密歇根州约旦;Nowlan,SJ;通用电气公司Hinton,《本地专家的自适应混合》,神经计算,3,1,79-87(1991)
[27] 密歇根州约旦;雅各布斯,RA,专家和EM算法的层次混合,神经计算,6,2,181-214(1994)
[28] 拉蒙特,AE;弗蒙特,JK;Van Horn,ML,回归混合模型:建模自变量和潜在类之间的协方差是否会改善结果?,多元行为研究,51,1,35-52(2016)
[29] 勒布雷特,R。;Iovleff,S。;Langrognet,F。;比尔纳基,C。;Celeux,G。;Govaert,G.,Rmixmod:基于模型的非监督、监督和半监督分类mixmod库的R包,J Stat Softw,67,6,1-29(2015)
[30] 马哈拉诺比斯,PC,《关于统计学中的广义距离》,《印度国家科学院学报》,第2期,第1期,第49-55页(1936年)·Zbl 0015.03302号
[31] Mazza A、Punzo A、Ingrassia S(2018)flexCWM:集群加权模型的灵活框架。统计软件J第1-27页
[32] McCullagh,P。;Nelder,J.,广义线性模型(1983),伦敦:查普曼和霍尔出版社,伦敦·Zbl 0588.62104号
[33] 麦克尼古拉斯,PD;墨菲,TB,简约高斯混合模型,统计计算,18,3,285-296(2008)
[34] McParland,D。;Gormley,IC,基于模型的混合数据聚类:clustMD,Adv data Ana Classif,10,2,155-169(2016)·Zbl 1414.62254号
[35] 墨菲·K,墨菲·TB(2019)MoEClust:具有协变量和噪声分量的高斯简约聚类模型。R包版本1.2.3。https://cran.r-project.org/package=MoEClust
[36] Ning H,Hu Y,Huang TS(2008)混合专家对人体姿势估计的有效初始化。2008年10月12日至15日,加利福尼亚州圣地亚哥,ICIP 2008国际图像处理会议记录,第2164-2167页
[37] Punzo,A。;Ingrassia,S.公司。;莫里尼,I。;Minerva,T。;Vichi,M.,简约广义线性高斯聚类加权模型,数据分析统计模型的进展:分类研究,201-209(2015),瑞士:施普林格国际出版公司,瑞士
[38] Punzo,A。;Ingrassia,S.,通过聚类加权模型聚类二元混合类型数据,计算统计,31,3,989-1030(2016)·Zbl 1347.65030号
[39] Punzo,A。;McNicholas,PD,多元污染正态分布的简约混合,Biom J,58,6,1506-1537(2016)·Zbl 1353.62124号
[40] R核心团队。R: 用于统计计算的语言和环境。奥地利维也纳统计计算
[41] Schwarz,G.,估算模型的维数,Ann Stat,6,2,461-464(1978)·Zbl 0379.62005年
[42] Scrucca,L。;Fop,M。;墨菲,TB;Raftery,AE,mclust 5:使用高斯有限混合模型进行聚类、分类和密度估计,R J,8,1,289-317(2016)
[43] 汤普森,TJ;PJ史密斯;Boyle,JP,具有伴随信息的有限混合模型:糖尿病诊断标准的评估,J Roy Stat Soc:Ser C,47,3,393-404(1998)·Zbl 0905.62112号
[44] 王,P。;普特曼,马里兰州;Cockburn,I。;Le,N.,具有协变量依赖率的混合泊松回归模型,生物统计学,52,2,381-400(1996)·兹比尔0875.62407
[45] 王,P。;普特曼,马里兰州;Cockburn,I.,《专利数据的分析:混合泊松回归模型方法》,《J Bus Econ Stat》,16,1,27-41(1998)
[46] Wedel M,Kamakura WA(2012)《市场细分:概念和方法基础》。定量营销国际系列。美国施普林格
[47] Young,DS;Hunter,DR,回归与预测相关混合比例的混合,计算统计数据分析,54,10,2253-2266(2010)·Zbl 1284.62467号
[48] Zellner,A.,估计看似无关回归方程和检验聚集偏差的有效方法,美国统计协会杂志,57,298,348-368(1962)·Zbl 0113.34902号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。