×

基于模型的聚类和分类的简约斜交混合模型。 (英文) Zbl 1471.62202号

摘要:最近研究了使用偏态分布的稳健混合建模方法,以适应不对称数据。介绍了采用尺度矩阵特征值分解的GPCM族的简约斜态和偏态类似物。将这些方法与无监督和半监督分类框架中的现有模型进行了比较。使用期望最大化算法进行参数估计,并使用贝叶斯信息准则选择模型。这些扩展的有效性在模拟数据集和实际数据集上进行了说明。

MSC公司:

62-08 统计问题的计算方法
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 艾特肯,A.C.,《关于伯努利代数方程的数值解》,《爱丁堡皇家学会学报》,46,289-305,(1926)
[2] 安德森,E.,《加斯佩斯半岛的虹膜》,《美国虹膜学会公报》,第59期,第2-5期,(1935年)
[3] 安德鲁斯,J.L。;McNicholas,P.D.,《多元t-因子分析仪的扩展混合》,统计与计算,21,3,361-373,(2011)·Zbl 1255.62175号
[4] 安德鲁斯,J.L。;McNicholas,P.D.,用于基于模型的聚类、分类和判别分析的修正t因子分析仪的混合,《统计规划与推断杂志》,141,4,1479-1486,(2011)·Zbl 1204.62098号
[5] 安德鲁斯,J.L。;McNicholas,P.D.,基于模型的聚类、分类和多元分布混合判别分析,统计与计算,22,5,1021-1029,(2012)·Zbl 1252.62062号
[6] Andrews,J.L.,McNicholas,P.D.,2012年b。teigen:基于模型的多变量t分布聚类和分类。R软件包版本1.0。
[7] 安德鲁斯,J.L。;医学博士麦克尼古拉斯。;Subedi,S.,通过多元分布的混合物进行基于模型的分类,计算统计学和数据分析,55,1520-529,(2011)·兹比尔1247.62151
[8] Baek,J。;McLachlan,G.J.,具有共同因子负载的因子分析器的混合:高维数据的聚类和可视化应用,IEEE模式分析和机器智能汇刊,321298-1309,(2010)
[9] Baek,J。;McLachlan,G.J.,用于聚类高维微阵列数据的通用t因子分析仪的混合物,生物信息学,27,9,1269-1276,(2011)
[10] Banfield,J.D。;Raftery,A.,基于模型的高斯和非高斯聚类,生物统计学,49,803-821,(1993)·兹比尔0794.62034
[11] Baudry,J.P。;Raftery,A.E。;Celeux,G。;Lo,K。;Gottardo,R.,《组合混合成分进行聚类》,《计算与图形统计杂志》,19,2,332-353,(2010)
[12] Bensmail,H。;Celeux,G.,通过特征值分解的正则高斯判别分析,美国统计协会杂志,911743-1748,(1996)·Zbl 0885.62068号
[13] 比尔纳基,C。;Celeux,G。;Govaert,G.,《用综合完全似然评估聚类的混合模型》,IEEE模式分析和机器智能汇刊,22,7,719-725,(2000)
[14] Böhning,D。;迪茨,E。;Schaub,R。;施拉特曼,P。;Lindsay,B.,单参数指数族密度混合物的似然比分布,统计数学研究所年鉴,46,373-388,(1994)·Zbl 0802.62017年
[15] Bouveyron,C。;Girard,S。;Schmid,C.,高维数据聚类,计算统计与数据分析,52,1,502-519,(2007)·Zbl 1452.62433号
[16] Browne,R.P。;McNicholas,P.D.,混合类型数据的基于模型的聚类、分类和判别分析,《统计规划与推断杂志》,142,11,2976-2984,(2012)·Zbl 1335.62093号
[17] Browne,R.P。;McNicholas,P.D.,《高维常见主成分估计》,《数据分析和分类进展》(2013年),(出版中)
[18] Browne,R.P.,McNicholas,P.D.,2013年。混合:用于聚类和分类的混合模型。R软件包版本1.0·Zbl 1332.62215号
[19] 卡布拉尔,C。;拉科斯,V。;Prates,M.,使用偏正态独立分布的多元混合建模,计算统计与数据分析,56,1,126-142,(2012)·兹比尔1239.62058
[20] 北卡罗来纳州坎贝尔。;Mahon,R.J.,《细粒棘属两种岩蟹变异的多元研究》,《澳大利亚动物学杂志》,22,417-425,(1974)
[21] Celeux,G。;Govaert,G.,高斯简约聚类模型,模式识别,28781-793,(1995)
[22] Dasgupta,A。;Raftery,A.E.,《通过基于模型的聚类检测杂波空间点过程的特征》,《美国统计协会杂志》,93,294-302,(1998)·Zbl 0906.62105号
[23] N.院长。;墨菲,T.B。;Downey,G.,《使用未标记数据更新分类规则及其在食品真实性研究中的应用》,《皇家统计学会杂志:C辑》,55,1,1-14,(2006)·Zbl 1490.62155号
[24] Dempster,A.P。;新墨西哥州莱尔德。;Rubin,D.B.,《通过EM算法从不完整数据中获取最大似然》,英国皇家统计学会杂志。B系列(方法学),39,1,1-38,(1977)·Zbl 0364.62022号
[25] Fisher,R.A.,《分类问题中多重测量的使用》,《优生学年鉴》,第7卷,第二部分,179-188,(1936)
[26] Flury,B.流感。;Riedwyl,H.,《多元统计:一种实用的方法》,(1988),Chapman and Hall London
[27] 福里纳,M。;里尔迪,R。;阿玛尼诺,C。;Lanteri,S。;Vandeginste,B.,Parvus:数据探索、分类和关联的可扩展程序包,化学计量学杂志,4,2,191-193,(1988)
[28] 弗雷利,C。;Raftery,A.E.,基于模型的聚类、判别分析和密度估计,美国统计协会杂志,97,458,611-631,(2002)·Zbl 1073.62545号
[29] Fraley,C.,Raftery,A.E.,Scrucca,L.,2012年。MCLUST:基于模型的聚类、分类和密度估计的正常混合建模。R软件包版本4.0。
[30] Franczak,B.,Browne,R.P.,McNicholas,P.D.,2012年。移位非对称拉普拉斯分布的混合。ArXiv预打印ArXiv:1207.1727v3。
[31] Frühwirth-Schnatter,S。;Pyne,S.,单变量和多变量偏正态分布和斜(t)分布有限混合的贝叶斯推断,生物统计学,11,2,317-336,(2010)·Zbl 1437.62465号
[32] 加赫拉马尼,Z。;Hinton,G.E.,因子分析仪的EM算法,技术报告CRG-TR-96-1,(1997),多伦多大学多伦多分校
[33] 格雷塞林,F。;Ingrassia,S.,多元(t)分布混合的约束单调EM算法,统计与计算,20,9-22,(2010)
[34] Ho,H.J。;派恩,S。;Lin,T.I.,通过实际EM型算法对斜交学生正态分布混合物的最大似然推断,统计与计算,22,1,287-299,(2012)·Zbl 1322.62087号
[35] 休伯特,L。;Arabie,P.,比较分区,分类杂志,2193-218,(1985)
[36] Hunter,D.L。;Lange,K.,《MM算法教程》,《美国统计学家》,58,1,30-37,(2004)
[37] Karlis,D。;Santourian,A.,基于模型的非椭圆等高线分布聚类,统计与计算,19,1,73-83,(2009)
[38] Keribin,C.,混合模型阶数的一致估计,Sankhyá:印度统计杂志。系列A,62,1,49-66,(2000)·Zbl 1081.62516号
[39] 科茨,S。;Nadarajah,S.,多元分布及其应用,(2004),剑桥大学出版社·Zbl 1100.62059号
[40] Lee,S。;McLachlan,G.,《多元斜(t)分布的有限混合:一些最新结果》,《统计与计算》(2012年),(出版中)
[41] Lin,T.I。;Lee,J.C。;Yen,S.Y.,《使用斜正态分布的有限混合建模》,《中国统计》,第17期,第909-927页,(2007年)·Zbl 1133.62012年
[42] Lindsay,B.G.,《混合模型:理论、几何学和应用》,(NSF-CBMS概率统计区域会议系列,第5卷,(1995年),加州数学统计研究所,海沃德)·Zbl 1163.62326号
[43] McLachlan,G.J。;Basford,K.,《混合模型:推理及其在聚类中的应用》,(1988),Marcel Dekker,纽约·Zbl 0697.62050号
[44] 麦克拉克伦,G。;Bean,R。;Ben Tovim Jones,L.,因子分析器混合模型的扩展以纳入多元分布,计算统计学和数据分析,51,5327-5338,(2007)·Zbl 1445.62053号
[45] McLachlan,G.J。;Peel,D.,(通过多元(t)分布混合物进行稳健聚类分析,《计算机科学讲义》,第1451卷,(1998),柏林施普林格出版社),658-666
[46] McLachlan,G.J.,Peel,D.,2000年。因子分析仪的混合物。在:第七届机器学习国际会议,旧金山·Zbl 1256.62036号
[47] McNicholas,P.D.,使用潜在高斯混合模型的基于模型的分类,《统计规划与推断杂志》,140,5,1175-1181,(2010)·Zbl 1181.62095号
[48] 医学博士麦克尼古拉斯。;Murphy,T.B.,简约高斯混合模型,统计与计算,18,285-296,(2008)
[49] 医学博士麦克尼古拉斯。;Murphy,T.B.,基于模型的纵向数据聚类,加拿大统计杂志,38,1,153-168,(2010)·Zbl 1190.62120号
[50] 医学博士麦克尼古拉斯。;Murphy,T.B.,通过潜在高斯混合模型对微阵列表达数据进行基于模型的聚类,生物信息学,26,21,2705-2712,(2010)
[51] 医学博士麦克尼古拉斯。;Subedi,S.,使用多元分布混合物聚类基因表达时间进程数据,《统计规划与推断杂志》,142,5,1114-1127,(2012)·Zbl 1236.62068号
[52] 莫里斯,K。;McNicholas,P.D.,通过移位非对称拉普拉斯分布的混合物实现基于模型聚类的降维,《统计学与概率快报》,83,9,2088-2093,(2013)·Zbl 1282.62153号
[53] 莫里斯,K。;医学博士麦克尼古拉斯。;Scrucca,L.,《通过多元(t)分布混合进行基于模型聚类的降维》,《数据分析和分类进展》(2013年),(出版中)·Zbl 1273.62141号
[54] 皮,D。;McLachlan,G.J.,使用(t)分布的稳健混合建模,统计与计算,10,4,339-348,(2000)
[55] 派恩,S。;胡,X。;王凯。;Rossin,E。;Lin,T.I。;迈尔,L.M。;Baecher-Allan,C。;McLachlan,G.J。;Tamayo,P。;哈夫勒,D.A。;De Jager,P.L。;Mesirov,J.P.,自动化高维流式细胞术数据分析,美国国家科学院院刊,106,8519-8524,(2009)
[56] R核心团队,2013年。R: 用于统计计算的语言和环境。奥地利维也纳:R统计计算基金会。
[57] Rand,W.M.,聚类方法评估的客观标准,美国统计协会杂志,66846-850,(1971)
[58] 萨胡,S.K。;戴伊·D。;Branco,M.,一类新的多元偏态分布及其在贝叶斯回归模型中的应用,加拿大统计杂志,31129-150,(2003)·Zbl 1039.62047号
[59] Schwarz,G.,估算模型的维度,《统计年鉴》,6,2,461-464,(1978)·Zbl 0379.62005年
[60] Steane,M.A。;医学博士麦克尼古拉斯。;Yada,R.,通过多元t因子分析仪的混合物进行基于模型的分类,《统计中的通信——模拟和计算》,41,4,510-523,(2012)·Zbl 1294.62142号
[61] 倾翻,T.E。;Bishop,C.M.,概率主成分分析仪的混合,神经计算,11,2,443-482,(1999)
[62] Ueda,N。;Nakano,R.,确定性退火EM算法,神经网络,11,271-282,(1998)
[63] 弗瑞克,I。;McNicholas,P.D.,多元斜交(t)混合模型EM算法的分析计算,《统计与概率快报》,82,6,1169-1174,(2012)·Zbl 1244.65012号
[64] 王凯。;Ng、S。;McLachlan,G.,《多元倾斜混合模型:荧光激活细胞分类数据的应用》,(Shi,H.;Zhang,Y.;Bottema,M.;Lovell,B.;Maede,A.,《数字图像计算:技术与应用》,2009年。DICTA’09(2009),IEEE),526-531
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。