×

有限混合建模中的Manly变换。 (英语) 兹比尔1469.62184

摘要:有限混合建模由于其建模的灵活性和诱人的可解释性,是统计学发展最快的领域之一。几十年来,高斯混合模型一直受到研究人员的欢迎,证明了其在各种应用中的有用性。然而,当高斯混合成分不能为数据提供足够的拟合时,必须考虑更通用的模型。对偏离正态性的传统补救方法包括采用更合适的分布以及将数据转换为接近正态性。提出了通过引入一个混合模型来合并这两种方法,该混合模型由多元Manly变换导出。这种混合模型在建模偏度方面表现出良好的性能,并且具有良好的可解释性。提出了正向和反向模型选择算法,以选择合适的多元变换。在这些算法的每个步骤中,使用期望最大化算法估计具有特定偏度参数组合的模型。所开发的技术在合成数据上进行了详细说明,并应用于几个著名的数据集,取得了良好的结果。

MSC公司:

62-08 统计学相关问题的计算方法
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 安德森,E.,《喘息半岛的虹膜》,布尔。《美国爱丽丝学会》,59,2-5,(1935)
[2] 安德鲁斯·D·F。;Gnanadesikan,R。;Warner,J.L.,《多元数据的转换》,生物统计学,27,4,825-840,(1971)
[3] Andrews,J.L.,McNicholas,P.D.,2015年。基于模型的多变量聚类与分类;Andrews,J.L.,McNicholas,P.D.,2015年。基于模型的多变量聚类和分类·Zbl 1252.62062号
[4] 阿扎里尼,A。;鲍曼·A·W·A·罗伊(J.Roy),《查看旧间歇泉的一些数据》。统计师。Soc.序列号。C、 39357-365(1990)·Zbl 0707.62186号
[5] 阿扎里尼,A。;Dalla Valle,A.,《多元偏态正态分布》,《生物统计学》,83,4,715-726,(1996)·Zbl 0885.62062号
[6] Banfield,J.D。;Raftery,A.E.,基于模型的高斯和非高斯聚类,生物统计学,49,3,803-821,(1993)·Zbl 0794.62034号
[7] Baudry,J.-P。;Raftery,A。;Celeux,G。;Lo,K。;Gottardo,R.,组合用于聚类的混合成分,J.Comput。图表。统计人员。,9, 2, 332-353, (2010)
[8] Bensmail,H。;Celeux,G。;Raftery,A.E。;Robert,C.P.,基于模型的聚类分析中的推理,统计计算。,7, 1-10, (1997)
[9] 比尔纳基,C。;Celeux,G。;Govaert,G.,为EM算法选择初始值,以获得多元高斯混合模型中的最大似然,计算。统计师。数据分析。,41, 3-4, 561-575, (2003) ·Zbl 1429.62235号
[10] 盒子,通用电气。;Cox,D.R.,《转换分析》,J.R.Stat.Soc.Seri。B、 26、2、211-252(1964)·Zbl 0156.40104号
[11] Browne,R.P。;McNicholas,P.D.,广义双曲分布的混合,Canad。J.统计。,43, 2, 176-198, (2015) ·Zbl 1320.62144号
[12] 卡布拉尔,C。;拉科斯,V。;Prates,M.,使用偏正态独立分布的多元混合建模,计算。统计师。数据分析。,56, 1, 126-142, (2012) ·Zbl 1239.62058号
[13] 北卡罗来纳州坎贝尔。;Mahon,R.J.,《澳大利亚细纹蟹属两种岩蟹变异的多元研究》。J.Zool。,22, 3, 417-425, (1974)
[14] Chortirat,T。;Chomtee,B。;Sinsomboonthong,J.,威布尔分布数据四种数据转换方法的比较,Kasetsart J.(自然科学),18,45,366-383,(2011)
[15] Dempster,A.P。;新墨西哥州莱尔德。;Rubin,D.B.,《通过EM算法实现不完整数据的最大可能性》(带讨论),J.R.Stat.Soc.Ser。B、 39、1、1-38(1977)·Zbl 0364.62022号
[16] Dinov,I.,2008年。期望最大化和混合建模教程。In:加州大学洛杉矶分校统计在线计算资源。;Dinov,I.,2008年。期望最大化和混合建模教程。收录:加州大学洛杉矶分校统计在线计算资源。
[17] Fisher,R.A.,《分类问题中多重测量的使用》,《优生学年鉴》,第7、2、179-188页,(1936)
[18] Franczak,B.C。;Browne,R.P。;McNicholas,P.D.,移位非对称拉普拉斯分布的混合,IEEE Trans。模式分析。机器。智力。,36, 6, 1149-1157, (2014)
[19] 加兹维尼,A。;Awwalu,J。;Bakar,A.A.,《监督分类中算法的比较分析:银行券数据集的案例研究》,国际计算机杂志。技术趋势。,17, 1, 39-43, (2014)
[20] 乔治·E。;McNeil,A.J.,关于斜(t)和广义双曲族的多元场景集的计算,计算。统计师。数据分析。,(2014)
[21] Hennig,C.,合并高斯混合成分的方法,高级数据分析。分类。,4, 1, 3-34, (2010) ·Zbl 1306.62141号
[22] 侯,Q。;Mahnken,J.D。;Gajewski,B.J。;Dunton,N.,《护理敏感指标的箱盒功率变换:在估计变换参数时忽略结构效应有关系吗?》?,BMC医学研究方法。,2011年11月11日
[23] 休伯特,L。;Arabie,P.,比较分区,J.分类,2,1,193-218,(1985)
[24] Lee,S。;MacLachlan,G.J.,多元斜(t)分布的有限混合:一些最新结果,统计计算。,24, 2, 181-202, (2014) ·Zbl 1325.62107号
[25] Lee,S.X。;McLachlan,G.J.,基于模型的非正态混合分布聚类和分类,统计方法应用。,22, 4, 427-454, (2013) ·Zbl 1332.62209号
[26] Lee,S。;McLachlan,G.J.,关于偏斜正态分布和偏斜分布的混合,高级数据分析。分类。,7, 3, 241-266, (2013) ·Zbl 1273.62115号
[27] Lee,S.,McLachlan,G.,2014年。EMMIXuskew:拟合无限制的多元偏差\(t\)http://cran.r-project.org/package=EMMIXuskew公司; Lee,S.,McLachlan,G.,2014年。EMMIXuskew:拟合无限制的多元偏差\(t\)http://cran.r-project.org/package=EMMIXuskew
[28] Lee,J。;苏,H。;程,体育。;Liou,M。;阿斯顿,J.A.D。;蔡,A.C。;Che,C.,使用功率变换方法进行MR图像分割,IEEE Trans。医学成像,28,6894-905,(2009)
[29] Lin,T.I.,多变量斜正态混合模型的最大似然估计,J.multivariate Anal。,100, 2, 257-265, (2009) ·Zbl 1152.62034号
[30] Lindsey,C。;Sheather,S.,《通过多元箱盒进行功率变换》,Stata J.,10,1,69-81,(2010)
[31] Lo,K。;Brinkman,R.R。;Gottardo,R.,通过稳健的基于模型的聚类对流式细胞术数据进行自动门控,细胞计量学A,73,4,321-332,(2008)
[32] Lo,K。;Gottardo,R.,通过具有box-Cox变换的多元\(t\)分布的灵活混合建模:偏斜\(t\)分布的替代方案,Stat.Comput。,22, 1, 35-52, (2012) ·Zbl 1322.62173号
[33] Maitra,R。;Melnykov,V.,《模拟数据以研究有限混合建模和聚类算法的性能》,J.Compute。图表。统计人员。,19, 2, 354-376, (2010)
[34] Manly,B.F.J.,指数数据转换,J.R.Stat.Soc.Ser。D、 25、1、37-42(1976)
[35] McLachlan,G.J。;Basford,K.E.,《混合模型:聚类的推理和应用》,(1988年),马塞尔·德克尔纽约·Zbl 0697.62050号
[36] 麦克拉克伦,G。;Krishnan,T.,《EM算法和扩展》(2008),威利纽约·Zbl 1165.62019号
[37] McLachlan,G.J。;Peel,D.,有限混合模型,(2000),纽约John Wiley and Sons公司·Zbl 0963.62061号
[38] Melnykov,V.,《有限混合模型的后验概率分布及其在聚类中的应用》,《多元分析杂志》。,122, 175-189, (2013) ·Zbl 1279.62114号
[39] Melnykov,V.,通过成对重叠合并混合成分进行聚类,J.Compute。图表。统计学。,(2014),正在出版。http://dx.doi.org/101080/10618600.2014.978007
[40] Melnykov,V.,点击流数据的基于模型的双聚类,计算。统计师。数据分析。,93C,31-45,(2016)·Zbl 1468.62138号
[41] 梅利尼科夫,V。;陈,W.C。;Maitra,R.,Mixsim:用于模拟数据以研究聚类算法性能的R包,J.Stat.Softw。,第51、12、1-25页(2012年)
[42] 梅利尼科夫,V。;Melnykov,I.,在成分数目未知的高斯混合模型中初始化EM算法,计算。统计师。数据分析。,56, 6, 1381-1395, (2012) ·Zbl 1246.65025号
[43] Murphy,E.A.,一个原因?许多原因?来自双峰分布的论点,J.Chron。数字化信息系统。,17, 4, 301-324, (1964)
[44] Nelder,J.A。;Mead,R.,函数最小化的单纯形算法,计算。J.,第7、4、308-313页,(1965年)·Zbl 0229.65053号
[45] Osborne,J.W.,《改进数据转换:应用盒子-盒子转换》,Pract。评估。研究评估。,15, 12, 1-9, (2010)
[46] 帕克,B.-J。;Lord,D.,《有限混合模型在汽车碰撞数据分析中的应用》,Accid。分析。上一篇。,41, 4, 683-691, (2009)
[47] Pearson,K.,《进化数学理论的贡献》,Philos。事务处理。《皇家学会》,18571-110,(1894)·JFM 25.0347.02号
[48] 皮,D。;McLachlan,G.,使用(t)分布的稳健混合建模,统计计算。,10, 4, 339-348, (2000)
[49] Prates,M。;卡布拉尔,C。;Lachos,V.,Mixsmsn:拟合偏态正态分布的尺度混合的有限混合,J.Stat.Softw。,54, 12, 1-20, (2013)
[50] Punzo,A.,McNicholas,P.D.,2015年。污染高斯分布的简约混合物及其在异速生长研究中的应用。ArXiv:1305.4669;Punzo,A.,McNicholas,P.D.,2015年。污染高斯分布的简约混合物及其在异速生长研究中的应用。ArXiv公司:1305.4669
[51] Raftery,A.E.,社会研究中的贝叶斯模型选择(含讨论),社会学。Methodol.方法。,2011年11月25日至2013年(1995年)
[52] Sakia,R.M.,《盒-盒转换技术:综述》,J.R.Stat.Soc.Ser。D、 41、2、169-178(1992)
[53] Schlattmann,P.,有限混合模型的医学应用,(2009),Springer·兹比尔1158.62082
[54] Schwarz,G.,估算模型的维数,Ann.Statist。,6, 2, 461-464, (1978) ·Zbl 0379.62005年
[55] Scrucca,L.,识别高斯混合模型中用于聚类的连接成分,计算。统计师。数据分析。,93C,5-17,(2016)·Zbl 1468.62174号
[56] Sylvia,Y。;Santoso,D.,用于群体随机设计中多样性稳定的变换盒Cox,J.Comput。科学。,11, 1, 18-29, (2014)
[57] Velilla,S.,关于多元箱盒变换到正态性的注记,Statist。普罗巴伯。莱特。,17, 4, 259-263, (1993) ·Zbl 0800.62263号
[58] 弗瑞克,I。;McNicholas,P.D.,基于模型的聚类和分类的简约斜交混合模型,计算。统计师。数据分析。,71, 196-210, (2014)
[59] Wang,K.,Ng,A.,McLachlan,G.,2013年。EMMIXSew:EM算法和斜交混合分布,R包版本1.0.1。;Wang,K.,Ng,A.,McLachlan,G.,2013年。EMMIXSew:EM算法和斜交混合分布,R包版本1.0.1。
[60] Ward,J.H.,优化目标函数的分层分组,J.Amer。统计师。协会,58,301,236-244,(1963)
[61] Zhu,X.,Melnykov,V.,2015年。ManlyMix:Manly混合建模和基于模型的聚类。R包版本0.1.2。;Zhu,X.,Melnykov,V.,2015年。ManlyMix:Manly混合建模和基于模型的聚类。R包版本0.1.2。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。