×

有限混合模型中的Manly变换。 (英语) Zbl 1469.62184

摘要:有限混合模型由于其建模的灵活性和吸引人的可解释性,是统计学中发展最快的领域之一。几十年来,高斯混合模型一直受到研究者的欢迎,证明了其在各种应用中的有用性。然而,当高斯混合分量不能为数据提供足够的拟合时,必须考虑更一般的模型。对于偏离正态分布的传统方法包括使用更合适的分布以及将数据转换为接近正态分布。通过引入一个包含多元Manly变换的成分的混合模型,将这两种方法结合起来。这种混合模型具有良好的偏态建模性能和良好的解释能力。提出了前向和后向模型选择算法,以选择合适的多元变换。在这些算法的每一步,用期望最大化算法来估计具有特定偏度参数组合的模型。该技术在合成数据上进行了详细的说明,并应用于一些著名的数据集,取得了令人满意的结果。

理学硕士:

62-08年 统计问题的计算方法
62小时30分 分类和区分;聚类分析(统计方面)
PDF格式 BibTeX公司 XML 引用
全文: 内政部

参考文献:

[1] 安德森,E.,加斯佩半岛的虹膜,公牛。是。Iris Soc.,第59页,第2-5页,(1935年)
[2] 安德鲁斯特区。;格纳德西坎,R。;华纳,J.L.,《多元数据转换,生物识别》,27,4,825-840,(1971)
[3] Andrews,J.L.,McNicholas,P.D.,2015.基于模型的多变量(t)分布聚类和分类。R包版本2.0.81·Zbl 1252.62062
[4] 阿扎里尼,A。;鲍曼,A.W.,关于老忠实间歇泉的一些数据,J.Roy。统计学家。社会服务。C、 39357-365,(1990年)·Zbl 0707.62186
[5] 阿扎里尼,A。;DallaValle,A.,多元偏态正态分布,生物计量学,83,4,715-726,(1996)·Zbl 0885.62062
[6] 班菲尔德,J.D。;Raftery,A.E.,基于模型的高斯和非高斯聚类,生物特征学,493803-821,(1993)·Zbl 0794.62034
[7] 波特里,J.-P。;拉夫特里,A。;塞勒克斯,G。;罗,K。;Gottardo,R.,《组合聚类的混合成分》,J.Comput。图表。统计学家。,9,22332-353,(2010年)
[8] 本斯梅尔,H。;塞勒克斯,G。;莱弗利,A.E。;罗伯特,C.P.,《基于模型的聚类分析中的推理》,统计计算。,7,1-10,(1997年)
[9] 比尔纳基,C。;塞勒克斯,G。;Govaert,G.,《在多元高斯混合模型中选择EM算法的起始值以获得最大似然值》,Comput。统计学家。数据分析。,41,3-4,561-575,(2003年)·Zbl 1429.62235
[10] 例如,盒子。;Cox,D.R.,《转换分析》,J.R.Stat.Soc.Ser。B、 26,221-252,(1964年)·Zbl 0156.40104
[11] 布朗,R.P。;麦克尼古拉斯,P.D.,广义双曲分布的混合,加拿大。J、 统计学家。,432176-198,(2015年)·Zbl 1320.62144
[12] 卡布拉尔,C。;拉霍斯,V。;Prates,M.,使用倾斜正态独立分布的多元混合模型,计算机。统计学家。数据分析。,56,1126-142,(2012年)·Zbl 1239.62058
[13] 北卡罗来纳州坎贝尔市。;Mahon,R.J.,《澳大利亚细尾蟹属两种岩蟹变异的多元研究》。J、 动物园。,22,3417-425,(1974年)
[14] 乔提拉,T。;Chomtee,B。;Sinsomboonthong,J.,Weibull分布数据四种数据转换方法的比较,Kasetsart J.(自然科学),18,45,366-383,(2011)
[15] 邓普斯特,A.P。;莱尔德,新墨西哥州。;Rubin,D.B.,不完全数据通过EM算法的最大似然性(与讨论),J.R.Stat.Soc.Ser。B、 39,1,1-38,(1977年)·Zbl 0364.62022
[16] Dinov,I.,2008。期望最大化和混合建模教程。在:统计在线计算资源,加州大学洛杉矶分校。
[17] 费舍尔,R.A.,《分类学中多重测量的使用》,安.优生学,7,2,179-188,(1936)
[18] 弗朗扎克,不列颠哥伦比亚省。;布朗,R.P。;麦克尼古拉斯,P.D.,位移不对称拉普拉斯分布的混合,IEEE Trans。肛门模式。机器。内尔。,3661149-1157,(2014年)
[19] 加兹维尼,A。;奥瓦鲁,J。;Bakar,A.A.,监督分类算法的比较分析:银行票据数据集的案例研究,国际计算机杂志。趋势技术。,17,1,39-43,(2014年)
[20] 乔治,E。;McNeil,A.J.,《关于斜交-广义双曲族的多元情景集的计算》,Comput。统计学家。数据分析。,(2014年)
[21] Hennig,C.,合并高斯混合成分的方法,高级数据分析。分类。,4,1,3-34,(2010年)·Zbl 1306.62141
[22] 侯,Q。;马肯,J.D。;加耶夫斯基,B.J。;Dunton,N.,box-Cox功率变换对护理敏感指标的影响:在估计转换参数时忽略结构效应是否重要?,BMC医学研究方法。,11,118,(2011年)
[23] 休伯特,L。;Arabie,P.,比较分区,J.分类,2,1193-218,(1985)
[24] 李,S。;马克兰,G.J.,多元偏态分布的有限混合:一些最新结果,统计计算。,24,218-202,(2014年)·Zbl 1325.62107
[25] 李,S.X。;麦克拉克伦,G.J.,基于模型的非正态混合分布聚类与分类,应用统计学方法。,22,4427-454,(2013年)·Zbl 1332.62209号
[26] 李,S。;McLachlan,G.J.,《关于斜交正态分布和斜交分布的混合》,高级数据分析。分类。,7,3,241-266,(2013年)·Zbl 1273.62115
[27] Lee,S.,McLachlan,G.,2014.EMMIXuskew:拟合无限制多变量倾斜混合模型。R包,网址:http://cran.r-project.org/package=EMMIXuskew。
[28] 李,J。;H,苏。;程,体育。;刘先生。;阿斯顿,J.A.D。;蔡,公元前。;Che,C.,使用功率变换方法进行MR图像分割,IEEE Trans。医学影像学,286894-905,(2009)
[29] 林泰辉,多元偏正态混合模型的最大似然估计,多元分析杂志。,1002257-265,(2009年)·Zbl 1152.62034
[30] 林赛,C。;Sleeper,S.,《通过多变量盒Cox进行电力转换》,Stata J.,10,1,69-81,(2010年)
[31] 罗,K。;布林克曼,R.R。;Gottardo,R.,《通过稳健的基于模型的聚类对流式细胞术数据进行自动选通》,细胞术A,73,4,321-332,(2008)
[32] 罗,K。;Gottardo,R.,《利用box-Cox变换通过多元分布进行灵活混合建模:斜交分布的另一种选择》,Stat.Comput。,22,1,35-52,(2012年)·Zbl 1322.62173
[33] 迈特拉,R。;Melnykov,V.,模拟数据以研究有限混合建模和聚类算法的性能,J.Comput。图表。统计学家。,19,2354-376,(2010年)
[34] Manly,B.F.J.,指数数据转换,J.R.Stat.Soc.Ser。D、 25,1,37-42,(1976年)
[35] 麦克拉克伦,G.J。;Basford,K.E.,混合模型:推理和聚类应用,(1988),Marcel Dekker纽约·中保0697.62050
[36] 麦克拉克伦,G。;Krishnan,T.,EM算法和扩展,(2008),Wiley纽约·Zbl 1165.62019
[37] 麦克拉克伦,G.J。;Peel,D.,有限混合模型,(2000),John Wiley and Sons,Inc.纽约·Zbl 0963.62061
[38] 梅尔尼科夫,V.关于后验概率在有限混合模型中的分布及其在聚类中的应用,多元分析杂志。,122175-189,(2013年)·兹布1279.62114
[39] Melnykov,V.,通过成对重叠合并混合成分进行聚类,J.Comput。图表。统计学家。,(2014),正在出版。http://dx.doi.org/10.1080/10618600.2014.978007
[40] Melnykov,V.,基于模型的点击流数据双聚类,计算机。统计学家。数据分析。,93C,31-45,(2016年)·Zbl 1468.62138
[41] 梅尔尼科夫,V。;陈伟。;Maitra,R.,Mixsim:模拟数据以研究聚类算法性能的R软件包,J.Stat.Softw。,2012年12月1日至25日
[42] 梅尔尼科夫,V。;Melnykov,I.,在含有未知分量的高斯混合模型中初始化EM算法,计算机。统计学家。数据分析。,5661381-1395,(2012年)·Zbl 1246.65025
[43] 墨菲,E.A.,一个原因?很多原因?来自双峰分布的论点,J.Chron。数字化信息系统。,17,4,301-324,(1964年)
[44] 奈尔德,J.A。;Mead,R.,函数最小化的单纯形算法,计算机。J、 ,7,4,308-313,(1965年)·中银0229.65053
[45] Osborne,J.W.,改进数据转换:应用box-Cox转换,实践。评估。资源评估。,2010年12月15日至9日
[46] 帕克,B.-J。;Lord,D.,有限混合模型在车辆碰撞数据分析中的应用,Accid。肛门。上一页。,414683-691,(2009年)
[47] 皮尔逊,K.,《进化数学理论的贡献》,菲洛斯。翻译。R、 第18571-110页,(1894年)·京财25.0347.02
[48] 剥离,D。;McLachlan,G.,使用\(t\)分布的鲁棒混合建模,Stat.Comput。,10,4339-348,(2000年)
[49] 普拉茨,M。;卡布拉尔,C。;拉霍斯,V.,Mixsmsn:斜态正态分布尺度混合的有限混合,J.Stat.Softw。,第54、12、1-20页,(2013年)
[50] Punzo,A.,McNicholas,P.D.,2015.污染高斯分布的简约混合及其在异速生长研究中的应用。ArXiv:1305.4669。
[51] 《社会研究中的贝叶斯模型选择》(附讨论),社会学。方法论。,25111-193,(1995年)
[52] Sakia,R.M.,《box-Cox变换技术:综述》,J.R.Stat.Soc.Ser。D、 412199-178,(1992年)
[53] Schlattmann,P.,有限混合模型的医学应用,(2009),Springer·Zbl 1158.62082
[54] Schwarz,G.,《估计模型的维数》,Ann.Statist。,461-464,(1978年)·Zbl 0379.62005
[55] Scrucca,L.,识别用于聚类的高斯混合模型中的连接成分,计算机。统计学家。数据分析。,93C,5-17,(2016年)·Zbl 1468.62174
[56] 西尔维亚,Y。;Santoso,D.,《群随机设计中多样性稳定的变换盒-考克斯》,计算机杂志。科学。,2014年11月1日18-29日
[57] Velilla,S.,《关于多元box-Cox变换到正态性的注记》,统计学家。可能吧。利特。,17,4,259-263,(1993年)·Zbl 0800.62263
[58] 维比克,I。;McNicholas,P.D.,基于模型的聚类和分类的简约倾斜混合模型,计算机。统计学家。数据分析。,71196-210,(2014年)
[59] Wang,K.,Ng,A.,McLachlan,G.,2013.EMMIXskew:EM算法和斜交混合分布,R包1.0.1版。
[60] 沃德,J.H.,《优化目标函数的分层分组》,J.Amer。统计学家。协会,58,301,236-244,(1963年)
[61] Zhu,X.,Melnykov,V.,2015.ManlyMix:Manly混合建模和基于模型的聚类。R包版本0.1.2。
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。