亚纳·梅尼科夫;朱旭文;沃洛德迈尔·梅尼科夫 带有重尾和分散的倾斜数据组的转换混合建模。 (英语) Zbl 1505.62290号 计算。斯达。 36,编号1,61-78(2021). 摘要:几十年来,高斯混合模型一直是文献中最受欢迎的混合模型。然而,高斯分量提供的拟合的充分性经常受到质疑。最近,在这方面考虑了各种能够建模偏度或重尾的分布。在本文中,我们提出了一种新的污染变换混合模型,该模型基于向对称变换的思想构建,可以考虑偏度、重尾,并自动将散射分配给二次分量。 引用于2文件 MSC公司: 62-08 统计问题的计算方法 62H30型 分类和区分;聚类分析(统计方面) 关键词:有限混合模型;聚类分析;转化为正规;对称 软件:EMMIX扭曲;帕尔沃斯 PDF格式BibTeX公司 XML格式引用 \textit{Y.Melnykov}等人,计算。Stat.36,No.1,61--78(2021;Zbl 1505.62290) 全文: 内政部 参考文献: [1] 安德鲁斯,DF;Gnanadesikan,R。;Warner,JL,《多元数据的转换》,生物统计学,27,4,825-840(1971)·doi:10.307/2528821 [2] 阿特金森,AC;Riani,M。;Cerioli,A.,《用正向搜索探索多元数据》(2003),牛津:克拉伦登出版社,牛津·Zbl 1049.62057号 [3] 阿扎里尼,A。;鲍曼,AW,《旧忠实间歇泉的一些数据》,J R Stat Soc C,39,357-365(1990)·Zbl 0707.62186号 [4] JD Banfield;Raftery,AE,基于模型的高斯和非高斯聚类,生物统计学,49,3,803-821(1993)·Zbl 0794.62034号 ·doi:10.2307/2532201 [5] 巴索,R。;拉科斯,V。;卡布拉尔,C。;Ghosh,P.,基于偏态正态分布比例混合的稳健混合建模,《计算统计数据分析》,54,2926-2941(2010)·Zbl 1284.62193号 ·doi:10.1016/j.csda.2009.09.031 [6] 盒子,GE;Cox,DR,《转换分析》,J R Stat Soc B,26,2,211-252(1964)·Zbl 0156.40104号 [7] Browne,RP;McNicholas,PD,广义双曲分布的混合,Can J Stat,43,2,176-198(2015)·Zbl 1320.62144号 ·doi:10.1002/cjs.11246 [8] 卡布拉尔,C。;拉科斯,V。;Prates,M.,使用偏正态独立分布的多元混合建模,《计算统计数据分析》,56,1,126-142(2012)·Zbl 1239.62058号 ·doi:10.1016/j.csda.2011.06.026 [9] Celeux,G。;Govaert,G.,高斯简约聚类模型,计算统计数据分析,28781-793(1995) [10] 美联社登普斯特;新墨西哥州莱尔德;Rubin,DB,通过EM算法获得不完整数据的最大可能性(带讨论),J R Stat Soc Ser B,39,1,1-38(1977)·Zbl 0364.62022号 [11] Forina M、Leardi R、Armanino C、Lanteri S(1991)《PARVUS:数据探索、分类和关联的可扩展包》。制药和食品分析技术研究所,Via Brigata Salerno [12] Frühwirth-Schnatter,S。;Pyne,S.,单变量和多变量偏正态分布和斜(t)分布有限混合的贝叶斯推断,生物统计学,11,317-336(2010)·Zbl 1437.62465号 ·doi:10.1093/biostatistics/kxp062 [13] 乔治·E。;McNeil,AJ,关于偏斜-(t\)和广义双曲族的多变量情景集的计算,Comput Stat Data Anal,100205-220(2014)·Zbl 1466.62077号 ·doi:10.1016/j.csda.2014.06.024 [14] Lee,S。;McLachlan,GJ,关于偏斜正态分布和偏斜(t\)分布的混合物,Adv Data Anal Classif,7,3,241-266(2013)·Zbl 1273.62115号 ·doi:10.1007/s11634-013-0132-8 [15] Lee,S。;McLachlan,G.J.,《多元斜(t)分布的有限混合:一些最新结果》,《统计计算》,24,2,181-202(2014)·Zbl 1325.62107号 ·doi:10.1007/s11222-012-9362-4 [16] Lin,TI,多元斜正态混合模型的最大似然估计,J Multivar Anal,100,2257-265(2009)·Zbl 1152.62034号 ·doi:10.1016/j.jmva.2008.04.010 [17] 林,T-C;Lin,T-I,带缺失信息的多元斜态正态混合模型的监督学习,计算统计,25183-201(2009)·Zbl 1223.62088号 ·doi:10.1007/s00180-009-0169-5 [18] 林,TI;Lee,JC;Yen,SY,使用斜正态分布的有限混合建模,Stat Sin,17909-927(2007)·Zbl 1133.62012年 [19] Lo,K。;Gottardo,R.,《通过带Box-Cox变换的多元(t)分布进行灵活混合建模:斜(t)分配的替代方法》,《统计计算》,22,1,35-52(2012)·Zbl 1322.62173号 ·doi:10.1007/s11222-010-9204-1 [20] Maitra,R。;Melnykov,V.,《模拟数据以研究有限混合建模和聚类算法的性能》,J Comput Graph Stat,19,2,354-376(2010)·doi:10.1198/jcgs.2009.08054 [21] Manly,BFJ,指数数据转换,J R Stat Soc Ser D,25,1,37-42(1976) [22] GJ麦克拉克伦;Peel,D.,有限混合模型(2000),纽约:威利,纽约·Zbl 0963.62061号 ·doi:10.1002/0471721182 [23] McNicholas,PD,《基于混合模型的分类》(2017),博卡拉顿:CRC出版社,博卡拉顿·Zbl 1454.62005年 [24] McNicholas,P。;Murphy,T.,《节俭的高斯混合模型》,《统计计算》,第18期,第285-296页(2008年)·doi:10.1007/s11222-008-9056-0 [25] Melnykov,V.,点击流数据的基于模型的双聚类,《计算统计数据分析》,93C,31-45(2016)·Zbl 1468.62138号 ·doi:10.1016/j.csda.2014.09.016 [26] 莫里斯,K。;Punzo,A。;McNicholas,P。;Browne,R.,《非对称簇和离群值:多元污染移位非对称拉普拉斯分布的混合物》,《计算统计数据分析》,132145-156(2019)·Zbl 1507.62136号 ·doi:10.1016/j.csda.2018.12.001 [27] 内尔德,JA;Mead,R.,函数最小化的单纯形算法,计算J,7,4,308-313(1965)·Zbl 0229.65053号 ·doi:10.1093/comjnl/7.4.308 [28] Punzo,A。;McNicholas,P.,多元污染正态分布的简约混合物,《生物杂志》,581506-1537(2016)·Zbl 1353.62124号 ·doi:10.1002/bimj.201500144 [29] Schwarz,G.,估算模型的尺寸,《Ann Stat》,6,2,461-464(1978)·Zbl 0379.62005年 ·doi:10.1214/aos/1176344136 [30] Velilla,S.,关于多元Box-Cox变换到正态的注记,Stat Probab Lett,17,4259-263(1993)·Zbl 0800.62263号 ·doi:10.1016/0167-7152(93)90200-3 [31] Wang K,Ng A,McLachlan G(2013)EMMIXSew:EM算法和斜交混合分布。R包版本1.0.1 [32] Yeo,I-K;Johnson,RA,《改善正常或对称性的新功率变换家族》,《生物统计学》,87954-959(2000)·Zbl 1028.62010号 ·doi:10.1093/biomet/87.4954 [33] 朱,X。;Melnykov,V.,有限混合建模中的Manly变换,计算统计数据分析,121,190-208(2018)·Zbl 1469.62184号 ·doi:10.1016/j.csda.2016.01.015 此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。