×

基于模型的聚类中的歪斜分布概述。 (英语) Zbl 1493.62389号

摘要:近年来,关于非正态模型聚类的文献持续增长。非正态模型通常采用成分密度混合的形式,在分布形状上提供了高度的灵活性。他们以不同的方式处理偏度,最典型的方式是引入潜在的“偏度”变量,而其他一些人则考虑原始变量的边际变换。我们根据偏态的特征,选择性地概述了该地区使用的主要类型的偏态分布,并讨论了它们可能产生的不同偏态形状。为了简单起见,我们将重点放在更常见的分布族上。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62H10型 统计的多元分布
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿班托·瓦勒,加利福尼亚州。;拉科斯,V.H。;Dey,D.K.,偏态学生随机波动率模型的贝叶斯估计,Methodol。计算。申请。概率。,17, 721-738 (2015) ·Zbl 1327.62128号
[2] Adcock,C.,《偏正态和偏态学生分布的Copulaseque版本》,《对称》,第13期,第815页(2021年)
[3] 阿德科克,C。;Azzalini,A.,《偏椭圆和相关分布及其应用的选择性概述》,《对称》,第12期,第1-38页(2020年)
[4] Arellano-Valle,R.B。;费雷拉,C.S。;Genton,M.G.,《多元偏正态分布的尺度和形状混合》,《多元分析杂志》。,166, 98-110 (2018) ·Zbl 1499.62161号
[5] Arellano-Valle,R.B。;Genton,M.G.,关于基本偏斜分布,J.Multivariate Anal。,96, 93-116 (2005) ·Zbl 1073.62049号
[6] Asparouhov,T。;Muthén,B.,具有连续非正态偏斜分布的结构方程模型和混合模型,结构。等于。模型。(2015)
[7] Azzalini,A.,《偏态正态分布和相关多变量家族》,Scand。《美国统计杂志》,32,159-188(2005)·兹比尔1091.62046
[8] 阿扎里尼,A。;Capitanio,A.,《对称扰动产生的分布,强调多元斜分布》,J.R.Statist。Soc.B,65,367-389(2003)·兹比尔1065.62094
[9] 阿扎里尼,A。;Capitanio,A.,《偏态和相关家族》,数学统计研究所专著(2014),剑桥大学出版社:英国剑桥大学出版社·Zbl 0924.62050号
[10] 阿扎里尼,A。;Dalla Valle,A.,《多元偏态正态分布》,《生物统计学》,第83期,第715-726页(1996年)·Zbl 0885.62062号
[11] Babić,S。;莱伊,C。;Veredas,D.,多元斜交和重尾数据的灵活分布的比较和分类,Symmetry,11216(2019)
[12] Bickel,P.J。;Doksum,K.A.,《重访转型分析》,J.Amer。统计师。协会,76,296-311(1981)·兹比尔0464.62058
[13] 盒子,通用电气。;Cox,D.R.,《转换分析》,J.R.Stat.Soc.Ser。B统计方法。,2, 211-252 (1964) ·Zbl 0156.40104号
[14] 医学博士布兰科。;Dey,D.K.,一类一般的多元偏椭圆分布,《多元分析》。,79, 99-113 (2001) ·Zbl 0992.62047号
[15] Browne,R.P。;Dang,U.J。;Gallaugher,M.P。;McNicholas,P.D.,mixSPE:基于模型的聚类和分类中使用的幂指数和斜幂指数分布的混合R包0.9.1版(2021)
[16] R.Browne。;McNicholas,P.,广义双曲分布的混合,Canad。J.统计。,43, 176-198 (2015) ·Zbl 1320.62144号
[17] 卡布拉尔,C.R。;拉科斯,V.H。;Prates,M.,使用偏正态独立分布的多元混合模型,计算。统计师。数据分析。,56, 126-142 (2012) ·Zbl 1239.62058号
[18] 卡布拉尔,C.R.B。;拉科斯,V.H。;Prates,M.O.,使用偏斜正态独立分布的多变量混合建模,Comput。统计师。数据分析。,56, 126-142 (2012) ·Zbl 1239.62058号
[19] 孔特拉斯·雷伊斯,J.E。;Arellano-Valle,R.B.,基于偏态正态分布比例混合的红腹金枪鱼(epigonus crassicaudus)生长估计,鱼类。研究,147137-144(2013)
[20] Dávila,V。;卡布拉尔,C。;Zeller,C.,《斜分布的有限混合》(2018),Springer:Springer Berlin·Zbl 1428.62006号
[21] 福布斯,F。;Wraith,D.,一个新的多元重尾分布族,具有可变的尾量边际:稳健聚类的应用,统计计算。,24, 971-984 (2014) ·Zbl 1332.62204号
[22] Franczak,B。;R.Browne。;McNicholas,P.,移位非对称拉普拉斯分布的混合,IEEE Trans。模式分析。机器。智力。,36 (2014), 1149-1157
[23] Frühwirth-Schnatter,S。;Pyne,S.,单变量和多变量偏正态分布和斜(t)分布有限混合的贝叶斯推断,生物统计学,11,317-336(2010)·Zbl 1437.62465号
[24] (Genton,M.G.,《偏椭圆分布及其应用:超越正态性的旅程》(2004),查普曼和霍尔出版社,CRC)·Zbl 1069.62045号
[25] 戈麦斯,H.W。;委内瑞拉,O。;Bolfarine,H.,由正态分布的分布函数生成的斜对称分布,Environmetrics,18395-407(2007)
[26] Gupta,A.K.,多元偏态分布,统计学,37359-363(2003)·Zbl 1037.62045号
[27] 贾朱加,K。;Palpa,D.,Copula在基于模型的聚类中的作用,数据信息分析。知识。工程师,60,606-613(2006)
[28] Jones,M.C.,《关于带形状参数的分布族》(含讨论),国际出版社。统计师。版本:83,175-192(2015)·Zbl 07763428号
[29] 琼斯,M.C。;Pewsey,A.,Sinh-arcsinh分布,Biometrika,96761-780(2009)·Zbl 1183.62019年6月
[30] Karlis,D。;Santourian,A.,基于模型的非椭圆轮廓分布聚类,统计计算。,1973-83(2009年)
[31] Kollo,T.,《多元偏度和峰度测量及其在ICA中的应用》,J.《多元分析》。,79, 99-113 (2008) ·Zbl 1294.62021号
[32] onu Kollo,T。;Käärik,M。;Selart,A.,多元斜交分布:参数估计的渐近性和斜交copula的推广,对称,13,1059(2021)
[33] Kollo,T。;Pettere,G.,多元斜t-copula的参数估计和应用,(Jaworski,P.;Durante,F.;Härdle,W.K.;Rychlik,t.,copula理论及其应用(2010),施普林格:施普林格柏林/海德堡,柏林),289-298
[34] Kollo,T。;Srivastava,M.S.,多元拉普拉斯分布参数的估计和测试,Comm.Statist。理论方法,3322363-2387(2007)·Zbl 1217.62080号
[35] Kosmidis,I。;Karlis,D.,《使用应用程序的Copula的基于模型的聚类》,Stat.Comput。,26, 1079-1099 (2016) ·Zbl 1505.62233号
[36] 拉科斯,V.H。;Ghosh,P。;Arellano-Valle,R.B.,基于似然的斜正态独立线性混合模型推断,统计。Sinica,20,303-322(2010)·Zbl 1186.62071号
[37] Lee,S.X。;林,T.-I。;McLachlan,G.J.,《因子分析仪与基本斜态正态分布比例混合物的混合物》,《高级数据分析》。分类。,15, 481-512 (2021) ·Zbl 07363882号
[38] Lee,S.X。;McLachlan,G.J.,EMMIX-uskew:通过EM算法拟合多元斜交分布混合物的R包,J.Stat.Softw。,55, 1-22 (2013)
[39] Lee,S.X。;McLachlan,G.J.,基于模型的非正态混合分布聚类和分类,统计方法应用。,22, 427-454 (2013) ·Zbl 1332.62209号
[40] Lee,S.X。;McLachlan,G.J.,《关于偏态正态分布和偏态(t)分布的混合》,《高级数据分析》。分类。,7, 241-266 (2013) ·Zbl 1273.62115号
[41] Lee,S。;McLachlan,G.,多元斜(t)分布的有限混合:一些最新结果,统计计算。,242181-202(2014年)·Zbl 1325.62107号
[42] Lee,S.X。;McLachlan,G.J.,规范基本斜交(t)分布的有限混合:限制和非限制斜交(t)混合模型的统一,统计计算。,26, 573-589 (2016) ·Zbl 1420.60020号
[43] Lee,S.X。;McLachlan,G.J.,EMMIXcskew:规范基本偏态分布混合拟合的R包,J.Stat.Softw。,83,3,1-32(2018)
[44] Lee,S.X。;McLachlan,G.J.,《关于斜因子模型的公式:斜因子和/或斜误差》,统计。普罗巴伯。莱特。,168,第108935条pp.(2021)·Zbl 1456.62036号
[45] Ley,C.,《统计中的灵活建模:过去、现在和未来》,J.Soc.Française Statist。,156, 76-79 (2015) ·Zbl 1316.62023号
[46] 莱伊,C。;Paindaveine,D.,《多元倾斜机制:基于转换方法的统一观点》,Statist。普罗巴伯。莱特。,80, 1685-1694 (2010) ·Zbl 1219.60009号
[47] Lin,T.-I.,多元正态混合模型的最大似然估计,多元分析杂志。,100, 257-265 (2009) ·Zbl 1152.62034号
[48] Lin,T.I.,使用多元斜交分布的稳健混合建模,统计计算。,20, 343-356 (2010)
[49] Lin,T.I。;Ho,H.J。;Lee,C.R.,使用多元斜态正态分布的灵活混合建模,统计计算。,24531-546(2014)·Zbl 1325.62113号
[50] Lin,T.I。;McLachlan,G.J。;Lee,S.X.,使用受限多元偏态分布扩展因子模型的混合,《多元分析杂志》。,143, 398-413 (2016) ·Zbl 1328.62378号
[51] Lin,T.I。;Wang,W.L。;麦克拉克伦,G。;Lee,S.,使用受限多元斜(t)分布的稳健因子分析模型混合,Statist。型号。,18, 50-72 (2018) ·Zbl 07289498号
[52] Lo,K。;Gottardo,R.,《通过带Box-Cox变换的多元(t)分布进行灵活混合建模:斜(t)分配的替代方法》,Statist。计算。,22, 33-52 (2012) ·Zbl 1322.62173号
[53] Lo,K。;Hahne,F。;布林克曼,R.R。;Gottardo,R.,Flowclust:一种用于流式细胞术数据自动门控的生物导体包,BMC Bioninform。,10, 145 (2009)
[54] Loperfido,N.,《基于偏斜的投影追踪:计算方法》。统计师。数据分析。,120, 42-57 (2018) ·兹比尔1469.62111
[55] Mahdavi,A。;阿米扎德,V。;Jamalizadeh,A。;Lin,T.-I.,《多元弹性偏对称正态分布:基于选择表示的尺度形状混合和参数估计》,《对称》,第13期,第1343页(2021年)
[56] Maleki,M。;McLachlan,G.J。;Lee,S.X.,基于多元碎片分布有限混合的稳健聚类,统计学。模型。(2020年),(出版中)
[57] Maleki,M。;Wraith,D.,贝叶斯框架中多元限制偏态因子分析模型的混合,计算。统计人员。,34, 1039-1053 (2019) ·Zbl 1505.62270号
[58] Maleki,M。;Wraith,D。;Arellano-Valle,R.B.,多元非限制偏正广义双曲分布的稳健有限混合建模,统计计算。,29, 415-428 (2019) ·Zbl 1430.62105号
[59] Manly,B.F.J.,指数数据转换,J.R.Stat.Soc.Ser。B统计方法。,25,37-42(1976年)
[60] McLachlan,G.J。;Lee,S.X.,评论A.Azzalini、R.Browne、M.Genton和P.McNicholas(统计学家)的“关于两种斜分布公式的命名和相对优点”。概率Lett。,116, 1-5 (2016) ·Zbl 1376.60029号
[61] 麦克尼科拉斯,S.M。;McNicholas,医学博士。;Browne,R.P.,《方差-γ因子分析的混合物》,(大数据和复杂数据分析:方法论和应用(2017),Springer International Publishing:Springer国际出版公司Cham),365-385·Zbl 1381.62187号
[62] 梅利尼科夫,Y。;朱,X。;Melnykov,V.,具有重尾和分散的倾斜数据组的转换混合建模,计算。统计人员。,36, 61-78 (2021) ·Zbl 1505.62290号
[63] 默里,P。;B.布朗。;McNicholas,P.,《斜交因子分析仪的混合物》,计算。统计师。数据分析。,77, 326-335 (2014) ·Zbl 1506.62132号
[64] 莫里,P.M。;Browne,R.P。;McNicholas,P.D.,隐截断双曲分布,其有限混合,及其在聚类中的应用,J.Multivariate Anal。,161, 141-156 (2017) ·Zbl 1403.62028号
[65] 莫里,P.M。;Browne,R.P。;McNicholas,P.D.,隐截断双曲因子分析仪的混合物,J.Classification,34,366-379(2020)·Zbl 07223606号
[66] Negarestani,H。;Jamalizadeh,A。;沙菲伊,S。;Balakrishnan,N.,正态分布的平均混合:性质、推断和应用,Metrika,82,501-528(2019)·Zbl 1481.60026号
[67] 普拉特斯,M。;拉科斯,V。;Cabral,C.,mixsmsn:拟合斜态正态分布比例混合的有限混合R包版本1.0-9(2013)
[68] 派恩,S。;胡,X。;王凯。;Rossin,E。;林,T.-I。;迈尔,L.M。;Baecher-Allan,C。;McLachlan,G.J。;Tamayo,P。;哈夫勒,D.A。;德贾格尔,P.L。;Mesirow,J.P.,自动化高维流式细胞术数据分析,Proc。国家。阿卡德。科学。美国,106,8519-8524(2009)
[69] 派恩,S。;Lee,S。;McLachlan,G.,《自然与人:人类快速发展过程中的生物安全目标》,印度农业学会。统计人员。,69, 117-125 (2015)
[70] Riggi,S。;Ingrassia,S.,高能宇宙线质量组成分析的基于模型的聚类方法,Astropart。物理。,48, 86-96 (2013)
[71] Sahu,S.K。;戴伊,D.K。;Branco,M.D.,一类新的多元偏斜分布及其在贝叶斯回归模型中的应用,加拿大。J.统计。,31, 129-150 (2003) ·Zbl 1039.62047号
[72] Schaarschmidt,F。;霍夫曼,M。;Jaki,T。;Grün,B。;Hothorn,L.A.,《测定抗药物抗体生物测定中切点的统计方法》,J.Immunol。方法,25295-306(2015)
[73] Schweizer,B。;Sklar,A.,《概率度量空间》(1983年),北荷兰人:北荷兰纽约·Zbl 0546.60010号
[74] Sklar,A.,《Rápartitionán Dimensions et Leurs Marges的功能》,第8卷,229-231(1959),巴黎大学统计研究所出版物·Zbl 0100.14202号
[75] Spurek,P.,一般分裂高斯交叉熵聚类,专家系统。申请。,68, 58-68 (2017)
[76] 托托拉,C。;Browne,R.P。;Franczak,B.C。;McNicholas,P.D.,MixGHD:使用广义双曲分布混合的基于模型的聚类、分类和判别分析R包版本1.7(2015)
[77] Tukey,J.W.,《数据分析中的现代技术》(1977),马萨诸塞州东南部大学:马萨诸塞州达特茅斯东南部大学
[78] 维拉尼,M。;Larsson,R.,多元分裂正态分布和非对称主成分分析,Comm.Statist。理论方法,35,1123-1140(2006)·Zbl 1102.62064号
[79] 弗拉克,M。;Billard,L。;Diday,E。;Chèdin,A.,混合物模型的Copula分析,计算。统计人员。,27, 427-457 (2012) ·Zbl 1304.65087号
[80] 王凯。;McLachlan,G.J。;Ng、S.-K。;Peel,D.,EMMIXskew:多元斜态正态分布混合的EM算法R包版本1.0.20(2009)
[81] Weibel,M。;Luethi博士。;Breymann,W.,ghyp:广义双曲分布及其特殊情况R包版本1.6.1(2020)
[82] Wraith,D。;Forbes,F.,《具有灵活尾部行为的高斯分布和尺度混合:属性、推理和在多元聚类中的应用》,计算。统计师。数据分析。,90, 61-73 (2015) ·Zbl 1468.62210号
[83] Yeo,I.K。;Johnson,R.A.,《改善正态性或对称性的新功率变换家族》,《生物统计学》,87954-959(2000)·Zbl 1028.62010号
[84] 张,L。;Baek,J.,用于聚类高维数据的高斯copula因子分析器的混合,韩国统计学会期刊,48,480-492(2019)·Zbl 1428.62301号
[85] 朱,X。;Melnykov,V.,Manlymix:Manly混合物建模的R包,R J.,9,176-197(2017)
[86] 朱,X。;Melnykov,V.,有限混合建模中的Manly变换,计算。统计师。数据分析。,121, 190-208 (2018) ·Zbl 1469.62184号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。