×

使用偏态分布的多元聚类加权模型。 (英语) Zbl 07538945号

高级数据分析。分类。,ADAC公司 16,编号1,93-124(2022); 更正同上,第16号,第4,1097(2022)。
摘要:在聚类加权模型(CWM)领域已经做了大量工作,该模型扩展了有限混合回归模型,将协变量建模包括在内。虽然响应和协变量都考虑了多种类型的分布,但据我们所知,在这个范式中还没有考虑到偏态分布。其中,考虑了一个由24个新CWM组成的家族,它允许使用四种偏态分布(广义双曲型及其三种偏态特殊情况,即偏态(t)、方差-伽马和正态-逆高斯分布)或正态分布中的一种来建模响应和协变量。使用期望最大化算法进行参数估计,并使用模拟数据和实际数据进行说明。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
68吨10 模式识别、语音识别
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Aas K,HobK Haff I(2005)NIG和skew student’s t:广义双曲分布的两个特例。应用资源开发资源代表
[2] 安德鲁斯,JL;McNicholas,PD,多元t因子分析仪的扩展混合,统计计算,21,3,361-373(2011)·Zbl 1255.62171号
[3] 安德鲁斯,JL;McNicholas,PD,基于模型的聚类、分类和通过多元(t)分布混合的判别分析:(t)EIGEN家族,统计计算,22,5,1021-1029(2012)·Zbl 1252.62062号
[4] Azzalini A(2020)R包sn:偏态正态分布和相关分布,如偏态-(t)(版本1.6-1)。意大利帕多瓦大学。http://azzalini.stat.unipd.it/SN
[5] 阿拉巴马州巴里茨。,一些概率密度函数的Turán型不等式,Stud Sci Math Hung,47,2,175-189(2010)·Zbl 1234.62010年
[6] 伯塔,P。;Ingrassia,S.公司。;Punzo,A。;Vittadini,G.,医院评估的多层次聚类加权模型,METRON,74,3,275-292(2016)·兹比尔1394.62154
[7] Browne,RP;McNicholas,PD,广义双曲分布的混合,Can J Stat,43,2,176-198(2015)·Zbl 1320.62144号
[8] Chamroukhi,F.,Skew t mixed of experts,Neurocomputing,266390-408(2017年)
[9] Chen,L。;Pourahmadi,M。;Maadooliat,M.,带偏态t误差分布的正则化多元回归模型,J Stat Plan Inference,149,125-139(2014)·Zbl 1285.62073号
[10] Crawford,SL,《拉普拉斯方法在有限混合分布中的应用》,美国统计学会杂志,89,425,259-267(1994)·Zbl 0795.62022号
[11] UJ Dang;Browne,RP;McNicholas,PD,多元幂指数分布的混合,生物统计学,71,4,1081-1089(2015)·Zbl 1419.62330号
[12] UJ Dang;Punzo,A。;麦克尼古拉斯,PD;Ingrassia,S.公司。;Browne,RP,高斯加权模型的多元响应和简约性,J Classif,34,1,4-34(2017)·Zbl 1364.62149号
[13] Dang UJ、Gallaugher MP、Browne RP、McNicholas PD(2019)使用多元偏斜幂指数分布的混合物进行基于模型的聚类和分类。arXiv预印本arXiv:1907.01938
[14] 戴顿,CM;Macready,GB,伴随变量潜在类模型,J Am Stat Assoc,83,401,173-178(1988)
[15] 阿联酋登普斯特;新墨西哥州莱尔德;Rubin,DB,通过EM算法从不完整数据中获得最大似然,J Roy Stat Soc B,39,1,1-38(1977)·Zbl 0364.62022号
[16] 德萨博,WS;Cron,WL,《聚类线性回归的最大似然法》,J Classif,5,2,249-282(1988)·Zbl 0692.62052号
[17] Di Mari,R。;贝克,Z。;Punzo,A.,利用潜在类别分析进行远端预后预测的随机变量方法,Struct-Equ模型,27,3,351-368(2020)
[18] 多鲁,FZ;Arslan,O.,斜拉普拉斯正态分布混合物的参数估计及其在混合物回归建模中的应用,公共统计理论方法,46,21,10879-10896(2017)·Zbl 1462.62195号
[19] 费雷拉,CS;拉科斯,VH;Bolfarine,H.,《正态回归模型斜标度混合中的推断和诊断》,J Stat Comput Simul,85,3,517-537(2015)·Zbl 1457.62209号
[20] Frinpong EY,Gage TB,Stratton H(2008),二元混合物的可识别性:婴儿死亡率模型的应用。博士论文,Citeseer
[21] Frühwirth-Schnatter,S.,有限混合和马尔可夫切换模型(2006),纽约:Springer,纽约·Zbl 1108.6202号
[22] Frühwirth-Schnatter,S。;Pyne,S.,单变量和多变量偏态正态和偏态t分布有限混合的贝叶斯推断,生物统计学,11,2,317-336(2010)·Zbl 1437.62465号
[23] 加林贝蒂,G。;Soffriti,G.,关于多元线性聚类加权模型下最大似然估计量一致性的注释,Stat Probab Lett,157,1089630(2020)·Zbl 1459.62032号
[24] 加洛赫,MPB;McNicholas,PD,矩阵变量偏态t分布,Stat,6,1,160-170(2017)
[25] 加洛赫,MPB;McNicholas,PD,《三斜矩阵变量分布》,Statist Probab Lett,145,103-109(2019)·Zbl 1414.62173号
[26] Gershenfeld,N.,《非线性推理和聚类加权建模》,Ann N Y Acad Sci,808,1,18-24(1997)
[27] Göncü,A。;Yang,H.,Variance-gamma和正态-正态高斯模型:中国高频指数收益的良好性,《北美经济金融杂志》,36,279-292(2016)
[28] Hennig,C.,聚类线性回归模型的可识别性,J Classif,17,2273-296(2000)·Zbl 1017.62058号
[29] 休伯特,L。;Arabie,P.,比较分区,J Classif,2,1,193-218(1985)·Zbl 0587.62128号
[30] 洪,W-L;Chang-Chien,S-J,正态-逆高斯混合模型的基于学习的EM算法及其在太阳系外行星上的应用,J Appl Stat,44,6,978-999(2017)·Zbl 1516.62339号
[31] Ingrassia,S.公司。;南卡罗来纳州米诺蒂;Vittadini,G.,通过椭圆分布的聚类加权方法进行局部统计建模,J Classif,29,3,363-401(2012)·Zbl 1360.62335号
[32] Ingrassia,S.公司。;南卡罗来纳州米诺蒂;Punzo,A.,通过线性聚类加权模型进行基于模型的聚类,《计算统计数据分析》,71,159-182(2014)·Zbl 1471.62095号
[33] Ingrassia,S.公司。;Punzo,A。;维塔迪尼,G。;Minotti,SC,广义线性混合聚类加权模型,J Classif,32,1,85-113(2015)·Zbl 1331.62310号
[34] Ingrassia,S.公司。;Punzo,A.,回归混合的决策边界,韩国统计学会杂志,45,2,295-306(2016)·Zbl 1341.62181号
[35] Jorgensen,B.,广义逆高斯分布的统计特性(2012),纽约:Springer,纽约
[36] Karlis,D。;Santourian,A.,基于模型的非椭圆等高线分布聚类,统计计算,19,1,73-83(2009)
[37] 金,N-H;Browne,R.,广义双曲分布有限混合的子空间聚类,Adv Data Anal Classif,13,34641-661(2019)·Zbl 1474.62187号
[38] Lee,S。;McLachlan,GJ,《多元斜t分布的有限混合:一些最新结果》,《统计计算》,24,181-202(2014)·Zbl 1325.62107号
[39] Lin,TI,多元正态混合模型的最大似然估计,J Multivar Ana,100,2,257-265(2009)·Zbl 1152.62034号
[40] Lin,TI,使用多元斜交t分布的稳健混合建模,统计计算,20,3,343-356(2010)
[41] Lin,T。;麦克尼古拉斯,PD;Hsiu,JH,通过节约型t混合模型捕获模式,统计专家Probab Lett,88,80-87(2014)·Zbl 1369.62131号
[42] Mazza,A。;Punzo,A。;Ingrassia,S.,flexCWM:集群加权模型的灵活框架,J Stat Softw,86,2,1-30(2018)
[43] AJ麦克尼尔;弗雷,R。;Embrechts,P.,《定量风险管理:概念、技术和工具》(2005),普林斯顿:普林斯顿大学出版社,普林斯顿·Zbl 1089.91037号
[44] McNicholas PD(2016a)基于混合模型的分类。查普曼&博卡拉顿霍尔/CRC出版社·Zbl 1454.62005年
[45] McNicholas PD(2016b)基于模型的聚类。J Classif 33(3):331-373·Zbl 1364.62155号
[46] 麦克尼古拉斯,SM;麦克尼古拉斯,PD;布朗,RP;Ahmed,SE,《方差-γ因子分析仪的混合物,大数据和复杂数据分析,对统计的贡献》,369-385(2017),Cham:Springer,Cham·Zbl 1381.62187号
[47] 墨菲K,墨菲TB(2020a)带协变量和噪声分量的高斯简约聚类模型。高级数据分析类14:293-325·Zbl 1474.62240号
[48] 墨菲K,墨菲TB(2020b)MoEClust:具有协变量和噪声分量的高斯简约聚类模型。R软件包版本1.3.3。https://cran.r-project.org/package=MoEClust ·Zbl 1474.62240号
[49] Murray PM、Browne RB、McNicholas PD(2014a)偏态t因子分析仪的混合物。计算机统计数据分析77:326-335·Zbl 1506.62132号
[50] Murray PM、McNicholas PD、Browne RB(2014b)常见斜交因子分析仪的混合物。统计3(1):68-82
[51] 皮,D。;McLachlan,GJ,使用t分布的稳健混合建模,统计计算,10,4,339-348(2000)
[52] Počuča N,JevtićP,McNicholas PD,Miljkovic T(2020)使用零膨胀广义聚类加权模型对索赔的频率和严重程度进行建模。数学经济保险·Zbl 1452.91280号
[53] Punzo,A.,多项式高斯聚类加权模型的灵活混合建模,统计模型,14,3,257-291(2014)·Zbl 07257904号
[54] Punzo,A。;Ingrassia,S.公司。;莫里尼,I。;Minerva,T。;Vichi,M.,简约广义线性高斯聚类加权模型,数据分析统计模型的进展,分类、数据分析和知识组织研究,201-209(2015),瑞士:施普林格,瑞士
[55] Punzo,A。;Ingrassia,S.,通过聚类加权模型聚类二元混合型数据,计算统计,31,3,989-1013(2016)·Zbl 1347.65030号
[56] Punzo,A。;Bagnato,L.,多元尾胀正态分布及其在金融中的应用,J Stat Comput Simul,91,1,1-36(2021)·Zbl 07480666号
[57] Punzo,A。;Ingrassia,S.公司。;Maruotti,A.,《随机协变量的多元广义隐马尔可夫回归模型:老年人的体育锻炼》,Stat Med,37,19,2797-2808(2018)
[58] Punzo,A。;Ingrassia,S.公司。;Maruotti,A.,《多元隐马尔可夫回归模型:随机协变量和重尾分布》,Stat Pap,62,3,1519-1555(2021)·Zbl 1477.62224号
[59] 派恩,S。;胡,X。;王凯。;Rossin,E。;Lin,T-I;迈尔,LM;Baecher-Allan,C。;GJ麦克拉克伦;Tamayo,P。;Hafler,DA,自动化高维流式细胞术数据分析,Proc Natl Acad Sci,106,21,8519-8524(2009)
[60] R核心团队(2019)R:统计计算的语言和环境。R统计计算基金会,奥地利维也纳。https://www.R-project.org/
[61] Schwarz,G.,估算模型的维数,Ann Stat,6,2,461-464(1978)·兹伯利0379.62005
[62] Soffriti,G。;Galinberti,G.,《具有非正态误差的多元线性回归:基于混合模型的解决方案》,《统计计算》,21,4,523-536(2011)·Zbl 1221.62106号
[63] 马萨诸塞州斯特恩;麦克尼古拉斯,PD;Yada,R.,通过多元t因子分析仪的混合物进行基于模型的分类,Commun Stat Simul Compute,41,4,510-523(2012)·Zbl 1294.62142号
[64] Subedi,S。;Punzo,A。;Ingrassia,S.公司。;McNicholas,PD,通过聚类加权因子分析仪进行聚类和分类,Adv Data Anal Classif,7,1,5-40(2013)·Zbl 1271.62137号
[65] Subedi,S。;Punzo,A。;Ingrassia,S.公司。;McNicholas,PD,基于稳健模型的聚类和降维的聚类加权因子分析,统计方法应用,24,4,623-649(2015)·Zbl 1416.62362号
[66] Tiedeman DV(1955)关于类型的研究。在:Sells SB(ed)模式分析研讨会上。德克萨斯州伦道夫菲尔德美国空军航空医学院航空大学
[67] Titterington,DM;史密斯,AFM;Makov,UE,有限混合分布的统计分析(1985),纽约:Wiley,纽约·Zbl 0646.62013.中
[68] Tomarchio SD、McNicholas PD、Punzo A(2021)矩阵正态聚类加权模型。J类38(3)·Zbl 07473950号
[69] 托托拉,C。;Browne,RP;ElSherbiny,A。;不列颠哥伦比亚省Franczak;McNicholas,PD,使用广义双曲线分布的基于模型的聚类、分类和判别分析:MixGHD R包,J Stat Softw,98,3,1-24(2021)
[70] 弗瑞克,I。;McNicholas,PD,多元偏t混合模型EM算法的分析计算,Statist Probab Lett,82,611169-1174(2012)·Zbl 1244.65012号
[71] 弗瑞克,I。;McNicholas,PD,基于模型的聚类和分类的简约斜交混合模型,《计算统计数据分析》,71,196-210(2014)·Zbl 1471.62202号
[72] Wang K,Ng SK,McLachlan GJ(2009)《多元斜交混合模型:荧光激活细胞分类数据的应用》。数字图像计算:技术和应用。IEEE,第526-531页
[73] Wolfe JH(1965)类型最大似然分析的计算机程序,技术公告。美国海军人员研究活动,第65-15页
[74] 扎雷,S。;Mohammadpour,A。;Ingrassia,S.公司。;Punzo,A.,《关于在聚类加权模型中使用亚高斯(α)稳定分布》,伊朗科学技术杂志,43,3,1059-1069(2019)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。