×

关于斜正态分布和斜(t)分布的混合。 (英语) Zbl 1273.62115号

摘要:倾斜分布的有限混合已经成为建模具有不对称特征的异构数据的有效工具。近年来,各种提案迅速出现,虽然相似,但并不完全相同,因此它们与其相对表现之间的联系变得相当不清楚。本文旨在通过对现有的反对称分布进行系统分类,将其分为四种类型,从而阐明它们之间的密切关系,从而简要概述这些发展。这也有助于理解一些基于期望最大化的算法之间的联系,这些算法用于计算模型参数的最大似然估计。本文的最后一部分展示了这些混合模型在对实际数据集进行聚类时的性能,与其他非椭圆轮廓聚类方法及其实现的相关算法相比。

MSC公司:

62小时05 多元概率分布的表征与结构理论;连接线
62H30型 分类和区分;聚类分析(统计方面)
62甲12 多元分析中的估计
65C60个 统计中的计算问题(MSC2010)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Arellano-Valle RB,Azzalini A(2006),关于偏正态分布族的统一。扫描J统计33:561–574·Zbl 1117.62051号 ·文件编号:10.1111/j.1467-9469.2006.00503.x
[2] Arellano-Valle RB,Genton MG(2005)《关于基本偏态分布》。多变量分析杂志96:93–116·Zbl 1073.62049号 ·doi:10.1016/j.jmva.2004.10.002
[3] Arellano-Valle RB,Genton MG(2010),多元扩展偏斜-$$t$$分布和相关族。麦德龙68:201–234·Zbl 1301.62016年 ·doi:10.1007/BF03263536
[4] Arellano-Valle RB、Branco MD、Genton MG(2006)关于选择引起的偏态分布的统一观点。加拿大统计局34:581–601·兹比尔1121.60009
[5] Arellano-Valle RB、Castro LM、Genton MG、Gómez HW(2008),关于偏态分布形状混合物的贝叶斯推断,及其在回归分析中的应用。贝叶斯分析3:513–540
[6] Arnold BC,Beaver RJ,Meeker WQ(1993)截断二元正态分布的非截断边缘。《心理测量学》58:471–478·Zbl 0794.62075号 ·doi:10.1007/BF02294652
[7] Azzalini A(1985)包含正态分布的一类分布。扫描J统计12:171–178·Zbl 0581.62014号
[8] Azzalini A(2005)偏正态分布和相关多变量家族。斯堪的纳维亚统计局32:159–188·兹比尔1091.62046 ·数字对象标识代码:10.1111/j.1467-9469.2005.00426.x
[9] Azzalini A,Capitanio A(1999)多元偏态正态分布的统计应用。J R Stat Soc系列B 61(3):579–602·Zbl 0924.62050号 ·doi:10.111/1467-9868.00194
[10] Azzalini A,Capitanio A(2003)对称扰动产生的分布,强调多元斜t分布。J R Stat Soc Ser B 65(2):367–389·Zbl 1065.62094号 ·数字对象标识代码:10.1111/1467-9868.00391
[11] Azzalini A,Dalla Valle A(1996)多元偏态正态分布。生物特征83(4):715–726·Zbl 0885.62062号 ·doi:10.1093/biomet/83.4.715
[12] Basso RM、Lachos VH、Cabral CRB、Ghosh P(2010)基于偏态正态分布比例混合的稳健混合建模。计算统计数据分析54:2926–2941·Zbl 1284.62193号 ·doi:10.1016/j.csda.2009.09.031
[13] Branco MD,Dey DK(2001)一类一般的多元斜椭圆分布。多变量分析杂志79:99–113·Zbl 0992.62047号 ·doi:10.1006/jmva.2000.1960
[14] Cabral CRB,Lachos VH,Prates MO(2012)使用偏正态独立分布的多元混合建模。计算统计数据分析56:126–142·Zbl 1239.62058号 ·doi:10.1016/j.csda.2011.06.026
[15] Contreras-Reyes JE,Arellano-Valle RB(2012)基于偏态正态分布比例混合的生长曲线,以模拟红鱼(epigonus crassicaudus)的年龄-长度关系。arXiv:12125180[statAP]
[16] Franczak BC、Browne RP、McNicholas PD(2012),移位不对称拉普拉斯分布的混合。arXiv:12071727[统计ME]
[17] Frühwirth-Schnatter S,Pyne S(2010)关于单变量和多变量偏正态和斜态分布有限混合的贝叶斯推断。生物统计学11:317–336·doi:10.1093/biostatistics/kxp062
[18] Genton MG(ed)(2004)《偏椭圆分布及其应用:超越正态性的旅程》。查普曼&佛罗里达州博卡拉顿霍尔/CRC·Zbl 1069.62045号
[19] Genton MG,Loperfido N(2005)广义偏椭圆分布及其二次型。Ann Inst统计数学57:389–401·Zbl 1083.62043号 ·doi:10.1007/BF02507031
[20] González-Farás G,Domínguez-Molinz JA,Gupta AK(2004),斜法向随机向量的可加性。J Stat Plan推断126:521–534·Zbl 1076.62052号 ·doi:10.1016/j.jspi.2003.09.008
[21] Gupta AK(2003)多元偏斜-$$t$$分布。统计37:359–363·Zbl 1037.62045号 ·doi:10.1080/715019247
[22] Gupta AK,González-Faríaz G,Domínguez-Molina JA(2004)多元正态分布。多变量分析杂志89:181–190·Zbl 1036.62043号
[23] Ho HJ,Lin TI,Chen HY,Wang WL(2012)截断多元$$t$$分布的一些结果。J Stat Plan推断142:25–40·Zbl 1229.62068号 ·doi:10.1016/j.jspi.2011.06.006
[24] Iversen DH(2010)《闭合斜交分布:模拟、反演和参数估计》。挪威科技大学,硕士论文
[25] Karlis D,Santourian A(2009),基于模型的非椭圆轮廓分布聚类。统计计算19:73–83·doi:10.1007/s11222-008-9072-0
[26] Lachos VH,Ghosh P,Arellano-Valle RB(2010),基于似然的偏正态独立线性混合模型推断。统计Sin 20:303–322·Zbl 1186.62071号
[27] Lee SX,McLachlan GJ(2011)关于通过EM算法拟合多元斜交t分布的混合物。arXiv:11094706[statME]
[28] Lee SX,McLachlan GJ(2013)多元斜交$$t$-分布的有限混合:一些最新结果。统计计算
[29] Lin TI(2009)多元正态混合模型的最大似然估计。《多变量分析杂志》100:257–265·Zbl 1152.62034号 ·doi:10.1016/j.jmva.2008.04.010
[30] Lin TI(2010)使用多元偏差$$t$$分布的稳健混合建模。统计计算20:343–356·doi:10.1007/s11222-009-9128-9
[31] Lin TI,Lee JC,Hsieh WJ(2007a)使用斜交$$t$$分布的稳健混合建模。统计计算17:81–92·doi:10.1007/s11222-006-9005-8
[32] Lin TI,Lee JC,Yen SY(2007b)使用斜正态分布的有限混合建模。统计Sin 17:909–927·Zbl 1133.62012年
[33] Lin TI,Ho HJ,Lee CR(2013)使用多元斜态正态分布的灵活混合建模。统计计算。数字对象标识代码:10.1007/s11222-013-9386-4
[34] Liseo B,Loperfido N(2003)多元偏态分布的贝叶斯解释。概率统计快报61:395–401·Zbl 1101.62342号 ·doi:10.1016/S0167-7152(02)00398-X
[35] Ma Y,Genton MG(2004)一类灵活的偏对称分布。扫描J统计31:459–468·Zbl 1063.62079号
[36] Prates M,Lachos V,Cabral C(2011)mixsmsn:拟合偏态正态分布的尺度混合的有限混合。http://CRAN.R-project.org/package=mixsmsn,R软件包版本1.0-7
[37] Pyne S,Hu X,Wang K,Rossin E,Lin TI,Maier LM,Baecher-Allan C,McLachlan GJ,Tamayo P,Hafler DA,De Jager PL,Mesirow JP(2009)自动化高维流式细胞术数据分析。美国国家科学院院刊106:8519–8524·doi:10.1073/pnas.0903028106
[38] Riggi S,Ingrassia S(2013)通过多元偏态分布混合物对高能宇宙射线质量组成数据进行建模。arXiv:13011178[astro-phHE]
[39] Sahu SK,Dey DK,Branco MD(2003)一类新的多元偏态分布及其在贝叶斯回归模型中的应用。加拿大统计局31:129–150·Zbl 1039.62047号 ·doi:10.2307/316064
[40] Soltyk S,Gupta R(2011)多元斜态正态混合模型和EM算法在价值风险中的应用。MODSIM 2011–第19届国际建模与仿真大会,珀斯
[41] Vrbik I,McNicholas PD(2012)多元斜交$$t$$混合模型EM算法的分析计算。统计概率快报82:1169–1174·Zbl 1244.65012号 ·doi:10.1016/j.spl.2012.02.200
[42] Vrbik I,McNicholas PD(2013)基于模型的聚类和分类的简约斜交混合模型。arXiv:13022373[statCO]
[43] Wang K,McLachlan GJ,Ng SK,Peel D(2009)EMMIX-skew:多元斜态正态/$$t$$分布混合的EM算法。http://www.maths.uq.edu.au/gjm/mix_soft/EMMIX-skew,R软件包版本1.0-12
[44] Wang K,Ng SK,McLachlan GJ(2009)多变量倾斜$$t$$混合模型:荧光激活细胞分类数据的应用。作者:Shi H,Zhang Y,Bottema MJ,Lovell BC,Maeder AJ(eds)DICTA 2009(数字图像计算会议:技术和应用,墨尔本)。IEEE计算机学会,洛斯阿拉米托斯,第526–531页
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。