×

偏正态分布多元尺度混合的有限混合。 (英语) Zbl 1461.62074号

摘要:由于多元斜交分布的有限混合在建模数据的异质性、不对称性和轻量级方面的灵活性和稳健性,近年来越来越流行。本文介绍了一种新的非正态分布的多变量尺度形状混合的有限混合,以增强对包含更多极端非正态特征的异质多元数据建模时的强度和灵活性。为了实现参数的最大似然估计,开发了一种计算简单的ECM算法,该算法由解析简单的E-步和CM-步组成。参数估计的渐近协方差矩阵由观测信息矩阵导出,使用预期完整数据得分的外积。我们通过模拟和实际数据示例证明了所提方法的实用性。

MSC公司:

62甲12 多元分析中的估计
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿盖珀,N。;菲纳克,G。;胡斯,H。;奥斯曼,T。;Gottardo,R。;Brinkman,RR;谢尔曼,RH;Flowcap联盟,The Dream联盟,自动化流式细胞术分析技术的关键评估,Nat Methods,10228-238(2013)·doi:10.1038/nmeth.2365
[2] 艾特肯,AC,《关于伯努利代数方程的数值解》,Proc R Soc Edib,46,289-305(1926)·doi:10.1017/S0370164600022070
[3] 阿雷拉诺·瓦勒,RB;Bolfarine,H。;Lachos,VH,Skew-normal线性混合模型,《数据科学杂志》,第3期,第415-438页(2005年)
[4] 阿雷拉诺·瓦勒,RB;费雷拉,CS;Genton,M.,《多元偏正态分布的尺度和形状混合》,《多元分析杂志》,16698-110(2018)·Zbl 1499.62161号 ·doi:10.1016/j.jmva.2018.02.007
[5] 阿雷利亚诺·瓦莱,RB;Genton,M.,《关于基本偏态分布》,《多变量分析杂志》,96,93-116(2005)·Zbl 1073.62049号 ·doi:10.1016/j.jmva.2004.10.002
[6] 阿扎里尼,A。;Dalla Valle,A.,《多元偏态正态分布》,《生物统计学》,第83期,第715-726页(1996年)·Zbl 0885.62062号 ·doi:10.1093/biomet/83.4.715
[7] 阿扎里尼,A。;Capitaino,A.,对称扰动产生的分布,强调多元斜(t)分布,J R Stat Soc B,65,367-389(2003)·兹比尔1065.62094 ·数字对象标识代码:10.1111/1467-9868.00391
[8] Barndorff Nielsen,OE;Biaesild,P。;Taillie,C。;帕蒂尔,GP;Baldessari,BA,双曲分布及其衍生物:对理论和应用的贡献,科学工作中的统计分布,19-44(1981),阿姆斯特丹:D.Reidel,阿姆斯特朗·Zbl 0489.62020号
[9] Barndorff Nielsen,OE;Stelzer,R.,广义双曲分布的绝对矩和正态逆高斯Lévy过程的近似标度,Scand J Stat,32,4,617-637(2005)·Zbl 1088.60005号 ·数字对象标识代码:10.1111/j.1467-9469.2005.00466.x
[10] 肯塔基州巴斯福德;DR Greenway;GJ麦克拉克伦;Peel,D.,正常混合物下拟合平均值的标准误差,计算统计,12,1-17(1997)·Zbl 0924.62055号
[11] Branco,医学博士;Dey,DK,一类一般的多元斜椭圆分布,J Multivar Anal,7999-113(2001)·Zbl 0992.62047号 ·文件编号:10.1006/jmva.2000.1960
[12] 卡布拉尔,C。;拉科斯,V。;Prates,M.,使用偏正态独立分布的多元混合建模,《计算统计数据分析》,56,126-142(2012)·Zbl 1239.62058号 ·doi:10.1016/j.csda.2011.06.026
[13] Cramér,H.,《统计的数学方法》(1946),普林斯顿:普林斯顿大学出版社,普林斯顿·Zbl 0063.01014号
[14] 阿联酋登普斯特;新墨西哥州莱尔德;Rubin,DB,通过EM算法获得不完整数据的最大似然(带讨论),J R Stat Soc B,39,1-38(1977)·Zbl 0364.62022号
[15] 费雷拉,CS;拉乔斯,VH;Bolfarine,H.,基于Likelihood的正态分布多元斜标度混合的推断,AStA Adv Stat Ana,100421-441(2016)·Zbl 1443.62133号 ·doi:10.1007/s10182-016-0266-z
[16] Good,IJ,物种的种群频率和种群参数的估计,《生物统计学》,40,237-260(1953)·Zbl 0051.37103号 ·doi:10.1093/biomet/40.3-4.237
[17] Jamalizadeh,A。;Lin,TI,《偏态正态分布的一般尺度混合:性质和估计》,《计算统计》,32,451-474(2017)·Zbl 1417.62030号 ·doi:10.1007/s00180-016-0691-1
[18] Jörgensen,S.,广义逆高斯分布的统计特性(1982),纽约:Springer,纽约·Zbl 0486.62022号
[19] TJ Kozubowski;Podgórski,K.,拉普拉斯分布的多元非对称推广,计算统计,15531-540(2000)·Zbl 1035.60010号 ·doi:10.1007/PL00022717
[20] 拉乔斯,VH;莫雷诺,EL;Kun,C。;Barbosa Cabral,CR,使用多元学生分布的截尾数据的有限混合建模,J Multivar Anal,159151-167(2017)·兹比尔1397.62221 ·doi:10.1016/j.jmva.2017.05.005
[21] 李,SX;McLachlan,GJ,规范基本偏态分布的有限混合,统计计算,26,573-589(2016)·兹比尔1420.60020 ·doi:10.1007/s11222-015-9545-x
[22] 李,SX;McLachlan,GJ,EMMIXuskew:通过EM算法拟合多元斜(t)分布混合物的R包,J Stat Softw,55,1-22(2013)
[23] Lin,TI,多元正态混合模型的最大似然估计,J Multivar Ana,100257-265(2009)·Zbl 1152.62034号 ·doi:10.1016/j.jmva.2008.04.010
[24] Lin,TI,使用多元斜(t)分布的稳健混合建模,《统计计算》,20,343-356(2010)·doi:10.1007/s11222-009-9128-9
[25] Lin,TI,通过特征值分解通过参数化混合模型从不完整数据中学习,《计算统计数据分析》,71,183-195(2014)·Zbl 1471.62120号 ·doi:10.1016/j.csda.2013.02.020
[26] 林,TI;Ho,HJ;Lee,CR,使用多元斜交正态分布的灵活混合建模,统计计算,24531-546(2014)·Zbl 1325.62113号 ·doi:10.1007/s11222-013-9386-4
[27] 刘,CH;Rubin,DB,《ECME算法:EM和ECM的简单扩展,具有更快的单调收敛性》,Biometrika,81,633-648(1994)·Zbl 0812.62028号 ·doi:10.1093/biomet/81.4.633
[28] Louis,TA,使用EM算法时发现观测信息矩阵,J R Stat Soc B,44,226-233(1982)·Zbl 0488.62018号
[29] 麦克尼古拉斯,PD;墨菲,TB;AF麦克戴德;Frost,D.,通过简约高斯混合模型实现基于模型的聚类的串行和并行实现,Comput Stat Data Anal,54711-723(2010)·兹比尔1464.62131 ·doi:10.1016/j.csda.2009.02.011
[30] 孟,XL;Rubin,DB,《通过ECM算法进行最大似然估计:一般框架》,Biometrika,80,267-278(1993)·Zbl 0778.62022号 ·doi:10.1093/biomet/80.2.267
[31] 孟,XL;van Dyk,D.,《EM算法——一首随着快速新曲演唱的老民歌》,J R Stat Soc B,59,511-556(1997)·Zbl 1090.62518号 ·数字对象标识代码:10.1111/1467-9868.00082
[32] 派恩,S。;胡,X。;王凯。;Rossin,E。;林,TI;迈尔,LM;Baecher-Allan,C。;GJ麦克拉克伦;Tamayo,P。;哈夫勒,DA;德贾格尔,波兰;Mesirov,JP,自动化高维流式细胞术数据分析,美国国家科学院院刊,106,8519-8524(2009)·doi:10.1073/pnas.0903028106
[33] CP罗伯特;Casella,G.,Monte Carlo统计方法(2004),纽约:Springer,纽约·Zbl 1096.62003年
[34] Schwarz,G.,估算模型的维数,Ann Stat,6461-464(1978)·Zbl 0379.62005年 ·doi:10.1214/aos/1176344136
[35] Wang,J。;Genton,MG,《多元偏斜率分布》,J Stat Plan Inf,136,209-220(2006)·Zbl 1081.60013号 ·doi:10.1016/j.jspi.2004.06.023
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。