×

使用非正态独立分布的多元混合建模。 (英语) Zbl 1239.62058号

摘要:我们考虑一类灵活的模型,其元素是多元非正态独立分布的有限混合。采用通用EM型算法迭代计算参数估计,并重点讨论了斜正态、斜-t、斜斜线和斜污染正态分布的有限混合。此外,还提出了一种基于信息的近似估计渐近协方差矩阵的通用方法。通过仿真研究评估了相关估计的准确性和一些信息标准的效率。通过对人工数据集和实际数据集的分析得出的结果表明了该方法的有效性。提出的EM型算法和方法在R包mixsmsn中实现。

MSC公司:

2005年6月62日 多元概率分布的表征和结构理论;连接线
62小时12分 多元分析中的估计
65C60个 统计中的计算问题(MSC2010)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Akaike,H.,统计模型识别的新视角,自动控制,IEEE Transactions on,19716-723(1974)·Zbl 0314.62039号
[2] 安德鲁斯·D·F。;Mallows,C.L.,正态分布的比例混合,《皇家统计学会杂志》,B辑,36,99-102(1974)·兹比尔0282.62017
[3] Arellano-Valle,R.B。;阿扎里尼,A.,《关于偏正态分布族的统一》,《斯堪的纳维亚统计杂志》,33561-574(2006)·Zbl 1117.62051号
[4] Arellano-Valle,R.B。;Genton,M.G.,《关于基本偏态分布》,《多元分析杂志》,96,93-116(2005)·Zbl 1073.62049号
[5] 阿扎里尼,A.,一类包含正态分布的分布,《斯堪的纳维亚统计杂志》,12171-178(1985)·Zbl 0581.62014号
[6] 阿扎里尼,A.,《偏态正态分布和相关多变量家族》,《斯堪的纳维亚统计杂志》,32,159-188(2005)·Zbl 1091.62046号
[7] 阿扎里尼,A。;Capitanio,A.,《对称扰动产生的分布,强调多元斜(t)分布》,《皇家统计学会杂志》,B辑,65367-389(2003)·Zbl 1065.62094号
[8] 阿扎里尼,A。;Dalla Valle,A.,《多元偏态正态分布》,《生物统计学》,83,4,715-726(1996)·Zbl 0885.62062号
[9] Bai,Z.D。;克里希纳亚,P.R。;Zhao,L.C.,关于白噪声信号处理中有效检测标准的收敛速度,信息论,IEEE汇刊,35,380-388(1989)·Zbl 0677.94001号
[10] Basford,K.E。;格林威,D.R。;麦克拉克伦,G.J。;Peel,D.,正态混合物拟合分量平均值的标准误差,计算统计学,12,1-17(1997)·Zbl 0924.62055号
[11] 巴索,R。;拉科斯,V。;卡布拉尔,C。;Ghosh,P.,基于偏态正态分布比例混合的稳健混合建模,计算统计与数据分析,542926-2941(2010)·Zbl 1284.62193号
[12] 比尔纳基,C。;Celeux,G。;Govaert,G.,评估具有集成完成可能性的聚类混合模型,IEEE模式分析和机器智能汇刊,22719-725(2000)
[13] Böhning,D.,《混合物和应用的计算机辅助分析》(2000年),查普曼和霍尔出版社,CRC·Zbl 0951.62088号
[14] 医学博士布兰科。;Dey,D.K.,多元偏椭圆分布的一般类,多元分析杂志,7999-113(2001)·兹比尔0992.62047
[15] 卡布拉尔,C.R.B。;博法林,H。;Pereira,J.R.G.,使用斜交-正态混合的贝叶斯密度估计,计算统计与数据分析,52,5075-5090(2008)·Zbl 1452.62263号
[16] Dempster,A.P。;新墨西哥州莱尔德。;Rubin,D.B.,《通过EM算法从不完整数据中获取最大似然》,《皇家统计学会杂志》,B辑,39,1-38(1977)·Zbl 0364.62022号
[17] Dias,J.G。;Wedel,M.,《EM、SEM和MCMC性能对问题高斯混合可能性的实证比较》,《统计与计算》,14,323-332(2004)
[18] 埃夫隆,B。;Tibshirani,R.,标准误差、置信区间和其他统计准确性度量的Bootstrap方法,《统计科学》,154-75(1986)·Zbl 0587.62082号
[19] Frank,A.,Asuncion,A.,2010年。UCI机器学习库。http://archive.ics.uci.edu/mlFrank,A.,Asuncion,A.,2010年。UCI机器学习库。http://archive.ics.uci.edu/ml
[20] Frühwirth-Schnatter,S.,有限混合和马尔可夫切换模型(2006),Springer Verlag·Zbl 1108.6202号
[21] Frühwirth-Schnatter,S。;Pyne,S.,单变量和多变量偏正态分布和斜(t)分布有限混合的贝叶斯推断,生物统计学,11,317-336(2010)·兹比尔1437.62465
[22] 格雷塞林,F。;Ingrassia,S.,多元(t)分布混合的约束单调EM算法,统计与计算,20,9-22(2010)
[23] Hathaway,R.J.,正态混合模型最大似然估计的约束公式,《统计年鉴》,13795-800(1985)·Zbl 0576.62039号
[24] 霍尔兹曼,H。;Munk,A。;Gneiting,T.,椭圆分布有限混合的可识别性,《斯堪的纳维亚统计杂志》,33,753-763(2006)·Zbl 1164.62354号
[25] Ingrassia,S.,《多元正态混合模型的基于似然的约束算法》,《统计方法与应用》,第13期,第151-166页(2004年)·兹比尔1205.62066
[26] 英格拉西亚,S。;Rocci,R.,多元高斯有限混合的约束单调EM算法,计算统计与数据分析,51,5339-5351(2007)·Zbl 1445.62116号
[27] Karlis,D。;Santourian,A.,基于模型的非椭圆等高线分布聚类,统计与计算,1973-83(2009)
[28] 拉霍斯,V.H。;Ghosh,P。;Arellano-Valle,R.B.,基于似然的偏正态独立线性混合模型推断,统计研究,20,303-322(2010)·Zbl 1186.62071号
[29] 拉科斯,V.H。;拉布拉,F.V。;Bolfarine,H。;Ghosh,P.,基于偏态正态分布比例混合的多元测量误差模型,统计学,44541-556(2010)·Zbl 1291.62120号
[30] 兰格,K。;Sinsheim,J.,正态/独立分布及其在稳健回归中的应用,计算与图形统计杂志,2175-198(1993)
[31] Lin,T.I.,多元正态混合模型的最大似然估计,多元分析杂志,100257-265(2009)·Zbl 1152.62034号
[32] Lin,T.I.,《使用多元斜(T)分布的稳健混合建模》,《统计与计算》,第20期,第343-356页(2010年)
[33] Lin,T.I。;Lee,J.C。;Ni,H.F.,使用多元分布进行混合建模的贝叶斯分析,统计与计算,14,119-130(2004)
[34] Lin,T.I。;Lee,J.C。;Xieh,W.J.,使用斜(t)分布的稳健混合建模,统计与计算,17,81-92(2007)
[35] Lin,T.I。;Lee,J.C。;Yen,S.Y.,使用偏斜正态分布的有限混合建模,中国统计,17909-927(2007)·Zbl 1133.62012年
[36] 刘,C。;Rubin,D.B.,《ECME算法:EM和ECM的简单扩展,具有更快的单调收敛性》,Biometrika,81,633-648(1994)·Zbl 0812.62028号
[37] 麦克拉克伦,G。;比恩,R。;Jones,L.B.-T.,将混合因子分析模型扩展为包含多元分布,计算统计与数据分析,51,5327-5338(2007)·Zbl 1445.62053号
[38] McLachlan,G.J。;Krishnan,T.,《EM算法和扩展》(2008),John Wiley·Zbl 1165.62019号
[39] McLachlan,G.J。;Peel,G.J.,有限混合模型(2000),John Wiley and Sons
[40] Nityasuddhi,D。;Böhning,D.,具有特定成分方差的正态混合模型EM算法估计的渐近性质,计算统计与数据分析,41591-601(2003)·Zbl 1429.62090号
[41] 皮,D。;McLachlan,G.J.,使用(t)分布的稳健混合建模,统计与计算,10339-348(2000)
[42] Prates,M.,Lachos,V.H.,Cabral,C.R.B.,2011年。mixsmsn:拟合非正态分布的尺度混合的有限混合。R包版本0.2-9。;Prates,M.,Lachos,V.H.,Cabral,C.R.B.,2011年。mixsmsn:拟合非正态分布的尺度混合的有限混合。R包版本0.2-9。
[43] 派恩,S。;胡,X。;王凯。;Rossin,E。;Lin,T。;Maier,L.M.,自动化高维流式细胞术数据分析,美国国家科学院院刊,106,8519-8524(2009)
[44] R开发核心团队。2011.R:用于统计计算的语言和环境。R统计计算基金会,维也纳(奥地利)。ISBN 3-900051-07-0。;R开发核心团队。2011.R:用于统计计算的语言和环境。R统计计算基金会,维也纳(奥地利)。国际标准图书编号(ISBN)3-900051-07-0。
[45] Sahu,S.K。;戴·D·K。;Branco,M.D.,一类新的多元偏态分布及其在贝叶斯回归模型中的应用,加拿大统计杂志,31129-150(2003)·Zbl 1039.62047号
[46] Schwarz,G.,估算模型的维度,《统计年鉴》,第6461-464页(1978年)·Zbl 0379.62005年
[47] Sfikas,G.、Nikou,C.、Galatsanos,N.,2007年。基于混合学生(t)的鲁棒图像分割;Sfikas,G.,Nikou,C.,Galatsanos,N.,2007年。基于学生(t)混合的鲁棒图像分割
[48] Shoham,S.,《通过多元(t)分布混合物的确定性聚集EM进行稳健聚类》,模式识别,351127-1142(2002)·Zbl 1005.68051号
[49] Shoham,S。;研究员,M.R。;Norman,R.A.,使用多元(t)分布混合物的稳健自动峰值排序,《神经科学方法杂志》,127111-122(2003)
[50] Titterington,D.M。;A.F.M.史密斯。;Makov,U.E.,《有限混合分布的统计分析》(1985),John Wiley and Sons·Zbl 0646.62013.中
[51] Wang,J。;Genton,M.G.,多元斜斜线分布,《统计规划与推断杂志》,136209-220(2006)·兹比尔1081.60013
[52] 王海霞。;张庆斌。;罗,B。;Wei,S.,使用缺失信息的多元(t)分布进行稳健混合建模,《模式识别快报》,25,701-710(2004)
[53] 雅科维茨,S.J。;Spragins,J.D.,《有限混合物的可识别性》,《数理统计年鉴》,39,209-214(1968)·Zbl 0155.25703号
[54] Yu,C。;张,Q。;郭,L.,基于多元(t)分布有限混合的稳健聚类算法,计算机科学讲义,4221606-609(2006)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。