×

对称稳定混合模型的EM算法。 (英语) Zbl 1391.60038号

摘要:混合模型经常用于建模复杂数据。提出了EM算法的一个扩展,这里称为ECME,用于计算对称α稳定混合模型(SαSMM)参数的最大似然估计。进行了全面的仿真研究,以证明所提出的ECME算法的性能。当S(α)SMM用于对指数幂和(t)分布混合生成的数据建模时,通过仿真研究了其稳健性。将提出的ECME和贝叶斯方法应用于三组实际数据,结果表明,对于所有三组数据,该ECME算法都优于贝叶斯范式。此外,还将S(alpha)SMM与正态、斜态正态、(t)和斜态(t)分布的混合进行了比较,以对四组实际数据进行建模。结果表明,S\(\alpha\)SMM与上述模型一样好或更好。这可以被视为稳健混合建模中的S(alpha)SMM能力。

MSC公司:

60E07型 无限可分分布;稳定分布
91C20个 社会和行为科学中的集群
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Akaike,H.(1974年)。统计模型识别的新视角。IEEE自动控制汇刊19(6):716-723·兹伯利0314.62039
[2] Andrews,J.L.,McNicholas,P.D.(2012年)。通过多元t分布的混合物进行基于模型的聚类、分类和判别分析。统计与计算22:1021-1029·Zbl 1252.62062号
[3] Azzalini,A.(2016)。sn:The Skew-Normaland Skew-t Distributions,R Package版本1.4-0 R-project.org。网址:https://CRAN.R-project.org/package=sn。
[4] Basso,R.M.、Lachos,V.H.、Cabral,C.R.B.、Ghosh,P.(2010)。基于偏态正态分布比例混合的稳健混合建模。计算统计与数据分析54:2926-2941·Zbl 1284.62193号
[5] Bernadara,P.、Schertzer,D.、Sauquet,E.、Tchiguirinskaia,I.、Lang,M.(2008)。洪水概率分布尾部:它有多重?随机环境研究和风险评估22:107-122·Zbl 1169.62395号
[6] Broniatowski,M.,Celeux,G.,Diebolt,J.(1983年)。密度Mélanges的侦察采用概率评估算法。数据分析与信息学3:359-374。
[7] Browne,R.P.,McNicholas,P.D.(2015)。广义双曲分布的混合。加拿大统计杂志43(2):176-198·Zbl 1320.62144号
[8] Carreau,J.、Naveau,P.、Sauquet,E.(2009年)。具有重尾成分的统计降雨径流混合模型。水资源研究45(10),W10437。doi:10.1029/2009WR0078802009年
[9] Casarin,R.(2004)。稳定分布混合的贝叶斯推断。第0428号工作文件。塞雷梅德,巴黎第九大学。
[10] Casarin,R.(2005)。金融中非线性和非高斯模型的模拟方法。Premio SIE,Rivista Italiana degli Economisti 2:341-345。
[11] Celeux,G.,Diebolt,J.(1985)。SEM算法:一种从混合问题的EM算法衍生而来的概率教师算法。计算统计季刊2(1):73-82。
[12] Chambers,J.M.,Mallows,C.L.,Stuck,B.W.(1976年)。一种模拟稳定随机变量的方法。美国统计协会杂志71(354):340-344·Zbl 0341.65003号
[13] 克利夫兰·W·S(1981)。LOWESS:通过稳健的局部加权回归平滑散点图的程序。美国统计协会杂志35(1):54-54。
[14] Dempster,A.P.,Laird,N.M.,Rubin,D.B.(1977年)。通过EM算法从不完整数据中获得最大似然。英国皇家统计学会杂志,B辑39:1-38·Zbl 0364.62022号
[15] Devroye,L.(2009)。指数和多项式倾斜稳定分布的随机变量生成。ACM建模与计算机仿真汇刊19(4):18:1-18:20·Zbl 1390.65008号
[16] Diebolt,J.、Celeux,G.(1993年)。估计混合比例的随机EM算法的渐近性质。统计学通讯B:随机模型9:599-613·Zbl 0783.62021号
[17] 福布斯·F、幽灵·D(2014)。具有可变尾权重边际量的多元重尾分布的新族:稳健聚类的应用。统计与计算24:971-984·兹比尔1332.62204
[18] Holzmann,H.,Munk,A.,Gneiting,T.(2006年)。椭圆分布有限混合的可识别性。斯堪的纳维亚统计杂志33:753-763·Zbl 1164.62354号
[19] Hubert,L.J.,Arabie,P.(1985)。比较分区。分类杂志2:193-218·Zbl 0587.62128号
[20] Lee,S.和McLachlan,G.J.(2013年)。关于斜正态分布和斜t分布的混合。数据分析和分类进展7:241-266·Zbl 1273.62115号
[21] Lee,S.、McLachlan,G.J.(2014)。多元斜t分布的有限混合:一些最新结果。统计与计算24:181-202·Zbl 1325.62107号
[22] Lin,T.I.,Lee,J.C.,Yen,S.Y.(2007)。使用偏斜正态分布的有限混合建模。《中国统计》17:909-927·Zbl 1133.62012年
[23] Liu,C.,Rubin,D.B.(1994年)。ECME算法:EM和ECM的简单扩展,具有更快的单调收敛性。生物特征81:633-648·Zbl 0812.62028号
[24] Liu,C.,Rubin,D.B.(1995)。使用EM及其扩展、ECM和ECME对t分布进行ML估计。《中国统计》5:19-39·Zbl 0824.62047号
[25] Maechler,M.、Rousseeuw,P.、Struyf,A.、Hubert,M.和Hornik,K.(2015)。cluster:cluster Analysis Basics and Extensions,R软件包版本2.0.3,可从以下网站获得:http://cran.r-project.org/package=cluster
[26] Mandelbrot,B.B.,Hudson,R.L.(2007)。市场的不当行为:金融动荡的分形观点。注释版,纽约:基础图书。
[27] McLachlan,G.J.,Krishnan,T.(2008)。EM算法和扩展。第二版,纽约:John Wiley·Zbl 1165.62019号
[28] Meng,X.L.,Rubin,D.B.(1993)。通过ECM算法的最大似然估计:一般框架。生物特征80:267-278·Zbl 0778.62022号
[29] Nielsen,S.F.(2000年)。随机EM算法:估计和渐近结果。伯努利6(3):457-489·Zbl 0981.62022号
[30] Neykov,N.、Neytchev,P.、Zucchini,W.(2014)。带有重尾分量的随机日降雨量模型。自然灾害与地球系统科学讨论2(2):1223-1258。
[31] Nikias,C.L.,Shao,M.(1995)。α-稳定分布信号处理及其应用。纽约:约翰·威利。
[32] Peel,D.、McLachlan,G.J.(2000年)。使用t分布的稳健混合建模。统计与计算10:339-348。
[33] Polson,N.G.、Scott,J.G.和Windle,J.(2014)。贝叶斯桥。英国皇家统计学会杂志,B辑76(4):713-733·Zbl 07555460号
[34] Prates,M.,Lachos,V.,Cabral,C.(2016)。mixsmsn:Fitting Finite Mixture of Scale Mixture of Skew Normal Distributions,R软件包版本1.1-2,可在以下网址获得:http://cran.r-project.org/package=mixsmsn
[35] Rachev,S.、Menn,C.、Fabrizzi,F.(2005)。固定资产和倾斜资产收益分配。新泽西州霍博肯:约翰·威利。
[36] Salas-Gonzalez,D.,Kuruoglu,E.E.,Ruiz,D.P.(2009年)。α-稳定分布的有限混合。数字信号处理19:250-264。
[37] Salas-Gonzalez,D.,Kuruoglu,E.E.,Ruiz,D.P.(2010年)。使用吉布斯抽样对对称稳定分布的混合进行建模。信号处理90:774-783·Zbl 1177.94117号
[38] Samorodnitsky,G.,Taqqu,M.S.(1994年)。稳定非高斯随机过程:随机模型和无穷方差。伦敦:查普曼和霍尔·Zbl 0925.60027号
[39] Schwarz,G.(1978年)。估算模型的维度。《统计年鉴》6:461-464·Zbl 0379.62005年
[40] Subedi,S.,McNicholas,P.D.(2014)。正态逆高斯分布混合聚类的变分贝叶斯近似。数据分析和分类进展8:167-193·Zbl 1459.62122号
[41] Titterington,D.M.、Smith,A.F.M.、Makov,U.E.(1985)。有限混合分布的统计分析。纽约:约翰·威利·Zbl 0646.62013.中
[42] Uchaikin,V.V.,Zolotarev,V.M.(1999)。机会与稳定性:稳定分布及其应用。乌得勒支:VSP·Zbl 0944.60006号
[43] Venturini,S.、Dominici,F.、Parmigiani,G.(2008)。重尾分布的伽马形状混合物。应用统计学年鉴2(2):756-776·Zbl 1400.62292号
[44] Vrbik,I.,McNicholas,P.D.(2012年)。多元斜t混合模型EM算法的分析计算。统计与概率快报82:1169-1174·Zbl 1244.65012号
[45] Vrbik,I.,McNicholas,P.D.(2014)。基于模型的聚类和分类的简约斜交混合模型。计算统计与数据分析71:196-210·Zbl 1471.62202号
[46] West,M.(1987年)。正态分布的按比例混合。生物特征74(3):646-648·Zbl 0648.62015.中
[47] Zhang,J.,Liang,F.(2010)。使用指数幂混合的稳健聚类。生物统计学66:1078-1086·Zbl 1233.62192号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。