×

基于正态分布比例混合的删失数据回归模型的有限混合。 (英语) 兹比尔1474.62259

摘要:在统计分析中,特别是在计量经济学中,基于正态假设的回归模型的有限混合通常用于分析删失数据。在这项工作中,通过考虑正态分布的尺度混合(SMN),提出了该模型的一种扩展。这种方法允许我们以极大的灵活性建模数据,同时适应多模态和重尾。在SMN类下考虑删失数据回归模型的有限混合的主要优点是,这类模型具有良好的层次表示,允许轻松实现推断。我们开发了一个简单的EM型算法来对所提模型中的参数进行最大似然推断。为了检验所提出的方法的性能,我们进行了一些模拟研究并分析了一个真实的数据集。提出的算法和方法在新的R包中实现CensMixReg公司.

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62J05型 线性回归;混合模型
62N01号 截尾数据模型
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Andrews DF,Mallows CL(1974),正态分布的比例混合。J R Stat Soc系列B 36:99-102·Zbl 0282.62017号
[2] Arellano-Valle RB、Castro L、González-Farías G、Muños Gajardo K(2012)《学生t删失回归模型:属性和推断》。统计方法应用21:453-473·Zbl 1332.62381号 ·doi:10.1007/s10260-012-0199-y
[3] Ateya SF(2014)基于删失数据的广义指数分布有限混合下的最大似然估计。统计Pap 55:311-325·Zbl 1297.62040号 ·doi:10.1007/s00362-012-0480-z
[4] Basso RM、Lachos VH、Cabral CRB、Ghosh P(2010)基于偏态正态分布比例混合的稳健混合建模。计算机统计数据分析54:2926-2941·Zbl 1284.62193号 ·doi:10.1016/j.csda.2009.09.031
[5] Benites L,Lachos VH,Moreno EJL(2017)CensMixReg:删失线性混合回归模型。https://CRAN.R-project.org/package=CensMixReg,R包版本3.0
[6] Cabral CRB,Lachos VH,Prates MO(2012)使用偏正态独立分布的多元混合建模。计算机统计数据分析56:126-142·Zbl 1239.62058号 ·doi:10.1016/j.csda.2011.06.026
[7] Caudill SB(2012)基于混合正态分布的删失回归模型的部分自适应估计。统计方法应用21:121-137·doi:10.1007/s10260-011-0182-z
[8] Cuesta-Albertos JA,Gordaliza A,Matrán C(1997)Trimmed-k-means:一种增强量化器的尝试。年鉴统计25:553-576·Zbl 0878.62045号 ·doi:10.1214操作系统/1031833664
[9] Depraeter N,Vandebroek M(2014)线性回归有限混合中的顺序选择:文献综述和模拟研究。统计帕普55:871-911·Zbl 1334.62138号 ·文件编号:10.1007/s00362-013-0534-x
[10] Dempster AP,Laird NM,Rubin DB(1977)通过EM算法从不完整数据中获得最大似然。J R Stat Soc系列B 39:1-38·Zbl 0364.62022号
[11] Fagundes RA、de Souza RM、Cysneiros FJA(2013)稳健回归与符号区间数据应用。工程应用工件集成26:564-573·doi:10.1016/j.engappai.2012.05.004
[12] Faria S,Soromenho G(2010)线性回归拟合混合物。J统计计算模拟80(2):201-225·Zbl 1184.62118号 ·doi:10.1080/00949650802590261
[13] Frühwirth-Schnatter S(2006)有限混合和马尔可夫切换模型。纽约州施普林格·Zbl 1108.6202号
[14] Galimberti G,Soffriti G(2014)使用有限混合t分布的多元线性回归分析。计算统计数据分析71:138-150·Zbl 1471.62070号 ·doi:10.1016/j.csda.2013.01.017
[15] Garay AM、Lachos VH、Bolfarine H、Cabral CRB(2015)具有正态分布比例混合的线性删失回归模型。统计帕普58:247-278·Zbl 1394.62131号 ·doi:10.1007/s00362-015-0696-9
[16] Garay AM、Lachos VH、Lin TI(2016)具有重尾分布的非线性删失回归模型。统计界面9:281-293·Zbl 1405.62094号 ·doi:10.4310/SII.2016.v9.n3.a3
[17] Greene WH(2012)《计量经济学分析》,第7版。哈洛·皮尔逊
[18] Grün B,Leisch F(2008)广义线性回归模型的有限混合。发表于:线性模型和相关领域的最新进展:为纪念helge toutenburg而写的论文。Physica-Verlag HD,Heidelberg,第205-230页·Zbl 1276.62021号
[19] He J(2013)基于混合模型的多重删失环境数据多元统计分析。高级水资源研究59:15-24·doi:10.1016/j.advwatres.2013.05.001
[20] Hennig C(2000)聚类线性回归模型的一致性。J类17:273-296·Zbl 1017.62058号 ·doi:10.1007/s003570000022
[21] Hennig C(2012)Trimcluster:带修剪的聚类分析。https://CRAN.R-project.org/package=trimcluster,r包版本0.1-2
[22] Karlsson M,Laitila T(2014)删失回归模型的有限混合建模。统计帕普55:627-642·Zbl 1416.62215号 ·文件编号:10.1007/s00362-013-0509-y
[23] Kaufman L,Rousseeuw P(1990)《在数据中发现群体》。纽约威利·Zbl 1345.62009号 ·doi:10.1002/9780470316801
[24] Lachos VH,Moreno EJL,Chen K,Cabral CRB(2017)使用多元student-t分布的截尾数据的有限混合建模。多变量分析杂志159:151-167·Zbl 1397.62221号 ·doi:10.1016/j.jmva.2017.05.005
[25] Lange KL,Sinsheimer JS(1993)正态/独立分布及其在稳健回归中的应用。J计算图表统计2:175-198
[26] Lin TI,Ho HJ,Lee CR(2014)使用多元偏态t正态分布的灵活混合物建模。统计计算24:531-546·Zbl 1325.62113号 ·数字对象标识代码:10.1007/s11222-013-9386-4
[27] Liu C,Rubin DB(1994)ECME算法:EM和ECM的简单扩展,具有更快的单调收敛性。生物特征81:633-648·Zbl 0812.62028号 ·doi:10.1093/biomet/81.4.633
[28] Louis T(1982)使用em算法时发现观测信息矩阵。J R Stat Soc Ser B期刊44:226-233·Zbl 0488.62018号
[29] Massuia MB、Cabral CRB、Matos LA、Lachos VH(2015)《学生t-删失线性回归模型的影响诊断》。统计学49:1074-1094·Zbl 1382.62050 ·doi:10.1080/02331888.2014.958489
[30] MATLAB(2016)9.0版(R2016a)。马萨诸塞州纳蒂克市MathWorks公司
[31] Mazza A,Punzo A(2017)多元污染正态回归模型的混合。统计帕普。https://doi.org/10.1007/s00362-017-0964-y ·Zbl 1435.62238号 ·doi:10.1007/s00362-017-0964-y
[32] McLachlan GJ,Krishnan T(2008)EM算法及其扩展。John Wiley&Sons,新泽西州·Zbl 1165.62019号 ·doi:10.1002/9780470191613
[33] McLachlan GJ,Peel D(2000)有限混合模型。纽约威利·Zbl 0963.62061号 ·doi:10.1002/0471721182
[34] Melenberg B,Soest AV(1996),假期支出的参数和半参数建模。应用经济学杂志11:59-76·doi:10.1002/(SICI)1099-1255(199601)11:1<59::AID-JAE371>3.0.CO;2-A型
[35] Miyata Y(2011)具有删失数据的有限混合模型中的最大似然估计。J统计计划推断141:56-64·Zbl 1197.62026号 ·doi:10.1016/j.jspi.2010.05.006
[36] Mouselimis L(2017)ClusterR:高斯混合模型、K-Means、mini-batch-Kmeans和K-Medoids聚类。https://CRAN.R-project.org/package=ClusterR,R包版本1.0.5
[37] Mroz TA(1987)已婚女性工作时间经验模型对经济和统计假设的敏感性。计量经济学55:765-799·doi:10.2307/1911029
[38] Powell JL(1984)删失回归模型的最小绝对偏差估计。《经济学杂志》25:303-325·Zbl 0571.62100号 ·doi:10.1016/0304-4076(84)90004-6
[39] Powell JF(1986)Tobit模型的对称修剪最小二乘估计。计量经济学54:1435-1460·Zbl 0625.62048号 ·doi:10.2307/1914308
[40] R核心团队(2017)R:统计计算的语言和环境。R统计计算基金会,奥地利维也纳。https://www.R-project.org/
[41] Raftery AE(1995)社会研究中的贝叶斯模型选择。社会方法25:111-163·doi:10.2307/271063
[42] Tzortzis G,Likas A(2014)MinMax k-Means聚类算法。图案识别47:2505-2516·doi:10.1016/j.patcog.2014.01.015
[43] Vaida F,Liu L(2009)具有截尾响应的正态混合效应模型的快速实现。计算机图形统计杂志18:797-817·文件编号:10.1198/jcgs.2009.07130
[44] Vuong QH(1989)模型选择和非嵌套假设的似然比检验。《经济杂志》《经济社会》57:307-333·Zbl 0701.62106号
[45] Witte A(1980)用个人数据估算犯罪的经济模型。Q经济杂志94:57-84·数字对象标识代码:10.2307/1884604
[46] Zhang B(2003)回归聚类。摘自:第三届IEEE数据挖掘国际会议论文集,墨尔本
[47] Zeller CB、Cabral CRB、Lachos VH(2016)基于偏态分布的比例混合的稳健混合回归建模。试验25:375-396·Zbl 1342.62113号 ·文件编号:10.1007/s11749-015-0460-4
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。