卡米拉·博雷利·泽勒;卡布拉尔,塞尔索·罗穆洛·巴博萨;维克托·雨果·拉科斯;路易斯·贝尼特斯 基于正态分布比例混合的删失数据回归模型的有限混合。 (英语) 兹比尔1474.62259 高级数据分析。分类。,ADAC公司 13,第1号,89-116(2019). 摘要:在统计分析中,特别是在计量经济学中,基于正态假设的回归模型的有限混合通常用于分析删失数据。在这项工作中,通过考虑正态分布的尺度混合(SMN),提出了该模型的一种扩展。这种方法允许我们以极大的灵活性建模数据,同时适应多模态和重尾。在SMN类下考虑删失数据回归模型的有限混合的主要优点是,这类模型具有良好的层次表示,允许轻松实现推断。我们开发了一个简单的EM型算法来对所提模型中的参数进行最大似然推断。为了检验所提出的方法的性能,我们进行了一些模拟研究并分析了一个真实的数据集。提出的算法和方法在新的R包中实现CensMixReg公司. 引用于9文件 MSC公司: 62H30型 分类和区分;聚类分析(统计方面) 62J05型 线性回归;混合模型 62N01号 截尾数据模型 关键词:审查;EM型算法;回归模型的有限混合;正态分布的比例混合 软件:群集R;lmec公司;三件套;Matlab公司;CensMixReg公司;柔性混音;R(右) PDF格式BibTeX公司 XML格式引用 \textit{C.B.Zeller}等人,《高级数据分析》。分类。,ADAC 13,编号1,89--116(2019;Zbl 1474.62259) 全文: 内政部 参考文献: [1] Andrews DF,Mallows CL(1974),正态分布的比例混合。J R Stat Soc系列B 36:99-102·Zbl 0282.62017号 [2] Arellano-Valle RB、Castro L、González-Farías G、Muños Gajardo K(2012)《学生t删失回归模型:属性和推断》。统计方法应用21:453-473·Zbl 1332.62381号 ·doi:10.1007/s10260-012-0199-y [3] Ateya SF(2014)基于删失数据的广义指数分布有限混合下的最大似然估计。统计Pap 55:311-325·Zbl 1297.62040号 ·doi:10.1007/s00362-012-0480-z [4] Basso RM、Lachos VH、Cabral CRB、Ghosh P(2010)基于偏态正态分布比例混合的稳健混合建模。计算机统计数据分析54:2926-2941·Zbl 1284.62193号 ·doi:10.1016/j.csda.2009.09.031 [5] Benites L,Lachos VH,Moreno EJL(2017)CensMixReg:删失线性混合回归模型。https://CRAN.R-project.org/package=CensMixReg,R包版本3.0 [6] Cabral CRB,Lachos VH,Prates MO(2012)使用偏正态独立分布的多元混合建模。计算机统计数据分析56:126-142·Zbl 1239.62058号 ·doi:10.1016/j.csda.2011.06.026 [7] Caudill SB(2012)基于混合正态分布的删失回归模型的部分自适应估计。统计方法应用21:121-137·doi:10.1007/s10260-011-0182-z [8] Cuesta-Albertos JA,Gordaliza A,Matrán C(1997)Trimmed-k-means:一种增强量化器的尝试。年鉴统计25:553-576·Zbl 0878.62045号 ·doi:10.1214操作系统/1031833664 [9] Depraeter N,Vandebroek M(2014)线性回归有限混合中的顺序选择:文献综述和模拟研究。统计帕普55:871-911·Zbl 1334.62138号 ·文件编号:10.1007/s00362-013-0534-x [10] Dempster AP,Laird NM,Rubin DB(1977)通过EM算法从不完整数据中获得最大似然。J R Stat Soc系列B 39:1-38·Zbl 0364.62022号 [11] Fagundes RA、de Souza RM、Cysneiros FJA(2013)稳健回归与符号区间数据应用。工程应用工件集成26:564-573·doi:10.1016/j.engappai.2012.05.004 [12] Faria S,Soromenho G(2010)线性回归拟合混合物。J统计计算模拟80(2):201-225·Zbl 1184.62118号 ·doi:10.1080/00949650802590261 [13] Frühwirth-Schnatter S(2006)有限混合和马尔可夫切换模型。纽约州施普林格·Zbl 1108.6202号 [14] Galimberti G,Soffriti G(2014)使用有限混合t分布的多元线性回归分析。计算统计数据分析71:138-150·Zbl 1471.62070号 ·doi:10.1016/j.csda.2013.01.017 [15] Garay AM、Lachos VH、Bolfarine H、Cabral CRB(2015)具有正态分布比例混合的线性删失回归模型。统计帕普58:247-278·Zbl 1394.62131号 ·doi:10.1007/s00362-015-0696-9 [16] Garay AM、Lachos VH、Lin TI(2016)具有重尾分布的非线性删失回归模型。统计界面9:281-293·Zbl 1405.62094号 ·doi:10.4310/SII.2016.v9.n3.a3 [17] Greene WH(2012)《计量经济学分析》,第7版。哈洛·皮尔逊 [18] Grün B,Leisch F(2008)广义线性回归模型的有限混合。发表于:线性模型和相关领域的最新进展:为纪念helge toutenburg而写的论文。Physica-Verlag HD,Heidelberg,第205-230页·Zbl 1276.62021号 [19] He J(2013)基于混合模型的多重删失环境数据多元统计分析。高级水资源研究59:15-24·doi:10.1016/j.advwatres.2013.05.001 [20] Hennig C(2000)聚类线性回归模型的一致性。J类17:273-296·Zbl 1017.62058号 ·doi:10.1007/s003570000022 [21] Hennig C(2012)Trimcluster:带修剪的聚类分析。https://CRAN.R-project.org/package=trimcluster,r包版本0.1-2 [22] Karlsson M,Laitila T(2014)删失回归模型的有限混合建模。统计帕普55:627-642·Zbl 1416.62215号 ·文件编号:10.1007/s00362-013-0509-y [23] Kaufman L,Rousseeuw P(1990)《在数据中发现群体》。纽约威利·Zbl 1345.62009号 ·doi:10.1002/9780470316801 [24] Lachos VH,Moreno EJL,Chen K,Cabral CRB(2017)使用多元student-t分布的截尾数据的有限混合建模。多变量分析杂志159:151-167·Zbl 1397.62221号 ·doi:10.1016/j.jmva.2017.05.005 [25] Lange KL,Sinsheimer JS(1993)正态/独立分布及其在稳健回归中的应用。J计算图表统计2:175-198 [26] Lin TI,Ho HJ,Lee CR(2014)使用多元偏态t正态分布的灵活混合物建模。统计计算24:531-546·Zbl 1325.62113号 ·数字对象标识代码:10.1007/s11222-013-9386-4 [27] Liu C,Rubin DB(1994)ECME算法:EM和ECM的简单扩展,具有更快的单调收敛性。生物特征81:633-648·Zbl 0812.62028号 ·doi:10.1093/biomet/81.4.633 [28] Louis T(1982)使用em算法时发现观测信息矩阵。J R Stat Soc Ser B期刊44:226-233·Zbl 0488.62018号 [29] Massuia MB、Cabral CRB、Matos LA、Lachos VH(2015)《学生t-删失线性回归模型的影响诊断》。统计学49:1074-1094·Zbl 1382.62050 ·doi:10.1080/02331888.2014.958489 [30] MATLAB(2016)9.0版(R2016a)。马萨诸塞州纳蒂克市MathWorks公司 [31] Mazza A,Punzo A(2017)多元污染正态回归模型的混合。统计帕普。https://doi.org/10.1007/s00362-017-0964-y ·Zbl 1435.62238号 ·doi:10.1007/s00362-017-0964-y [32] McLachlan GJ,Krishnan T(2008)EM算法及其扩展。John Wiley&Sons,新泽西州·Zbl 1165.62019号 ·doi:10.1002/9780470191613 [33] McLachlan GJ,Peel D(2000)有限混合模型。纽约威利·Zbl 0963.62061号 ·doi:10.1002/0471721182 [34] Melenberg B,Soest AV(1996),假期支出的参数和半参数建模。应用经济学杂志11:59-76·doi:10.1002/(SICI)1099-1255(199601)11:1<59::AID-JAE371>3.0.CO;2-A型 [35] Miyata Y(2011)具有删失数据的有限混合模型中的最大似然估计。J统计计划推断141:56-64·Zbl 1197.62026号 ·doi:10.1016/j.jspi.2010.05.006 [36] Mouselimis L(2017)ClusterR:高斯混合模型、K-Means、mini-batch-Kmeans和K-Medoids聚类。https://CRAN.R-project.org/package=ClusterR,R包版本1.0.5 [37] Mroz TA(1987)已婚女性工作时间经验模型对经济和统计假设的敏感性。计量经济学55:765-799·doi:10.2307/1911029 [38] Powell JL(1984)删失回归模型的最小绝对偏差估计。《经济学杂志》25:303-325·Zbl 0571.62100号 ·doi:10.1016/0304-4076(84)90004-6 [39] Powell JF(1986)Tobit模型的对称修剪最小二乘估计。计量经济学54:1435-1460·Zbl 0625.62048号 ·doi:10.2307/1914308 [40] R核心团队(2017)R:统计计算的语言和环境。R统计计算基金会,奥地利维也纳。https://www.R-project.org/ [41] Raftery AE(1995)社会研究中的贝叶斯模型选择。社会方法25:111-163·doi:10.2307/271063 [42] Tzortzis G,Likas A(2014)MinMax k-Means聚类算法。图案识别47:2505-2516·doi:10.1016/j.patcog.2014.01.015 [43] Vaida F,Liu L(2009)具有截尾响应的正态混合效应模型的快速实现。计算机图形统计杂志18:797-817·文件编号:10.1198/jcgs.2009.07130 [44] Vuong QH(1989)模型选择和非嵌套假设的似然比检验。《经济杂志》《经济社会》57:307-333·Zbl 0701.62106号 [45] Witte A(1980)用个人数据估算犯罪的经济模型。Q经济杂志94:57-84·数字对象标识代码:10.2307/1884604 [46] Zhang B(2003)回归聚类。摘自:第三届IEEE数据挖掘国际会议论文集,墨尔本 [47] Zeller CB、Cabral CRB、Lachos VH(2016)基于偏态分布的比例混合的稳健混合回归建模。试验25:375-396·Zbl 1342.62113号 ·文件编号:10.1007/s11749-015-0460-4 此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。