×

使用多元Student-(t)分布对删失数据进行有限混合建模。 (英文) Zbl 1397.62221号

摘要:有限混合模型已被广泛用于对异质人群的数据进行建模和分析。此外,由于实验装置的限制,这类数据可能会受到某些检测上限和/或下限的限制。另一个复杂情况是,当每个群体的测量值明显偏离正常值时,例如,在存在重尾或非典型观察时。对于这种数据结构,我们基于多元Student-(t)分布的有限混合,提出了一个删失数据的稳健模型。这种方法允许我们以极大的灵活性对数据进行建模,适应了多模态、重尾以及取决于混合成分结构的偏度。我们开发了一种分析简单但有效的EM型算法,用于进行参数的最大似然估计。该算法在E步具有闭式表达式,该表达式依赖于多元截断Student-(t)分布的均值和方差公式。此外,还提出了一种基于信息的逼近估计量渐近协方差矩阵的通用方法。报告了对模拟和真实数据集的分析结果,以证明所提出方法的有效性。提出的算法和方法在新的R包CensMixReg中实现。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
10层62层 点估计
62N01号 审查数据模型
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Akaike,H.,统计模型识别的新视角,IEEE Trans。自动化。控制,19716-723(1974)·Zbl 0314.62039号
[2] 阿雷利亚诺·瓦莱,R.B。;Bolfarine,H.,关于\(t\)-分布的一些特征,Statist。普罗巴伯。莱特。,25, 79-85 (1995) ·Zbl 0838.62040号
[3] 阿雷利亚诺·瓦莱,R.B。;卡斯特罗,L。;González-Farías,G。;Muños Gajardo,K.,学生删失回归模型:属性和推断,统计方法应用。,21, 453-473 (2012) ·Zbl 1332.62381号
[4] 阿扎里尼,A。;Genton,M.,基于偏态t和相关分布的稳健似然方法,国际。统计师。修订版,761490-1507(2008)
[5] Bai,X。;Chen,K。;Yao,W.,使用多元(t)分布的线性混合模型的混合,J.Stat.Compute。模拟。,86, 771-787 (2016) ·Zbl 1510.62272号
[6] Bai,Z。;克利须那,P。;赵,L.,关于白噪声信号处理中有效检测准则的收敛速度,IEEE Trans。通知。理论,35,380-388(1989)·Zbl 0677.94001号
[7] Basford,K。;Greenway,D。;麦克拉克伦,G。;Peel,D.,正常混合物拟合分量平均值的标准误差,计算。统计人员。,12, 1-18 (1997) ·Zbl 0924.62055号
[8] 巴索·R·M。;拉科斯,V.H。;卡布拉尔,C.R.B。;Ghosh,P.,基于偏态正态分布比例混合的稳健混合建模,计算。统计师。数据分析。,54, 2926-2941 (2010) ·Zbl 1284.62193号
[9] 卡布拉尔,C.R.B。;拉科斯,V.H。;Prates,M.O.,使用偏态正态独立分布的多元混合建模,计算。统计师。数据分析。,56, 126-142 (2012) ·兹比尔1239.62058
[10] 卡斯特罗,L.M。;哥斯达黎加。;Prates,M.O。;Lachos,V.H.,使用多元Student-(t)分布进行Tobit验证性因子分析的基于似然法的推断,统计计算。,25, 1163-1183 (2015) ·Zbl 1331.62294号
[11] Caudill,S.B.,基于混合正态分布的删失回归模型的部分自适应估计,统计方法应用。,21, 121-137 (2012)
[12] Chib,S.,Tobit删失回归模型中的贝叶斯推断,《计量经济学杂志》,51,79-99(1992)·Zbl 0742.62033号
[13] Dempster,A。;莱尔德,N。;Rubin,D.,《通过EM算法从不完整数据中获得最大似然》,J.R.Stat.Soc.Ser。B统计方法。,39, 1-38 (1977) ·Zbl 0364.62022号
[14] De Oliveira,V.,基于删失数据的高斯随机场的贝叶斯推断和预测,J.Compute。图表。统计人员。,14, 95-115 (2005)
[15] 埃夫隆,B。;Tibshirani,R.J.,标准误差、置信区间和其他统计准确性度量的Bootstrap方法,Statist。科学。,54-75 (1986) ·Zbl 0587.62082号
[16] A.加雷。;卡斯特罗,L。;Leskow,J。;Lachos,V.H.,使用多元(t)分布对不规则观测纵向数据的删失线性回归模型,《统计方法医学研究》,26,542-566(2017)
[17] 加雷,A.M。;拉科斯,V.H。;博法林,H。;Cabral,C.R.,具有正态分布比例混合的线性删失回归模型,统计学。论文,58,247-278(2017)·Zbl 1394.62131号
[19] He,J.,基于混合模型的多重删失环境数据多元统计分析,水资源部。,2013年5月59日至24日
[20] Ho,H.J。;Lin,T.I。;Chen,H.Y。;Wang,W.L.,截断多元分布的一些结果,J.Statist。计划。推理,142,25-40(2012)·Zbl 1229.62068号
[21] 霍夫曼,H。;Johnson,R.,《存在左旋数据的多元正态参数的伪似然估计》,J.Agric。生物与环境。《统计》,第20卷,第156-171页(2015年)·Zbl 1325.62211号
[22] 卡尔森,M。;Laitila,T.,删失回归模型的有限混合建模,统计学。论文,55,627-642(2014)·Zbl 1416.62215号
[23] 拉科斯,V.H。;Ghosh,P。;Arellano-Valle,R.B.,基于似然的偏态-正态独立线性混合模型推断,统计。Sinica,20,303-322(2010)·Zbl 1186.62071号
[24] Lange,K.L。;Little,R.J.A。;Taylor,J.M.G.,《使用(t)分布的稳健统计建模》,J.Amer。统计师。协会,84,881-896(1989)
[25] Lin,T.-I.,通过特征值分解通过参数化混合模型从不完整数据中学习,计算。统计师。数据分析。,71, 183-195 (2014) ·Zbl 1471.62120号
[26] 刘,M。;Lin,T.-I.,偏正态混合回归模型,教育部。精神病。测量。,74, 139-162 (2014)
[27] Lucas,A.,基于学生的M估计量的稳健性,Commun。统计-理论方法,26,1165-1182(1997)·Zbl 0920.62041号
[28] Massuia,M.B。;卡布拉尔,C.R.B。;洛杉矶马托斯。;Lachos,V.H.,《学生(t)删失线性回归模型的影响诊断》,统计学,49,1074-1094(2015)·Zbl 1382.62050
[29] 洛杉矶马托斯。;拉科斯,V.H。;Balakrishnan,N。;Labra,F.V.,《具有删失数据的线性和非线性混合效应模型的影响诊断》,计算。统计师。数据分析。,57, 450-464 (2013) ·Zbl 1365.62374号
[30] 洛杉矶马托斯。;Prates,M.O。;Chen,M.H。;Lachos,V.H.,使用多变量t分布对具有截尾响应的混合效应模型进行基于似然法的推断,统计学家。中国科学院,231323-1342(2013)·Zbl 06202709号
[31] McLachlan,G.J。;Krishnan,T.,《EM算法和扩展》(2008),威利·Zbl 1165.62019号
[32] McLachlan,G.J。;Peel,D.,有限混合模型(2000),Wiley:Wiley纽约·Zbl 0963.62061号
[33] Meza,C。;Osorio,F。;De la Cruz,R.,使用重尾分布的非线性混合效应模型估计,统计计算。,22, 1-19 (2011)
[34] Militino,A.F。;Ugarte,M.D.,《分析受审查的空间数据》,数学。地质。,31, 551-561 (1999)
[35] 皮,D。;McLachlan,G.J.,使用(t)分布的稳健混合建模,统计计算。,10, 339-348 (2000)
[36] Powell,J.L.,截尾回归模型的最小绝对偏差估计,J.Econometrics,25303-325(1984)·Zbl 0571.62100号
[37] Powell,J.L.,Tobit模型的对称修剪最小二乘估计,《计量经济学》,54,1435-1460(1986)·兹比尔062562048
[38] Schwarz,G.,估算模型的维数,Ann.Statist。,6, 461-464 (1978) ·Zbl 0379.62005年
[39] 瓦伊达,F。;Liu,L.,具有截尾响应的正态混合效应模型的快速实现,J.Compute。图表。统计人员。,1797-817年(2009年)
[41] Wang,J。;Genton,M.G.,《多元偏斜率分布》,J.Statist。计划。推断,136209-220(2006)·兹比尔1081.60013
[42] Wang,W.-L。;Lin,T.-I.,《通过带有缺失信息的偏态T分布混合物实现基于稳健模型的聚类》,《高级数据分析》。分类。,9, 423-445 (2015) ·Zbl 1414.62191号
[43] Wang,W.-L。;Lin,T.-I.,多元T混合模型的最大似然推断,《多元分析杂志》。,149, 54-64 (2016) ·Zbl 1341.62138号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。