×

使用(t)分布有限混合的多元线性回归分析。 (英语) Zbl 1471.62070号

摘要:最近,有限混合模型被用于建模多元线性回归分析中误差项的分布。特别是,采用了高斯混合模型。引入了一种新的方法,假设误差项遵循(t)分布的有限混合。该假设允许多元线性回归模型的扩展,使这些模型更通用,对误差项分布中存在的异常值更具鲁棒性。讨论了模型可辨识性和最大似然估计问题。特别地,提供了可识别性条件,并开发了用于估计模型参数的期望最大化算法。通过蒙特卡罗实验评估了回归系数估计量的性质,并与高斯混合模型的估计量进行了比较。给出了两个实际数据集的分析结果。

MSC公司:

62-08 统计学相关问题的计算方法
62H30型 分类和区分;聚类分析(统计方面)
62J05型 线性回归;混合模型
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 安德鲁斯,J.L。;McNicholas,P.D.,《多元因子分析仪的扩展混合》,统计与计算,21,361-373,(2011)·Zbl 1255.62175号
[2] Azzalini,A.,2011年。R包sn:偏态正态分布和偏态(t)分布,版本0.4-17。网址:http://azzalini.stat.unipd.it/SN。
[3] Banfield,J.D。;Raftery,A.E.,基于模型的高斯和非高斯聚类,生物计量学,49803-821,(1993)·Zbl 0794.62034号
[4] 巴托洛奇,F。;Scaccia,L.,《使用混合物处理非正态回归误差》,计算统计与数据分析,48,821-834,(2005)·Zbl 1429.62284号
[5] Berlinet,A.F。;Roland,Ch.,EM算法的加速:\(P\)-EM与ε算法,计算统计学和数据分析,5644122-4137,(2012)·Zbl 1254.65018号
[6] 比尔纳基,C。;Celeux,G。;Govaert,G.,《利用综合分类可能性评估聚类的混合模型》,IEEE模式分析和机器智能汇刊,22719-725,(2000)
[7] 比尔纳基,C。;Celeux,G。;Govaert,G.,为EM算法选择初始值以获得多元高斯混合模型中的最大似然,计算统计与数据分析,41,561-575,(2003)·Zbl 1429.62235号
[8] 比尔纳基,C。;Celeux,G。;戈沃特,G。;Langrognet,F.,使用MIXMOD软件进行基于模型的聚类和判别分析,计算统计和数据分析,51,587-600,(2006)·Zbl 1157.62431号
[9] Celeux,G。;Govaert,G.,高斯简约聚类模型,模式识别,28781-793,(1995)
[10] 库克·R·D。;Weisberg,S.,回归图形简介,(1994),威利纽约·Zbl 0925.62287号
[11] Dempster,A.P。;新墨西哥州莱尔德。;Rubin,D.B.,《通过EM算法实现不完整数据的最大可能性》,英国皇家统计学会杂志。B系列,39,1-22,(1977)·Zbl 0364.62022号
[12] 埃夫隆,B。;Tibshirani,R.J.,《自助入门》(1993),查普曼和霍尔伦敦·Zbl 0835.62038号
[13] 费尔南德斯,C。;Steel,M.F.J.,《多元学生回归模型:陷阱和推断》,《生物统计学》,86,153-167,(1999)·Zbl 0917.62020号
[14] 弗雷利,C。;Raftery,A.E.,基于模型的聚类、判别分析和密度估计,美国统计协会杂志,97,611-631,(2002)·Zbl 1073.62545号
[15] Fraley,C.,Raftery,A.E.,2006年。MCLUST第3版R:正态混合建模和基于模型的聚类。华盛顿大学统计系第504号技术报告(2009年修订)。
[16] Frank,A.,Asuncion,A.,2010年。UCI机器学习库。加利福尼亚州欧文:加利福尼亚大学信息与计算机科学学院。http://archive.ics.uci.edu/ml。
[17] 格雷塞林,F。;Ingrassia,S.,多元分布混合的约束单调EM算法,统计学和计算,20,9-22,(2010)
[18] Grün,B。;Leisch,F.,Flexmix第2版:具有伴随变量和变参数及常数的有限混合,《统计软件杂志》,28,1-35,(2008)
[19] 霍尔兹曼,H。;Munk,A。;Gneiting,T.,椭圆分布有限混合的可识别性,《斯堪的纳维亚统计杂志》,33,753-763,(2006)·Zbl 1164.62354号
[20] 休伯特,L。;Arabie,P.,比较分区,分类杂志,2193-218,(1985)
[21] Joarder,A.H。;Ali,M.M.,《关于多元(t)分布的特征函数》,《巴基斯坦统计杂志》,12,55-62,(1996)·Zbl 0898.60033号
[22] Karlis,D。;Santourian,A.,基于模型的非椭圆等高线分布聚类,统计与计算,19,73-83,(2009)
[23] 科茨,S。;Nadarajah,S.,多元分布及其应用,(2004),剑桥大学出版社,纽约·Zbl 1100.62059号
[24] Lange,K.L。;Little,R.J.A。;Taylor,J.M.G.,使用(t)分布的稳健统计建模,美国统计协会杂志,84,881-896,(1989)
[25] Lütkepohl,H.,《矩阵手册》,(1996),约翰·威利和索恩斯·奇切斯特·Zbl 0856.15001号
[26] MacQueen,J.,《多元观测分类和分析的一些方法》,(Le Cam,L.M.;Neyman,J.《第五届伯克利数理统计与概率研讨会论文集》,第1卷(1967),加州大学伯克利分校出版社),281-297·Zbl 0214.46201号
[27] McLachlan,G.J。;比恩,R.W。;Ben-Tovim-Jones,L.,将混合因子分析模型扩展为包含多元分布,计算统计与数据分析,51,5327-5338,(2007)·Zbl 1445.62053号
[28] McLachlan,G.J。;Krishnan,T.,《EM算法和扩展》(2008),威利·奇切斯特·Zbl 1165.62019号
[29] McLachlan,G.J。;Peel,D.,有限混合模型,(2000),Wiley Chichester·Zbl 0963.62061号
[30] 医学博士麦克尼古拉斯。;墨菲,T.B。;麦克达德,A.F。;Frost,D.,通过简约高斯混合模型实现基于模型的聚类的串行和并行实现,计算统计学和数据分析,54711-723,(2010)·Zbl 1464.62131号
[31] 梅利尼科夫,V。;Melnykov,I.,用未知分量数的高斯混合模型初始化EM算法,计算统计与数据分析,561381-1395,(2012)·Zbl 1246.65025号
[32] 奥哈根,A。;墨菲,T.B。;Gormley,I.C.,通过期望最大化算法拟合混合模型的计算方面,计算统计与数据分析,56,3843-3864,(2012)·Zbl 1255.62180号
[33] Paolella,M.S.,《中等概率》。《计算方法》(2007年),约翰·威利和桑斯·奇切斯特·兹比尔1149.60002
[34] 皮,D。;McLachlan,G.J.,使用(t)分布的稳健混合建模,统计与计算,10,339-348,(2000)
[35] R开发核心团队,R:统计计算的语言和环境,(R统计计算基金会,(2012),奥地利维也纳),URL:网址:http://www.R-project.org
[36] Schott,J.R.,《统计矩阵分析》(2005),纽约约翰威利父子公司·Zbl 1076.15002号
[37] Schwarz,G.,估算模型的维度,《统计年鉴》,第6期,第461-464页,(1978年)·兹伯利0379.62005
[38] Seo,B。;Kim,D.,正态混合模型中的根选择,计算统计与数据分析,562454-2470,(2012)·Zbl 1252.62013年
[39] Soffriti,G。;Galimberti,G.,《具有非正态误差的多元线性回归:基于混合模型的解决方案》,《统计与计算》,21,523-536,(2011)·Zbl 1221.62106号
[40] Srivastava,M.S.,《多元统计方法》(2002),John Wiley&Sons New York·Zbl 1006.62048号
[41] 苏特拉达尔,公元前。;Ali,M.M.,用多元误差变量估计回归模型的参数,统计学中的通信-理论和方法,15,429-450,(1986)·Zbl 0608.62061号
[42] Teicher,H.,乘积测度混合物的可识别性,《数理统计年鉴》,381300-1302,(1967)·Zbl 0153.47904号
[43] 雅科维茨,S.J。;Spragins,J.D.,《关于有限混合物的可识别性》,《数理统计年鉴》,39,209-214,(1968)·Zbl 0155.25703号
[44] Zellner,A.,多元学生误差项回归模型的贝叶斯和非贝叶斯分析,美国统计协会杂志,71,400-405,(1976)·Zbl 0348.62026号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。