×

具有非正态误差的线性回归模型中的贝叶斯变量选择。 (英语) Zbl 1427.62061号

摘要:本文讨论了多元线性回归分析中的两个关键问题:(i)由于响应变量和/或来自异质群体的数据的不对称性,其分布是非正态的误差项;(ii)选择有助于解释观察结果中的模式并与预测因变量相关的回归变量。第一个问题的解决方案可以通过使用高斯分布的有限混合来建模误差项的分布。本文使用这种方法指定了一个具有非正态误差的贝叶斯线性回归模型;此外,通过在模型规范中嵌入贝叶斯变量选择技术,我们可以同时进行估计和变量选择。这些任务是通过从与模型相关的后验分布中取样来完成的。通过对模拟数据集的分析,并与其他方法进行比较,评估了该方法的性能。还提供了基于实际数据集的分析结果。当误差项的分布具有重尾、偏度和/或多模态特征时,本文所开发的方法表现良好。

MSC公司:

62年5月 线性回归;混合模型
2015年1月62日 贝叶斯推断
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Azzalini A(2013)《偏态和相关家族》,第3卷。剑桥大学出版社·兹比尔1091.62046 ·doi:10.1017/CBO9781139248891
[2] Azzalini A,Capitanio A(2003)对称扰动产生的分布,强调多元斜态分布。J R Stat Soc Ser B(统计方法)65:367-389·Zbl 1065.62094号 ·数字对象标识代码:10.1111/1467-9868.00391
[3] Azzalini A,Genton M(2008)基于斜交和相关分布的稳健似然方法。国际统计版次76:106-129·Zbl 1206.62102号 ·doi:10.1111/j.1751-5823007.00016.x
[4] Barbieri MM,Berger JO(2004)最优预测模型选择。安统计32(3):870-897·Zbl 1092.62033号 ·doi:10.1214/09053604000000238
[5] Bartolucci F,Scaccia L(2005)《使用混合物处理非正态回归误差》。计算统计数据分析48(4):821-834·Zbl 1429.62284号 ·doi:10.1016/j.csda.2004.04.005
[6] Basso R、Lachos V、Cabral C、Ghosh P(2010)基于偏态分布的比例混合的稳健混合建模。计算机统计数据分析54:2926-2941·Zbl 1284.62193号 ·doi:10.1016/j.csda.2009.09.031
[7] Breusch T,Robertson J,Welsh A(1997)《皇帝的新衣:多元回归模型的批判》。统计Neerl 51:269-286·Zbl 0929.62062号 ·doi:10.1111/1467-9574.00055
[8] Carlin BP,Chib S(1995)通过马尔可夫链蒙特卡罗方法选择贝叶斯模型。罗伊统计学会期刊B(Methodol)57(3):473-484·Zbl 0827.62027号
[9] Carroll RJ,Ruppert D(1988),回归中的变换和加权,第30卷。博卡拉顿CRC出版社·Zbl 0666.62062号 ·doi:10.1007/9781-4899-2873-3
[10] Celeux G、Forbes F、Robert CP、Titterington DM(2006)缺失数据模型的偏差信息标准。贝叶斯分析1(4):651-673。https://doi.org/10.1214/06-BA122 ·Zbl 1331.62329号 ·doi:10.1214/06-BA122
[11] Chen B(2012)有限混合回归中的贝叶斯模型选择。学位论文和学位论文
[12] Chib S,Tiwari R,Jammalamadaka S(1988),椭圆误差回归中的贝叶斯预测。《经济学杂志》38:349-360·Zbl 0677.62030号 ·doi:10.1016/0304-4076(88)90050-4
[13] UJ Dang;麦克尼古拉斯,PD;Morlini,I.(编辑);Minerva,T.(编辑);Vichi,M.(编辑),回归模型的节约型有限混合族,73-84(2015),柏林·doi:10.1007/978-3-319-17377-1_9
[14] Dellaportas P,Forster J,Ntzoufras I(1997)《关于贝叶斯模型和使用MCMC的变量选择》。希腊雅典经济与商业大学统计系技术报告·Zbl 1247.62086号
[15] Diaz-Garcia J、Rojas M、Leiva-Sanchez V(2013)椭圆多元线性回归模型的影响诊断。公共统计理论方法32:625-642·Zbl 1029.62067号 ·doi:10.1081/STA-120018555
[16] Fan J,Li R(2001)通过非凹惩罚似然的变量选择及其预言性质。美国统计学会杂志96:1348-1360·Zbl 1073.62547号 ·doi:10.1198/016214501753382273
[17] Fernandez C,Steel M(1999)多元学生回归模型:陷阱和推断。生物特征86:153-167·Zbl 0917.62020号 ·doi:10.1093/biomet/86.1153
[18] Fernandez C,Steel M(2000),贝叶斯回归分析与正常值的比例混合。经济学理论80:80-101·Zbl 0945.62031号 ·doi:10.1017/S0266466600161043
[19] Frühwirth-Schnatter S(2006)有限混合和马尔可夫切换模型。纽约州施普林格·Zbl 1108.6202号
[20] Galea M,Paula G,Bolfarine H(1997)椭圆线性回归模型中的局部影响。统计员46:71-79
[21] Galimberti G,Soffriti G(2014)使用有限混合分布的多元线性回归分析。计算统计数据分析71:138-150·Zbl 1471.62070号 ·doi:10.1016/j.csda.2013.01.017
[22] Galinberti G、Scardovi E、Soffriti G(2016)在具有非正态误差的看似无关的线性回归模型中使用混合物。统计计算26(5):1025-1038·Zbl 1505.62150号 ·doi:10.1007/s11222-015-9587-0
[23] Gelfand AE,Smith AF(1990),基于采样的边缘密度计算方法。美国统计协会杂志85(410):398-409·Zbl 0702.62020号 ·网址:10.1080/01621459.1990.10476213
[24] George EI,McCulloch RE(1993),吉布斯抽样变量选择。美国统计协会杂志88(423):881-889·doi:10.1080/01621459.1993.10476353
[25] Hosmer D(1974)两条回归线混合参数的最大似然估计。公共统计理论方法3:995-1006·Zbl 0294.62085号
[26] Khalili A,Chen J(2007)有限混合回归模型中的变量选择。美国统计协会杂志102:1025-1038·Zbl 1469.62306号 ·doi:10.19198/0162114507000000590
[27] Lange K,Little R,Taylor J(1989)使用t分布的稳健统计建模。美国统计协会杂志84:881-896
[28] Lee K,Chen R,Wu Y(2016)线性回归有限混合模型的贝叶斯变量选择。计算统计数据分析95:1-16·Zbl 1468.62112号 ·doi:10.1016/j.csda.2015.09.005
[29] Liu S(2002)多元椭圆线性回归模型中的局部影响。线性代数应用354:159-174·Zbl 1009.62060号 ·doi:10.1016/S0024-3795(01)00585-7
[30] Liu W,Zhang B,ZhangZ,Tao J,Branscum A(2015)回归模型有限混合中的模型选择:具有创新加权先验和可逆跳马尔可夫链蒙特卡罗实现的贝叶斯方法。J统计计算模拟85:2456-2478·Zbl 1457.62023号 ·doi:10.1080/0949655.2014.931584
[31] McLachlan G,Peel D(2000)有限混合模型。奇切斯特·威利·Zbl 0963.62061号 ·doi:10.1002/0471721182
[32] Nierenberg DW、Stukel TA、Baron JA、Dain BJ、Greenberg R、Group SCPS(1989)《血浆β-胡萝卜素和视黄醇水平的决定因素》。美国流行病学杂志130(3):511-521·doi:10.1093/oxfordjournals.aje.a115365
[33] O'Hara RB,SillanpääMJ(2009)《贝叶斯变量选择方法的回顾:什么、如何以及是什么。贝叶斯分析4(1):85-117·Zbl 1330.62291号 ·doi:10.1214/09-BA403
[34] Papastamoulis P(2016)标签切换:处理MCMC输出中标签切换问题的R包。J Stat Softw代码段69(1):1-24。https://doi.org/10.18637/jss.v069.c01 ·doi:10.18637/jss.v069.c01
[35] Park T,Casella G(2008)《贝叶斯拉索》。美国统计协会杂志103:681-686·Zbl 1330.62292号 ·doi:10.1198/016214500000037
[36] R核心团队(2017)R:统计计算的语言和环境。R统计计算基金会,奥地利维也纳。https://www.R-project.org/。2018年6月24日访问
[37] Richardson S,Green PJ(1997)关于成分数量未知的混合物的贝叶斯分析(含讨论)。J R Stat Soc Ser B(统计方法)59(4):731-792·Zbl 0891.62020号 ·数字标识代码:10.1111/1467-9868.00095
[38] Rubio F,Genton M(2016),偏对称误差分布的贝叶斯线性回归及其在生存分析中的应用。统计医学35:2441-2454·数字对象标识代码:10.1002/sim.6897
[39] Rubio F,Yu K(2017)灵活客观贝叶斯线性回归及其在生存分析中的应用。《应用统计杂志》44:798-810·Zbl 1516.62577号 ·doi:10.1080/02664763.2016.1182138
[40] Sahu S,Dey D,Branco M(2003)一类新的多元偏态分布及其在贝叶斯回归模型中的应用。加拿大统计局31:129-150·Zbl 1039.62047号 ·doi:10.2307/316064
[41] Schlattmann P(2009)有限混合模型的医学应用。柏林施普林格·兹比尔1158.62082
[42] Simon N,Friedman J,Hastie T,Tibshirani R(2011)通过坐标下降实现Cox比例风险模型的正则化路径。J Stat Softw统计软件39(5):1-13·doi:10.18637/jss.v039.i05
[43] Soffriti G,Galimberti G(2011)《具有非正态误差的多元线性回归:基于混合模型的解决方案》。统计计算21:523-536·Zbl 1221.62106号 ·doi:10.1007/s11222-010-9190-3
[44] Song W,Yao W,Xing Y(2014)拉普拉斯分布的稳健混合回归模型拟合。计算统计数据分析71:128-137·Zbl 1471.62189号 ·doi:10.1016/j.csda.2013.06.022
[45] Spiegelhalter DJ、Best NG、Carlin BP、Van Der Linde A(2002)模型复杂性和拟合的贝叶斯度量。J R Stat Soc Ser B(统计方法)64(4):583-639·Zbl 1067.62010年 ·数字对象标识代码:10.1111/1467-9868.00353
[46] Srivastava MS(2002)多元统计方法。纽约威利·Zbl 1006.62048号
[47] Srivastava VK,Giles DEA(1987)似乎无关的回归方程模型:估计和推断。博卡拉顿CRC出版社·Zbl 0638.62108号
[48] Städler N,Bühlmann P,van de Geer \[S(2010)l_1\]l1-混合回归模型的惩罚。测试19:209-256·Zbl 1203.62128号
[49] Stukel T(2008)血浆视黄醇和β-胡萝卜素水平的决定因素。StatLib数据集存档。http://lib.stat.cmu.edu/datasets/Plasma_Retinol。2018年6月24日访问
[50] Sutradhar B,Ali M(1986)多元误差变量回归模型参数的估计。公共统计理论方法15:429-450·Zbl 0608.62061号 ·doi:10.1080/03610928608829130
[51] Tibshirani R(1996)通过套索回归收缩和选择。J R Stat Soc Ser B(Methodol)期刊58:267-288·Zbl 0850.62538号
[52] Tibshirani R(2011)《通过套索进行回归收缩和选择:回顾》。J R Stat Soc Ser B(统计方法)73:273-282·Zbl 1411.62212号 ·doi:10.1111/j.1467-9868.2011.00771.x
[53] Yao W,Wei Y,Yu C(2014)使用t分布的稳健混合回归。计算统计数据分析71:116-127·Zbl 1471.62227号 ·doi:10.1016/j.csda.2013.07.019
[54] Zellner A(1976)用多元学生误差项对回归模型进行贝叶斯和非贝叶斯分析。美国统计协会71:400-405·Zbl 0348.62026号
[55] Zellner A(1986)关于评估先验分布和使用g-先验分布的贝叶斯回归分析。贝叶斯推断Decis技术论文Bruno De Finetti荣誉6:233-243·Zbl 0655.62071号
[56] Zhang CH(2010)极小极大凹罚下的几乎无偏变量选择。安统计38:894-942·Zbl 1183.62120号 ·doi:10.1214/09-AOS729
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。