×

高维广义线性模型的贝叶斯子集建模。 (英语) Zbl 06195963号

摘要:本文提出了一种新的高维广义线性模型的先验设置,该设置导致贝叶斯子集回归(BSR),其最大后验模型近似等于最小扩展贝叶斯信息准则模型。在温和的条件下,得到的后牙的一致性是确定的。进一步,提出了一种基于边际包含概率的变量筛选方法,该方法与现有的确定独立筛选(SIS)和迭代确定独立筛选方法(ISIS)具有相同的确定筛选特性和一致性。然而,由于所提出的程序利用了来自所有预测因子的联合信息,因此在实际应用中通常优于SIS和ISIS。本文还对BSR与常用的惩罚似然法进行了广泛的比较,包括拉索法、弹性网法、SIS法和ISIS法。数值结果表明,BSR方法的性能通常优于惩罚似然方法。BSR选择的模型往往更稀疏,更重要的是,具有更高的预测能力。此外,随着预测因子数量的增加,惩罚似然法的性能往往会恶化,而这对BSR来说并不重要。本文的补充资料可在线获取。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Alon U.,《美国国家科学院院刊》96页6745–(1999)·doi:10.1073/pnas.96.12.6745
[2] Ando T.,贝叶斯模型选择和统计建模(2010)·Zbl 1303.62006年 ·doi:10.1201/EBK1439836149
[3] Bae K.,生物信息学20,第3423页–(2004)·doi:10.1093/bioinformatics/bth419
[4] Barbieri M.M.,《统计年鉴》32,第870页–(2004年)·doi:10.1214/09053604000000238
[5] Benjamini Y.,Biometrika 93第491页–(2006年)·Zbl 1108.62069号 ·doi:10.1093/biomet/93.3.491
[6] Bottolo L.,贝叶斯分析5,第583页–(2010年)·兹比尔1330.90042 ·doi:10.1214/10-BA523
[7] BovéD.S.,贝叶斯分析6,第387页–(2011年)·Zbl 1330.62058号 ·doi:10.1214/ba/1339616469
[8] Broman K.W.,《皇家统计学会杂志》,B辑64页641页–(2002年)·Zbl 1067.62108号 ·doi:10.1111/1467-9868.00354
[9] 查普曼J.M.,《美国人类遗传学杂志》84第178页–(2009)·doi:10.1016/j.ajhg.2008年12月15日
[10] Chen J.,Biometrika 94第759页–(2008年)·Zbl 1437.62415号 ·doi:10.1093/biomet/asn034
[11] 陈杰,《中国统计》22,第555页–(2012)
[12] Chen M.-H.,《中国统计》13第461页–(2003)
[13] Chen M.-H.,贝叶斯分析3,第585页–(2008)·Zbl 1330.62298号 ·doi:10.1214/08-BA323
[14] Chib S.,《美国统计协会杂志》,90 pp 1313–(1995)·doi:10.1080/01621459.1995.10476635
[15] Fan J.,《美国统计协会杂志》96 pp 1348–(2001)·兹比尔1073.62547 ·doi:10.1198/016214501753382273
[16] Fan J.,《皇家统计学会杂志》,B辑70 pp 849–(2008)·doi:10.1111/j.1467-9868.2008.00674.x
[17] 范杰,《中国统计》,20页,101–(2010)
[18] Fan J.,《机器学习研究杂志》,第10页,1829页–(2009年)
[19] Fan J.,《统计年鉴》38,第3567页–(2010年)·Zbl 1206.68157号 ·doi:10.1214/10-AOS798
[20] Figueiredo M.A.T.,《IEEE模式分析与机器智能汇刊》,第25页,第1150页–(2003)·doi:10.1109/TPAMI.2003.1227989
[21] Friedman J.,《统计软件杂志》,第33页,第1页–(2010年)·doi:10.18637/jss.v033.i01
[22] Golub T.,《科学》286 pp 531–(1999)·doi:10.1126/science.286.5439.531
[23] Haario H.,Bernoulli 7,第223页–(2001年)·Zbl 0989.65004号 ·doi:10.2307/3318737
[24] Hans C.,《美国统计协会杂志》102 pp 507–(2007)·Zbl 1134.62398号 ·doi:10.19198/0162114507000000121
[25] Holzmann H.,《斯堪的纳维亚统计杂志》33,第753页–(2006)·兹比尔1164.62354 ·doi:10.1111/j.1467-9469.2006.00505.x
[26] Hsu S.J.,《加拿大统计杂志》23,第399页–(1995)·Zbl 0878.62021号 ·doi:10.2307/3315383
[27] Jiang W.,《神经计算》,第18页,第2762页–(2006)·Zbl 1113.62030 ·doi:10.1162/neco.2006.18.11.2762
[28] 姜伟,《统计年鉴》35页1487–(2007)·Zbl 1123.62026号 ·doi:10.1214/00905360000000019
[29] Johnson V.E.,《美国统计协会杂志》107 pp 649–(2012)·Zbl 1261.62024号 ·doi:10.1080/01621459.2012.682536
[30] Liang F.,《统计与概率快报》79页581页–(2009年)·Zbl 1156.62344号 ·doi:10.1016/j.spl.2008.10.007
[31] Liang F.,《美国统计协会杂志》102 pp 305–(2007)·Zbl 1226.65002号 ·doi:10.1198/0162145000001202
[32] 梁凤,《中国统计》11页1005–(2001)
[33] Liang F.,Biometrika 95第961页–(2008年)·Zbl 1437.62525号 ·doi:10.1093/biomet/asn036
[34] Mallows C.L.,《技术计量学》,第15页,第661页–(1973年)
[35] Moreno E.,《统计年鉴》,第38页,1937–(2010)·Zbl 1323.62024号 ·doi:10.1214/09-AOS754
[36] Park M.Y.,《皇家统计学会杂志》,B辑69,第659页–(2007年)·文件编号:10.1111/j.1467-9868.2007.00607.x
[37] Park T.,《美国统计协会杂志》第103页第681页(2008年)·Zbl 1330.62292号 ·doi:10.1198/016214500000037
[38] Richardson S.,贝叶斯统计9,第539页–(2010年)
[39] Scott J.G.,《统计年鉴》,第38页,第2587页–(2010年)·Zbl 1200.62020年 ·doi:10.1214/10-AOS792
[40] Singh D.,《癌症细胞1》,第203页–(2002年)·doi:10.1016/S1535-6108(02)00030-2
[41] Storey J.D.,《皇家统计学会杂志》,B辑,64页,第479页–(2002)·Zbl 1090.62073号 ·doi:10.111/1467-9868.00346
[42] Tibshirani R.,《皇家统计学会杂志》,B辑58,第267页–(1996)
[43] Zhang C.-H.,《统计年鉴》38,第894页–(2009)·Zbl 1183.62120号 ·doi:10.1214/09-AOS729
[44] 张杰,《Neerlandica统计》62页393–(2008)·Zbl 1144.62069号 ·doi:10.1111/j.1467-9574.2008.00397.x
[45] Zou H.,《皇家统计学会杂志》,B辑67第301页–(2005)·Zbl 1069.62054号 ·数字对象标识代码:10.1111/j.1467-9868.2005.0050.x
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。