×

多协变量贝叶斯概率回归中的交叉验证优先选择。 (英语) Zbl 1322.62107号

摘要:本文通过预测性交叉验证标准检验了概率回归中的优先选择。特别是,我们关注的是潜在协变量的数量远大于观察值的情况,例如在基因表达数据中。交叉验证避免了此类模型完美拟合的趋势。我们在标准变量选择中选择尺度参数c作为对数预测分数的最小值。对数预测分数的朴素评估需要大量的计算工作,我们使用重要性抽样研究计算成本更低的方法。我们发现,无论是混合不同的(c)值还是通过辅助分布对(c)进行积分,(K)倍重要性密度都表现得最好。

MSC公司:

2015年1月62日 贝叶斯推断
62页第10页 统计学在生物学和医学中的应用;元分析
62G08号 非参数回归和分位数回归

软件:

BMSS公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Alon,U.、Barkai,N.、Notterman,D.A.、Gish,K.、Ybara,S.、Mack,D.、Levine,A.J.:寡核苷酸阵列探测的肿瘤和正常结肠组织的聚类分析揭示了广泛的基因表达模式。程序。国家。阿卡德。科学。美国96、6745–6750(1999)·doi:10.1073/pnas.96.12.6745
[2] Brown,P.J.,Vannucci,M.:多元贝叶斯变量选择和预测。J.R.Stat.Soc.60(3),627–641(1998)·Zbl 0909.62022号 ·doi:10.1111/1467-9868.00144
[3] Celeux,G.、Marin,J.-M.、Robert,C.P.:《经济衰退中的变量选择》。J.Soc.Fr.Stat.147,59-79(2006)
[4] Cui,W.,George,E.I.:经验贝叶斯与完全贝叶斯变量选择。J.统计计划。推断138、888–900(2008)·Zbl 1130.62007年 ·doi:10.1016/j.jspi.2007.02.011
[5] Denison,D.G.T.,Holmes,C.C.,Mallick,B.K.,Smith,A.F.M.:非线性分类和回归的贝叶斯方法。威利,纽约(2002)·Zbl 0994.62019号
[6] Dobra,A.:全基因组数据的变量选择和依赖网络。生物统计学10,621–639(2009)·doi:10.1093/biostatistics/kxp018
[7] Fernández,C.,Ley,E.,Steel,M.F.J.:贝叶斯模型平均的基准先验。《经济学杂志》。100381–427(2001年)·Zbl 1091.62507号 ·doi:10.1016/S0304-4076(00)00076-2
[8] Geisser,S.、Eddy,W.F.:模型选择的预测方法。《美国统计协会期刊》第74期,第153-160页(1979年)·Zbl 0401.62036号 ·网址:10.1080/01621459.1979.10481632
[9] Gelfand,A.E.,Dey,D.K.:贝叶斯模型选择:渐近和精确计算。J.R.Stat.Soc.,塞尔维亚。B 56501-514(1994)·Zbl 0800.62170号
[10] Gelfand,A.E.,Dey,D.K.,Chang,H.:使用预测分布确定模型,并通过基于抽样的方法实现。贝叶斯统计4,147–167(1992)
[11] George,E.I.,Foster,D.P.:校准和经验贝叶斯变量选择。Biometrika 87(4)、731–747(2000)·Zbl 1029.62008号 ·doi:10.1093/biomet/87.4.731
[12] Geyer,C.J.:估算MCMC中的归一化常数和重新称重混合物。明尼苏达大学统计学院技术报告568(1994)
[13] Gneiting,T.,Raftery,A.E.:严格正确的评分规则、预测和估计。《美国统计协会期刊》102、359–378(2007)·Zbl 1284.62093号 ·doi:10.1198/0162145000001437
[14] 很好,I.J.:理性的决定。J.R.Stat.Soc.,塞尔维亚。B 14(1),107–114(1952)
[15] Hastie,T.、Tibshirani,R.、Friedman,J.H.:《统计学习的要素》。统计学中的斯普林格系列。施普林格,纽约(2001)·Zbl 0973.62007号
[16] Holmes,C.C.,Held,L.:二元和多项式回归的贝叶斯辅助变量模型。贝叶斯分析。1(1), 145–168 (2006) ·Zbl 1331.62142号 ·doi:10.1214/06-BA105
[17] Key,J.,Pericchi,L.,Smith,A.F.M.:贝叶斯模型选择:什么和为什么?收录于:Bernardo,J.、Berger,J.O.、Dawid,A.P.、Smith,A.F.M.(编辑)《贝叶斯统计》,第6卷,第343–370页。牛津大学出版社,牛津(1999)·Zbl 0956.62007号
[18] Lee,K.E.,Sha,N.,Dougherty,E.R.,Vannucci,M.,Mallick,B.:基因选择:贝叶斯变量选择方法。生物信息学19,90–97(2003)·doi:10.1093/生物信息/19.1.90
[19] Liang,F.,Paulo,R.,Molina,G.,Clyde,M.A.,Berger,J.O.:贝叶斯变量选择的G-priors混合。《美国统计协会期刊》103、410–423(2008)·Zbl 1335.62026号 ·doi:10.19198/0162114507000001337
[20] Liu,J.S.:科学计算中的蒙特卡罗策略。施普林格,纽约(2001)·Zbl 0991.65001号
[21] Owen,A.,Zhou,Y.:安全有效的重要性抽样。《美国统计协会杂志》第95期,第135–143页(2000年)·Zbl 0998.65003号 ·doi:10.1080/01621459.2000.10473909
[22] Robert,C.P.,Casella,G.:蒙特卡洛统计方法,第二版。施普林格,纽约(2004)
[23] Scott,J.G.,Berger,J.O.:贝叶斯多重测试方面的探索。J.统计计划。推论136,2144–2162(2006)·Zbl 1087.62039号 ·doi:10.1016/j.jspi.2005.08.031
[24] Sha,N.,Vannucci,M.,Brown,P.J.,Trower,M.K.,Amphlett,G.,Falciani,F.:利用大规模微阵列表达谱进行关节炎分类的基因选择。压缩机。功能。基因组学4,171–181(2003)·doi:10.1002/cfg.264
[25] Sha,N.、Vannucci,M.、Tadesse,M.G.、Brown,P.J.、Dragoni,I.、Davies,N.,Roberts,T.C.、Contestabile,A.、Salmon,M..、Buckley,C.、Falciani,F.:多项概率模型中的贝叶斯变量选择,以识别疾病阶段的分子特征。生物计量学60812-819(2004)·Zbl 1274.62428号 ·doi:10.1111/j.0006-341X.2004.00233.x
[26] 谢弗:林德利悖论。《美国统计协会期刊》77,325–351(1982)·Zbl 0491.62004号 ·doi:10.1080/01621459.1982.10477809
[27] Singh,D.,Febbo,P.G.,Ross,K.,Jackson,D.G.,Manola,J.,Ladd,C.,Tamayo,P.,Renshaw,A.A.,D'Amico,A.V.,Richie,J.P.,Lander,E.S.,Loda,M.,Kantoff,P.W.,Golub,T.R.,Sellers,W.R.:基因表达与前列腺癌临床行为相关。癌细胞1,203–209(2002)·doi:10.1016/S1535-6108(02)00030-2
[28] Strimenopoulou,F.,Brown,P.J.:经验贝叶斯逻辑回归。统计应用程序。遗传学。分子生物学。7, 9 (2008) ·Zbl 1276.62093号
[29] Veach,E.,Guibas,L.:蒙特卡罗渲染的最佳组合采样技术。摘自:SIGGRAPH’95会议记录,第419-428页。Addison–Wesley,雷丁(1995)
[30] 文图拉:非参数自助回收。统计计算。12, 261–273 (2002) ·doi:10.1023/A:1020754911317
[31] Zhou,X.,Liu,K.-Y.,Wong,S.T.C.:使用贝叶斯基因选择的逻辑回归进行癌症分类和预测。J.生物识别。通知。37(4), 249–259 (2004) ·doi:10.1016/j.jbi.2004.07.009
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。