×

一种有效的贝叶斯套索蒙特卡罗EM算法。 (英语) Zbl 1453.62260号

摘要:套索在许多研究领域是一种流行的同时估计和变量选择技术。当回归系数具有独立的拉普拉斯先验时,回归系数的边际后验模式等价于非贝叶斯套索给出的估计。由于统计推断的灵活性,贝叶斯方法近年来吸引了越来越多的研究。当前的方法主要是使用马尔可夫链蒙特卡罗(MCMC)算法进行完全贝叶斯分析,或者在每个E步中使用蒙特卡罗期望最大化(MCEM)方法和MCMC算法。然而,基于MCMC的贝叶斯方法计算量大,收敛速度慢。M.Tan先生等[同上,77,第11号,929–943(2007年;Zbl 1131.62065号)]提出了一种非迭代采样方法,即逆贝叶斯公式(IBF)采样器,用于计算MCEM结构中层次模型的后验概率。受他们论文的启发,我们在MCEM结构中开发了这种IBF采样器,以便在完全条件分布不明确的情况下,通过调整重要抽样的权重,给出贝叶斯套索回归系数的边际后验模式。仿真实验表明,基于期望最大化算法的方法和我们的算法大大减少了计算时间,我们的方法和其他贝叶斯套索方法在预测精度和变量选择精度上都具有相似性,特别是当样本大小为相对较大。

MSC公司:

62-08 统计问题的计算方法
2015年1月62日 贝叶斯推断
62J07型 岭回归;收缩估计器(拉索)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Tibshirani R.通过套索回归收缩和选择。J R Stat Soc Ser B Stat方法。1996;58:267-288. [Crossref]、[Web of Science®]、[Google学者]·Zbl 0850.62538号
[2] Efron B,Hastie T,Johnstone I,Tibshirani R.最小角回归。安·统计师。2004;第32:407-451页。doi:10.1214/009053604000000067[Crossref],[Web of Science®],[Google学者]·Zbl 1091.62054号
[3] Tibshirani R.通过套索回归收缩和选择:回顾。J R Stat Soc Ser B Stat方法。2011;73:273-282. doi:10.1111/j.1467-9868.2011.00771.x[Crossref],[Web of Science®],[Google学者]·Zbl 1411.62212号
[4] Park T,Casella G.贝叶斯套索。J Amer统计协会,2008年;103:681-686. doi:10.1198/016214500000037[Taylor&Francis Online],[Web of Science®],[Google学者]·Zbl 1330.62292号
[5] Bae K,Mallick BK。使用两级分层贝叶斯模型进行基因选择。生物信息学。2004;20: 3423-3430. doi:10.1093/生物信息学/bth419[Crossref],[PubMed],[Web of Science®],[Google学者]
[6] Hans C.贝叶斯套索回归。生物特征。2009;96:835-845. doi:10.1093/biomet/asp047[Crossref],[Web of Science®],[Google学者]·Zbl 1179.62038号
[7] Figueiredo MAT.监督学习的自适应稀疏性。IEEE Trans-Pattern Ana Mach Intell公司。2003;25: 1050-1159. [谷歌学者]
[8] Griffin JE,Brown PJ。贝叶斯自适应套索与非凸惩罚。奥斯汀N Z J Stat.2011;53:423-442. doi:10.1111/j.1467-842X.2011.00641.x[Crossref],[Web of Science®],[Google学者]·Zbl 1335.62047号
[9] Lee A,Caron F,Doucet A,Holmes C.用于构建稀疏性诱导先验的分层贝叶斯框架[Internet]。提交出版;2010年[引用自2012年12月26日]。可从以下位置获得:http://arxiv.org/abs/1009.1914[谷歌学者]
[10] McCulloch行政长官。二进制数据的最大似然方差分量估计。J Amer统计协会,1994年;89:330-335. doi:10.1080/01621459.1994.10476474[泰勒和弗朗西斯在线],[科学网®],[谷歌学者]·Zbl 0800.62139号
[11] McCulloch行政长官。广义线性混合模型的最大似然算法。美国统计协会杂志,1997年;92:162-170. doi:10.1080/01621459.1997.10473613[Taylor&Francis Online],[Web of Science®],[Google学者]·Zbl 0889.62061号
[12] Booth JG,Hobert JP。使用自动蒙特卡罗EM算法最大化广义线性模型的似然。J R Stat.Soc Ser B Stat方法。1999;61:265-285. doi:10.1111/1467-9868.00176[Crossref],[Web of Science®],[Google学者]·Zbl 0917.62058号
[13] Tan M,Tian GL,Fang HB。一种有效的MCEM算法,用于相关二进制数据的广义线性混合模型拟合。J统计计算模拟。2007;77:929-943. doi:10.1080/10629360600843153[Taylor&Francis Online],[Web of Science®],[Google学者]·Zbl 1131.62065号
[14] Tan M,Tian GL,Ng KW。EM型算法结构中计算后验概率的非迭代采样方法。中国统计局。2003;13:625-639. [Web of Science®],[Google学者]·Zbl 1028.62014号
[15] 稳健贝叶斯分析:对先验的敏感性。J统计计划推断。1990;25:303-328. doi:10.1016/0378-3758(90)90079-A[Crossref],[Web of Science®],[Google学者]·Zbl 0747.62029号
[16] Kyung M、Gilly J、Ghoshz M、Casella G.惩罚回归、标准误差和贝叶斯套索。贝叶斯分析。2010;5:369-412. doi:10.1214/10-BA607[Crossref],[Web of Science®],[Google学者]·Zbl 1330.62289号
[17] Polson NG、Scott JG。全球收缩,局部行动:稀疏贝叶斯正则化和预测。收录人:Bernardo JM、Bayarri MJ、Berger JO、Dawid AP、Heckerman D、Smith AFM、West M,编辑。贝叶斯统计学9。牛津:牛津大学出版社;2010年,第501-538页。[谷歌学者]
[18] Lykou A,Ntzoufras I.关于贝叶斯套索变量的选择和收缩参数的规范。统计计算。2013;23:361-390. doi:10.1007/s1122-012-9316-x[Crossref],[Web of Science®],[Google学者]·Zbl 1322.62110号
[19] Tan M,Tian GL,Ng KW。贝叶斯缺失数据问题:EM数据增强和非迭代计算。佛罗里达州博卡拉顿:查普曼和霍尔/CRC;2009.[谷歌学者]·Zbl 1216.62042号
[20] Boyd SP,Vandenberghe L.凸优化。剑桥:剑桥大学出版社;2004.【Crossref】,【谷歌学者】·Zbl 1058.90049号
[21] 李强,林娜。贝叶斯弹性网。贝叶斯分析。2010;5:151-170. doi:10.1214/10-BA506[Crossref],[Web of Science®],[Google学者]·Zbl 1330.65026号
[22] 统计决策理论和贝叶斯分析。第二版,纽约:施普林格出版社;1993.[谷歌学者]
[23] Zou H.自适应套索及其oracle属性。J Amer统计协会,2006年;101:1418-1429. doi:10.1198/016214500000735[Taylor&Francis Online],[Web of Science®],[Google学者]·Zbl 1171.62326号
[24] Hastie T、Tibshirani R、Friedman JH。统计学习的要素:数据挖掘、推理和预测。纽约:Springer-Verlag;2001.[交叉参考],[谷歌学者]·Zbl 0973.62007号
[25] 傅伟杰。惩罚回归:桥梁与套索。J计算图形统计。1998;7:397-416. [Taylor&Francis Online]、[Web of Science®]、[Google学者]
[26] Levine RA,Casella G.蒙特卡罗EM算法的实现。J计算图形统计。2001;10:422-439. doi:10.1198/106186001317115045[Taylor&Francis Online],[Web of Science®],[Google学者]
[27] Scheip F.结构化加性回归模型中贝叶斯正则化和模型选择的正态分布先验知识[Internet]。慕尼黑大学统计系技术报告84;2010年[引用自2012年12月26日]。可从以下位置获得:http://epub.ub.uni-muenchen.de/11785/[谷歌学者]
[28] 格里芬JE,棕色PJ。回归问题中正态伽马先验分布的推断。贝叶斯分析。2010;5:171-188. doi:10.1214/10-BA507[Crossref],[Web of Science®],[Google学者]·Zbl 1330.62128号
[29] Carvalho C,Polson N,Scott J.稀疏信号的马蹄形估计器。Biometrika 2010;97:465-480. doi:10.1093/biomet/asq017[Crossref],[Web of Science®],[Google学者]·Zbl 1406.62021号
[30] Hastie T,Efron B.lars:最小角度回归,套索和向前分段[Internet];2011年[引用自2012年12月26日]。软件可从以下位置获得:http://cran.r-project.org/web/packages/lars/index.html[谷歌学者]
[31] Scheip F.spikeLabGAM:R.J Statist Softw中广义加性混合模型的贝叶斯变量选择、模型选择和正则化。2011;43(14):1-24. [PubMed],[Google学者]
[32] Gramacy R.Monomvn:具有单调缺失的多元正态和Student-t数据的估计[Internet];2012年[引用自2012年12月26日]。软件可从以下位置获得:http://CRAN.R-project.org/package=monomvn[谷歌学者]
[33] Stamey TA、Kabalin JN、McNeal JE、Johnstone IM、Freiha F、Redwine EA、Yang N.前列腺特异性抗原在前列腺癌诊断和治疗中的应用。二、。经根治性前列腺切除术治疗的患者。乌洛尔杂志。1989;141(5):1076-1083. [PubMed]、[Web of Science®]、[Google学者]
[34] 邹H,Hastie T.通过弹性网进行正则化和变量选择。J R Statist Soc B.2005;67:301-320。doi:10.1111/j.1467-9868.2005.0050.x[交叉引用],[谷歌学者]·Zbl 1069.62054号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。