×

在具有相关协变量的逻辑回归模型中使用EM算法进行贝叶斯变量选择。 (英语) Zbl 07192568号

摘要:我们为logistic回归模型开发了一种贝叶斯变量选择方法,该方法可以同时适应各种遗传约束下的定性协变量和交互项。我们使用具有确定性退火变量的期望最大化变量选择(EMVS)作为我们的方法的平台,因为它被证明具有灵活性和效率。我们建议对定性协变量系数的先验值进行方差调整,以控制假阳性率,并对交互项进行灵活的参数化,以适应用户特定的遗传约束。此方法可以处理所有成对交互项以及特定交互的子集。通过仿真,我们表明,在流行病学研究中遇到的各种探索性研究场景中,该方法比分组LASSO和具有遗传约束的LASSO更好地选择相关协变量。我们应用我们的方法在一组墨西哥裔青少年中确定与吸烟实验相关的遗传和非遗传风险因素。

MSC公司:

2015年1月62日 贝叶斯推断
62J12型 广义线性模型(逻辑模型)
68岁20岁 模拟(MSC2010)
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] McCullagh P,日本内尔德。广义线性模型。第二版,博卡拉顿(佛罗里达州):CRC出版社;1989.【Crossref】,【谷歌学者】·Zbl 0744.62098号
[2] Frühwirth-Schnatter S,Frü)hwirth R.二元和多项式logit模型的数据增强和MCMC。收件人:Kneib T,Tutz G,编辑。统计建模和回归结构。柏林-海德堡:施普林格;2010年,第111-132页。[谷歌学者]
[3] Gramacy RB,Polson NG.基于模拟的正则逻辑回归。贝叶斯分析。2012;7(3):567-590. [Crossref]、[Web of Science®]、[Google学者]·Zbl 1330.62301号
[4] Polson NG、Scott JG、Windle J.使用Pólya-Gamma潜在变量对逻辑模型进行贝叶斯推断。2013年美国统计学会杂志;108(504):1339-1349. [Taylor&Francis Online]、[Web of Science®]、[Google学者]·Zbl 1283.62055号
[5] Holmes CC,Held L.二元和多项式回归的贝叶斯辅助变量模型。贝叶斯分析。2006;1(1):145-168. [Crossref]、[Web of Science®]、[Google学者]·Zbl 1331.62142号
[6] Albert JH,Chib S.二值和多值响应数据的贝叶斯分析。美国国家统计协会杂志,1993年;88(422):669-679。[Taylor&Francis Online]、[Web of Science®]、[Google学者]·Zbl 0774.62031号
[7] 乔治·艾。变量选择问题。2000年美国统计学会杂志;95(452):1304-1308. [Taylor&Francis Online]、[Web of Science®]、[Google学者]·Zbl 1018.62050号
[8] Madigan D,York J,Allard D.离散数据的贝叶斯图形模型。国际统计版次1995;63(2):215-232. [Crossref]、[Web of Science®]、[Google学者]·Zbl 0834.62003号
[9] Raftery AE、Madigan D、Hoeting JA。线性回归模型的贝叶斯模型平均。J Am Stat Assoc.1997年;92(437):179-191. [Taylor&Francis Online]、[Web of Science®]、[Google学者]·Zbl 0888.62026号
[10] Park T,Casella G.贝叶斯套索。2008年美国统计学会杂志;103(482):681-686. [Taylor&Francis Online]、[Web of Science®]、[Google学者]·Zbl 1330.62292号
[11] George EI,McCulloch RE。吉布斯抽样变量选择。《美国统计学会杂志》,1993年;88(423):881-889. [Taylor&Francis Online]、[Web of Science®]、[Google学者]
[12] 罗奇科娃,乔治·埃尔。EMVS:贝叶斯变量选择的EM方法。2014年美国统计学会杂志;109(506):828-846. [Taylor&Francis Online]、[Web of Science®]、[Google学者]·Zbl 1367.62049号
[13] Chipman H.贝叶斯变量选择及相关预测。Can J Stat.1996;24(1):17-36. [Crossref]、[Web of Science®]、[Google学者]·Zbl 0849.62032号
[14] Kim Y,Kim J,Kim Y.分块稀疏回归。统计正弦。2006;16(2):375-390. [Web of Science®],[Google学者]·Zbl 1096.62076号
[15] Meier L,Van De Geer S,Bühlmann P。逻辑回归的组套索。J R Stat Soc Ser B Stat方法。2008;70(1):53-71. [Crossref],[Google学者]·Zbl 1400.62276号
[16] Xu X,Ghosh M.群套索的贝叶斯变量选择和估计。贝叶斯分析。2015;10(4):909-936. [Crossref]、[Web of Science®]、[Google学者]·Zbl 1334.62132号
[17] 袁明,林毅。分组变量回归中的模型选择和估计。J R Stat Soc系列B Stat方法。2006;68(1):49-67。[Crossref]、[Web of Science®]、[Google学者]·Zbl 1141.62030号
[18] Choi NH,Li W,Zhu J.具有强遗传约束的变量选择及其预言性。2010年美国统计学会杂志;105(489):354-364. [Taylor&Francis Online]、[Web of Science®]、[Google学者]·Zbl 1320.62171号
[19] Bien J、Taylor J、Tibshirani R.等级互动套索。安·统计师。2013;41(3):1111-1141. [Crossref]、[PubMed]、[Web of Science®]、[Google学者]·兹比尔1292.62109
[20] Chen CCM,Schwender H,Keith J,等。识别SNP相互作用的方法:逻辑回归、随机森林和贝叶斯逻辑回归变异的综述。计算生物信息。2011;8(6):1580-1591. [谷歌学者]
[21] 袁M,约瑟夫VR,邹H.结构化变量选择与估计。Ann Appl Stat.2009;4(3):1738-1757. [Crossref],[Google学者]·Zbl 1184.62032号
[22] Lim M,Hastie T.通过分层群-群正则化学习交互。2014年计算机图表统计杂志;24(3):627-654. [Taylor&Francis Online]、[Web of Science®]、[Google学者]
[23] Radchenko P,James GM。高维自适应非线性交互结构变量选择。2010年美国统计学会杂志;105(492):1541-1553. [Taylor&Francis Online]、[Web of Science®]、[Google学者]·Zbl 1388.62212号
[24] Liu C,Ma J,Amos CI。分层基因-环境和基因-基因相互作用的贝叶斯变量选择。嗯,Genet。。2015;134(1):23-36. [Crossref]、[PubMed]、[Web of Science®]、[Google学者]
[25] 佩克索托JL。多项式回归模型中的层次变量选择。美国统计局1987年;41(4):311-313. [Taylor&Francis Online]、[Web of Science®]、[Google学者]
[26] Dempster AP、Laird NM、Rubin DB。通过EM算法从不完整数据中获得最大似然。J R Stat Soc Ser B方法。1977;39(1):1-38. [谷歌学者]·Zbl 0364.62022号
[27] McDermott P,Snyder J,Willison R.使用EM算法对二进制响应数据进行贝叶斯变量选择的方法。arXiv预打印arXiv:160505429。2016.【谷歌学者】
[28] Zhao K,Lian H。贝叶斯分位数回归的期望最大化方法。计算统计数据分析。2016;96:1-11. [Crossref]、[Web of Science®]、[Google学者]·Zbl 1468.62235号
[29] Lange K.一种局部等效于EM算法的梯度算法。J R Stat Soc Ser B方法。1995;57(2):425-437。[谷歌学者]·Zbl 0813.62021号
[30] 吴CFJ。关于EM算法的收敛性。安·统计师。1983;11(1):95-103. [Crossref]、[Web of Science®]、[Google学者]·Zbl 0517.62035号
[31] Ueda N,Nakano R.确定性退火EM算法。神经网络。1998;11(2):271-282. [Crossref]、[PubMed]、[Web of Science®]、[Google学者]
[32] Holm S.一种简单的顺序拒绝多重测试程序。Scand J统计。1979;6(2):65-70. [Web of Science®],[Google学者]·Zbl 0402.62058号
[33] Bingham博士,Chipman HA。模型选择的优化设计。技术计量学。2002;1-20. [Web of Science®],[Google学者]
[34] Chipman H、George EI、McCulloch RE等。贝叶斯模型选择的实际实现。讲座笔记专题系列。2001;38:65-134. [Crossref],[Google学者]
[35] Cox DR.接口。国际统计版本1984;52(1):1-24. [Crossref]、[Web of Science®]、[Google学者]
[36] R核心团队。R: 用于统计计算的语言和环境。R统计计算基金会;奥地利维也纳,2015年;可从以下位置获得:http://www.R-project.org/。[谷歌学者]
[37] Cao Y.使用贝叶斯广义线性模型检测与叶酸代谢相关的遗传和营养性肺癌风险因素[硕士论文]。德克萨斯大学公共卫生学院;2012.[谷歌学者]
[38] Tibshirani R.通过套索回归收缩和选择。J R Stat Soc Ser B方法。1996;58(1):267-288. [Crossref],[Google学者]·Zbl 0850.62538号
[39] Yang Y,Zou H。一种用于解决群法惩罚学习问题的快速统一算法。统计计算。2014;25(6):1-13. [Web of Science®],[Google学者]
[40] Breiman L、Friedman J、Stone CJ等。分类和回归树。博卡拉顿(佛罗里达州):CRC出版社;1984.[谷歌学者]·Zbl 0541.62042号
[41] Wilkinson AV、Waters AJ、Vasudevan V等。德克萨斯州休斯顿墨西哥籍青年吸烟易感性的相关性:横断面分析。BMC公共卫生。2008;8(1):337. [Crossref]、[PubMed]、[Google学者]
[42] Wilkinson AV、Spitz MR、Prokhorov AV等。在电影中接触吸烟图像,并在墨西哥传统青年中尝试吸烟。癌症流行生物标志物预防。2009;18(12):3435-3443. [Crossref]、[PubMed]、[Web of Science®]、[Google学者]
[43] Wilkinson AV,Bondy ML,Wu X等人,墨西哥裔青年的香烟实验:心理社会和遗传决定因素。癌症流行病学生物标志物预防。2012;21(1):228-238。[Crossref]、[PubMed]、[Web of Science®]、[Google学者]
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。