×

使用连续尖峰和平板先验值进行高维混杂调整。 (英语) Zbl 1421.62066号

总结:在观察性研究中,对治疗结果的因果影响的估计依赖于对混杂因素的适当调整。如果潜在混杂因素的数量(p)大于观察值的数量(n),那么直接控制所有潜在混杂因素是不可行的。现有的降维和惩罚方法通常旨在预测结果,不太适合估计因果效应。在标准惩罚方法(例如拉索)下,如果变量(X_j)与治疗(T)密切相关,但与结果(Y)弱相关,则系数(beta_j)将缩小至零,从而导致混淆偏差。在结果和稀疏性的线性模型假设下,我们提出了对应于潜在混杂因素(X_j)的回归系数(\beta_j)上的连续尖峰和平板先验。具体来说,我们引入了一个先验分布,该先验分布不会将与(T)强相关但与(Y)弱相关的(X_j)s的系数((beta_j))严重收缩到零。我们将我们提出的方法与文献中提出的几种最先进的方法进行了比较。我们提出的方法具有以下特点:1)它减少了高维环境中的混淆偏差;2) 它向工具变量的零系数收缩;3)即使在小样本情况下,也能获得良好的覆盖率。我们将我们的方法应用于国家健康和营养检查调查(NHANES)数据,以评估持续农药暴露对甘油三酯水平的因果影响。

MSC公司:

62甲12 多元分析中的估计
62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Albert,J.H.和Chib,S.(1993年)。“二进制和多光子响应数据的贝叶斯分析”,《美国统计协会杂志》,88(422):669-679·Zbl 0774.62031号 ·doi:10.1080/01621459.1993.10476321
[2] Antonelli,J.、Cefalu,M.、Palmer,N.和Agniel,D.(2018年)。“高维混杂调整的双稳健匹配估计器”,《生物计量学》。
[3] Antonelli,J.、Parmigiani,G.和Dominici,F.(2018年)。“使用连续尖峰和平板先验值进行高维混杂调整”的补充材料贝叶斯分析·兹比尔1421.62066 ·doi:10.1214/18-BA1131
[4] Antonelli,J.、Zigler,C.和Dominici,F.(2017)。“在比较有效性研究中组合异质数据源时,指导性贝叶斯插补调整混杂因素。”《生物统计学》,18(3):553-568。
[5] Athey,S.、Imbens,G.W.和Wager,S.(2016)。“近似剩余平衡:高维平均治疗效果的去偏倚推断”。arXiv预印本arXiv:1604.07125·兹比尔1398.62194 ·doi:10.1111/rssb.12268
[6] Belloni,A.、Chernozhukov,V.、Fernández-Val,I.和Hansen,C.(2017)。“高维数据的程序评估和因果推断”,《计量经济学》,85(1):233-298·Zbl 1410.62197号 ·doi:10.3982/ECTA12723
[7] Belloni,A.、Chernozhukov,V.和Hansen,C.(2014)。“在高维对照中选择后对治疗效果的推断”,《经济研究评论》,81(2):608-650·Zbl 1409.62142号 ·doi:10.1093/restud/rdt044
[8] Bhattacharya,A.、Pati,D.、Pillai,N.S.和Dunson,D.B.(2015)。“Dirichlet-Laplace最优收缩的先验值”,《美国统计协会杂志》,110(512):1479-1490·Zbl 1373.62368号 ·doi:10.1080/01621459.2014.960967
[9] Carvalho,C.M.、Polson,N.G.和Scott,J.G.(2010年)。“稀疏信号的马蹄形估计器”,《生物统计学》,asq017·Zbl 1406.62021号 ·doi:10.1093/biomet/asq017
[10] Casella,G.(2001)。经验贝叶斯-吉布斯抽样〉,《生物统计学》,2(4):485-500·Zbl 1097.62505号 ·doi:10.1093/biostatistics/2.4.485
[11] Cefalu,M.、Dominici,F.、Arvold,N.和Parmigiani,G.(2016)。“模型平均双稳健估计”。《生物计量学》·Zbl 1372.62058号 ·doi:10.1111/biom.12622
[12] Crainiceanu,C.M.、Dominici,F.和Parmigiani,G.(2008)。“效果评估中的调整不确定性”,《生物特征》,95(3):635-651·Zbl 1437.62433号 ·doi:10.1093/biomet/asn015
[13] De Luna,X.、Waernbaum,I.和Richardson,T.S.(2011年)。“平均治疗效果非参数估计的协变量选择”,Biometrika,asr041·Zbl 1228.62139号 ·doi:10.1093/biomet/asr041
[14] Ertefaie,A.、Asgharian,M.和Stephens,D.(2015)。“使用同时惩罚方法进行因果推理中的变量选择”,arXiv预印本arXiv:1511.08501。
[15] Fan,J.和Li,R.(2001)。“通过非认证惩罚可能性及其预言属性进行变量选择”,《美国统计协会期刊》,96(456):1348-1360·Zbl 1073.62547号 ·doi:10.1198/016214501753382273
[16] Farrell,M.H.(2015)。“用可能比观察值更多的协变量对平均治疗效果进行稳健推断”,《计量经济学杂志》,189(1):1-23·Zbl 1337.62113号 ·doi:10.1016/j.econom.2015.06.017
[17] Gelman,A.、Carlin,J.B.、Stern,H.S.和Rubin,D.B.(2014)。贝叶斯数据分析,第2卷。查普曼和霍尔/CRC博卡拉顿,佛罗里达州,美国·Zbl 1279.62004号
[18] George,E.I.和McCulloch,R.E.(1993)。“通过吉布斯抽样进行变量选择”,《美国统计协会杂志》,88(423):881-889。
[19] Hahn,P.R.、Carvalho,C.和Puelz,D.(2016)。“从观测数据估计治疗效果的贝叶斯正则回归”,见SSRN。
[20] Hahn,P.R.、Murray,J.S.和Carvalho,C.(2017年)。因果推断的贝叶斯回归树模型:正则化、混淆和异质效应〉,arXiv预印本arXiv:1706.09523·Zbl 1475.62102号
[21] Liao,S.和Zigler,C.(2018)。“两阶段贝叶斯倾向得分分析设计阶段的不确定性”,arXiv预印本arXiv:1809.05038。
[22] Little,R.J.和Rubin,D.B.(2000年)。“通过潜在结果在临床和流行病学研究中的因果关系:概念和分析方法”,《公共卫生年度回顾》,21(1):121-145。
[23] Lockhart,R.、Taylor,J.、Tibshirani,R.J.和Tibshilani,R(2014)。“套索的显著性检验”,《统计年鉴》,42(2):413·Zbl 1305.62254号 ·数字对象标识码:10.1214/14-AOS1175REJ
[24] Louis,B.、Germaine,M.和Sundaram,R.(2012)。“开放:变革性研究的时代”,《医学统计》,31(22):2569-2575。
[25] Park,T.和Casella,G.(2008)。“贝叶斯套索”,《美国统计协会杂志》,103(482):681-686·Zbl 1330.62292号 ·doi:10.1198/016214500000037
[26] Patel,C.J.、Bhattacharya,J.和Butte,A.J.(2010年)。“关于2型糖尿病的环境范围关联研究(EWAS)”,《公共科学图书馆·综合》,5(5):e10746。
[27] Patel,C.J.、Cullen,M.R.、Ioanidis,J.P.和Butte,A.J.(2012)。“环境因素的系统评估:持久性污染物和营养素与血脂水平相关”,《国际流行病学杂志》,41(3):828-843。
[28] Patel,C.J.和Ioannidis,J.P.(2014)。“大规模研究难以捉摸的环境”,Jama,311(21):2173-2174。
[29] Patel,C.J.、Pho,N.、McDuffie,M.、Easton-Marks,J.、Kothari,C.、Kohane,I.S.和Avillach,P.(2016)。“美国国家健康和营养检查调查的人类暴露和现象数据库。”科学数据,3。
[30] Pearl,J.(2011)。“受邀评论:理解偏见放大”,《美国流行病学杂志》,174(11):1223-1227。
[31] Ročková,V.和George,E.I.(2016)。《钉子和实验室套索》,《美国统计协会杂志》(刚刚接受)·Zbl 1398.62186号
[32] Rosenbaum,P.R.和Rubin,D.B.(1983年)。“倾向评分在因果效应观察性研究中的中心作用”,《生物统计学》,70(1):41-55·Zbl 0522.62091号 ·doi:10.1093/biomet/70.1.41
[33] Rubin,D.B.等人(1981年)。《贝叶斯自助法》,《统计年鉴》,9(1):130-134。
[34] Rubin,D.B.等人(2008年)。“对于客观的因果推断,设计胜过分析。”《应用统计学年鉴》,2(3):808-840·兹比尔1149.62089 ·doi:10.1214/08-AOAS187
[35] Scott,J.G.、Berger,J.O.等人(2010年)。“变量选择问题中的贝叶斯和经验贝叶斯多重性调整”,《统计年鉴》,38(5):2587-2619·Zbl 1200.62020年 ·doi:10.1214/10-AOS792
[36] Shortreed,S.M.和Ertefaie,A.(2017年)。“结果适应套索:因果推理的变量选择”,《生物计量学》·Zbl 1405.62203号 ·doi:10.1111/biom.12679
[37] Talbot,D.、Lefebvre,G.和Atherton,J.(2015)。“贝叶斯因果效应估计算法”,《因果推理杂志》,3(2):207-236。
[38] Taylor,J.和Tibshirani,R.(2016)。“l1惩罚似然模型的选择后推断”,arXiv预印本arXiv:1602.07358·Zbl 1466.62372号
[39] Tibshirani,R.(1996)。《回归收缩与套索选择》,《皇家统计学会杂志》。B系列(方法学),267-288·Zbl 0850.62538号 ·doi:10.1111/j.2517-6161.1996.tb02080.x
[40] van der Laan,M.J.和Gruber,S.(2010年)。“协同双稳健目标最大似然估计”,国际生物统计学杂志,6(1)。
[41] Vansteelandt,S.、Bekaert,M.和Claeskens,G.(2012年)。“关于因果推理中的模型选择和模型指定错误”,《医学研究中的统计方法》,21(1):7-30·Zbl 1365.62431号 ·doi:10.1177/0962280210387717
[42] Wang,C.、Dominici,F.、Parmigiani,G.和Zigler,C.M.(2015)。“在估计广义线性模型中的平均因果效应时,考虑混杂因素和效应修正因子选择的不确定性。”《生物计量学》,71(3):654-665·Zbl 1419.62468号 ·doi:10.1111/biom.12315
[43] Wang,C.、Parmigiani,G.和Dominici,F.(2012年)。“贝叶斯效应估计对调整不确定性的解释”,《生物计量学》,68(3):661-671·Zbl 1274.62895号 ·doi:10.1111/j.1541-0420.2011.01731.x
[44] Watanabe,S.(2010年)。“贝叶斯交叉验证的渐近等价性和奇异学习理论中广泛适用的信息准则”,《机器学习研究杂志》,11(12月):3571-3594·Zbl 1242.62024号
[45] Wild,C.P.(2005)。“用“exposome”补充基因组:分子流行病学中环境暴露测量的突出挑战。”癌症流行病学生物标志物与预防,14(8):1847-1850。
[46] Wilson,A.和Reich,B.J.(2014)。“通过受惩罚的可信区域进行混淆选择。”《生物计量学》,70(4):852-861·兹比尔1393.62107 ·doi:10.1111/biom.12203
[47] Zhou,J.、Bhattacharya,A.、Herring,A.H.和Dunson,D.B.(2015)。“大型稀疏张量的贝叶斯因子分解”,《美国统计协会杂志》,110(512):1562-1576。统一资源定位地址http://www.tandfonline.com/doi/abs/10.1080/01621459.2014.983233#.VNQ2p1WUd5k。 ·Zbl 1373.62282号 ·doi:10.1080/01621459.2014.983233
[48] Zigler,C.M.和Dominici,F.(2014)。“倾向得分估计的不确定性:变量选择的贝叶斯方法和模型平均因果效应”,《美国统计协会杂志》,109(505):95-107。
[49] 邹华(2006)。“自适应套索及其预言属性”,《美国统计协会期刊》,101(476):1418-1429·Zbl 1171.62326号 ·doi:10.1198/016214500000735
[50] Zou,H.和Hastie,T.(2005)。《通过弹性网进行规则化和变量选择》,《皇家统计学会期刊:B辑(统计方法)》,67(2):301-320·Zbl 1069.62054号 ·doi:10.1111/j.1467-9868.2005.00503.x
[51] Zubizarreta,J.R.(2015)。“平衡不完全结果数据估计协变量的稳定权重”,《美国统计协会杂志》,110(511):910-922·兹比尔1373.62051 ·doi:10.1080/01621459.2015.1023805
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。