×

因果中介分析:从简单到更稳健的策略,用于估计边际自然(in)直接影响。 (英语) Zbl 07649352号

摘要:本文旨在为因果中介分析的从业者提供对估计选项的更好理解。我们采用两种常见的策略(加权和基于模型的预测)和一种简单的组合方式(加权模型)作为输入,并展示了如何生成一系列具有不同建模要求和稳健性属性的估计量。主要目标是帮助建立对稳健估计的直观理解,这有助于合理的实践。我们通过可视化目标估计和估计策略来实现这一点。第二个目标是提供一个估算器“菜单”,从业者可以从中选择,以估算边际自然(间接)影响。从这项工作中产生的估计值包括一些与现有估计值一致或相似的估计值,以及其他一些以前没有出现在文献中的估计值。我们注意到基于加权函数的三种表达式来估计跨世界加权的权重的几种不同方法,包括一种新颖的方法;并展示如何检查产生的协变量和中介平衡。我们使用随机连续加权bootstrap来获得置信区间,并导出了估计量的一般渐近方差公式。利用青少年饮酒预防研究的数据说明了估计值。提供了R代码。

MSC公司:

62D20型 观察性研究的因果推断
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] ALBERT,J.M.(2012)。具有混杂的非线性模型的无分布中介分析。流行病学23 879-88. ·doi:10.1097/EDE.0b013e31826c2bb9
[2] DIDELZ,V.、DAWID,A.P.和GENEETTI,S.(2006)。序贯治疗的直接和间接影响。第22届人工智能不确定性会议记录138-146. AUAI出版社。
[3] EFRON,B.(1979年)。引导方法:又一次看折刀。统计年鉴11 1-26. ·Zbl 0406.62024号
[4] 格里弗,N.(2022)。钴:协变量平衡表和曲线图R软件包版本4.3.2。
[5] HAINMUELLER,J.(2012)。因果效应的熵平衡:一种在观察性研究中产生平衡样本的多变量重新加权方法。政治分析20 25-46. ·doi:10.1093/pan/mpr025
[6] 霍兰德,P.W.(1986)。统计学和因果推断。美国统计协会杂志81 945. ·兹比尔0607.62001 ·doi:10.2307/2289064
[7] HONG,G.(2010)。用于估计自然直接和间接影响的中介概率权重比率。美国统计协会会议记录,生物计量科2401-2415.
[8] HONG,G.、DEUTSCH,J.和HILL,H.D.(2015)。在存在治疗-中间人交互作用的情况下进行因果中介分析的中介概率比权重。教育与行为统计杂志40 307-340. ·数字对象标识代码:10.3102/1076998615583902
[9] HONG,G.,QIN,X.和YANG,F.(2018)。因果中介研究中基于权重的敏感性分析。教育与行为统计学杂志43 32-56. ·doi:10.3102/1076998617749561
[10] HONG,G.,YANG,F.和QIN,X.(2021)。因果中介研究中的治疗后困惑:一个切边问题和一个通过敏感性分析的新解决方案。 ·doi:10.48550/arXiv.2107.11014
[11] HONG,G.,YANG,F.和QIN,X.(2021)。你进行了敏感性分析吗?一种新的基于权重的方法,用于评估被治疗者的平均治疗效果。英国皇家统计学会杂志:A辑(社会统计)184 227-254. ·doi:10.1111/rssa.12621
[12] HUBER,M.(2014)。识别因果机制(主要)基于逆概率加权。应用计量经济学杂志29 920-943. ·doi:10.1002/jae.2341
[13] HUBER,M.(2020年)。调解分析。劳动、人力资源和人口经济学手册(K.F.Zimmermann编辑)施普林格。 ·doi:10.1007/978-3-319-57365-6_162-1
[14] HULING,J.D.和MAK,S.(2020年)。协变量分布的能量平衡。arXiv公司1-68.
[15] IMAI,K.、KEELE,L.和TINGLEY,D.(2010年)。因果调解分析的一般方法。心理学方法15 309-34. ·doi:10.1037/a0020761
[16] IMAI,K.、KEELE,L.和YAMAMOTO,T.(2010年)。因果调解效果的识别、推断和敏感性分析。统计科学25 51-71. ·Zbl 1328.62478号 ·doi:10.1214/10-STS321
[17] IMAI,K.和RATKOVIC,M.(2014)。协变量平衡倾向得分。英国皇家统计学会杂志。B系列:统计方法76 243-263. ·兹比尔1411.62025
[18] JACKSON,J.W.(2021年)。卫生公平研究中有意义的因果分解:通过加权框架进行定义、识别和估计。流行病学32 282-290. ·doi:10.1097/EDE.000000000001319
[19] KANG,J.D.Y.和SCHAFER,J.L.(2007)。双重稳健性的解密:从不完整数据估计总体平均数的替代策略的比较。统计科学22 523-539. ·Zbl 1246.62073号 ·doi:10.1214/07-sts227rej
[20] KONING,I.M.、VAN DEN EIJNDEN,R.J.、VERDURMEN,J.E.、ENGELS,R.C.和VOLLEBERGH,W.A.(2011年)。父母和学生干预对青少年饮酒的长期影响:一项集群随机对照试验。美国预防医学杂志40 541-547. ·doi:10.1016/j.amepre.2010.12.030
[21] KONING,I.M.,VAN DEN EIJNDEN,R.J.J.M.,ENGELS,R.C.M.E.,VERDURMEN,J.E.E.和VOLLEBERGH,W.A.M.(2010)。为什么将青少年和家长作为酒精预防的目标?自我控制、规则和饮酒态度的中介效应。上瘾106 538-46. ·文件编号:10.1111/j.1360-0443.2010.03198.x
[22] KONING,I.M.、VOLLEBERGH,W.A.M.、SMIT,F.、VERDURMEN,J.E.、VAN DEN EIJNDEN,R.J.J.M.和TER BOGT,T.F.M.,STATTIN,H.和ENGELS,R.C.M.E.(2009年)。预防青少年酗酒(PAS):父母和学生分别同时干预的集群随机试验。上瘾104 1669-78. ·文件编号:10.1111/j.1360-0443.2009.02677.x
[23] LANGE,T.、VANSTEELANDT,S.和BEKAERT,M.(2012年)。估算自然直接和间接影响的简单统一方法。美国流行病学杂志176 190-195. ·doi:10.1093/aje/kwr525
[24] MILES,C.、KANKI,P.、MELONI,S.和TCHETGEN,E.(2017年)。论自然间接效应的部分识别。因果推理杂志5. ·doi:10.1515/jci-2016-0004
[25] MUTHéN,B.O.和ASPAROUHOV,T.(2015)。中介建模中的因果效应:潜在变量应用简介。结构方程建模22 12-23. ·doi:10.1080/10705511.2014.935843
[26] NGUYEN,T.Q.、OGBURN,E.L.、SCHMID,I.、SARKER,E.B.、GREIFER,N.、KONING,I.M.和STUART,E.A.(2022年)。因果中介分析:从简单到更稳健的策略,用于估计边际自然(in)直接影响。arXiv:2102.06048. 版本3。
[27] NGUYEN,T.Q.、SCHMID,I.、OGBURN,E.L.和STUART,E.A.(2022年)。澄清因果调解分析:通过三个假设和五个潜在结果进行效果识别。因果推理杂志10 246-279. ·doi:10.1515/jci-2021-0049
[28] NGUYEN,T.Q.,SCHMID,I.和STUART,E.A.(2021)。澄清应用研究者的因果中介分析:根据我们想要学习的内容定义效果。心理学方法26 255-271. ·doi:10.1037/met0000299
[29] NOWOK,B.、RAAB,G.M.和DIBBEN,C.(2016)。synthpop:在R中定制合成数据的创建。统计软件杂志74 1-26. ·doi:10.18637/jss.v074.i11
[30] PEARL,J.(2001)。直接和间接影响。第十七届不确定性和人工智能会议记录411-420.
[31] PEARL,J.(2012)。因果调解公式——评估途径和机制的指南。预防科学13 426-36. ·doi:10.1007/s11121-011-0270-1
[32] QIN,X.和YANG,F.(2021)。因果中介研究的基于模拟的敏感性分析。心理学方法. ·doi:10.1037/met0000340
[33] ROBINS,J.、SUED,M.、LEI-GOMEZ,Q.和ROTNITZKY,A.(2007年)。评论:当“逆概率”权重高度可变时,双鲁棒估计的性能。统计科学22 544-559. ·Zbl 1246.62076号 ·doi:10.1214/07-STS227D
[34] Robins,J.M.和Greenland,S.(1992年)。直接和间接影响的可识别性和可交换性。流行病学3 143-155.
[35] ROBINS,J.M.、RICHARDSON,T.S.和SHPITSER,I.(2022)。调解分析的干预主义方法。概率推理与因果推理:朱迪娅·珀尔的作品第1版,第36 713-764页。美国纽约州纽约市计算机协会·Zbl 07672268号
[36] 罗森鲍姆,P.R.和鲁宾,D.B.(1983年)。倾向得分在因果效应观察研究中的中心作用。生物特征70 41. ·兹伯利0522.62091 ·doi:10.2307/2335942
[37] RUBIN,D.B.(1974年)。在随机和非随机研究中估计治疗的因果效应。教育心理学杂志66 688-701. ·doi:10.1037/h0037350
[38] STEEN,J.、LOEYS,T.、MOERKER,B.和VANSTEELANDT,S.(2017)。Medflex:使用自然效果模型进行灵活调解分析的R包。统计软件杂志76. ·doi:10.18637/jss.v076.i11
[39] STEFANSKI,L.A.和BOOS,D.D.(2002年)。M估计的演算。美国统计学家56 29-38. ·数字对象标识代码:10.1198/000313002753631330
[40] STEINGRIMSSON,J.A.、HANLEY,D.F.和ROSENBLUM,M.(2017年)。在没有回归模型假设的情况下,通过调整具有二元结果的随机试验中的预后基线变量来提高精确度。当代临床试验54 18-24. ·doi:10.1016/j.cct.2016.12.026
[41] SZéKELY,G.J.和RIZZO,M.L.(2013)。能量统计:一类基于距离的统计。统计规划与推理杂志143 1249-1272. ·兹比尔1278.62072 ·doi:10.1016/j.jspi.2013.03.018
[42] TCHETGEN TCHETGENE,J.(2013)。因果调解分析的逆比值加权估计。医学统计学32 4567-4580. ·数字对象标识代码:10.1002/sim.5864
[43] TCHETGEN-THETGEN,E.J.和SHPITSER,I.(2012)。因果中介分析的半参数理论:效率界限、多重稳健性和敏感性分析。统计年鉴40 1816-1845. ·Zbl 1257.62033号 ·doi:10.1214/12-AOS990
[44] TCHETGEN-THETGEN,E.J.和SHPITSER,I.(2014)。包含基线协变量的半参数自然直接效应模型的估计。生物特征101 849-864. ·Zbl 1306.62091号 ·doi:10.1093/biomet/asu044
[45] TINGLEY,D.、YAMAMOTO,T.、HIROSE,K.、KEELE,L.和IMAI,K.(2014年)。调解:用于因果调解分析的R包。统计软件杂志59 1-38. ·doi:10.18637/jss.v059.i05
[46] VALERI,L.和VANDERWEELE,T.J.(2013)。考虑暴露-测量者交互作用和因果解释的中介分析:理论假设和SAS和SPSS宏的实现。心理学方法18 137-150. ·数字对象标识代码:10.1037/a0031034
[47] van Buuren,S.和Groothuis Oudshoorn,K.(2011年)。小鼠:R中链式方程的多元插补。统计软件杂志45 1-67.
[48] VAN DER LAAN,M.J.和ROSE,S.(2011年)。目标学习:观察和实验数据的因果推断.统计学中的斯普林格系列纽约施普林格。
[49] VANDERWEELE,T.J.和VANSTEELANDT,S.(2009年)。关于调解、干预和组成的概念性问题。统计及其界面2 457-468. ·Zbl 1245.62177号
[50] VANDERWEELE,T.J.和VANSTEELANDT,S.(2010年)。二分法结果的中介分析的比值比。美国流行病学杂志172 1339-1348. ·doi:10.1093/aje/kwq332
[51] VANDERWEELE,T.J.和VANSTEELANDT,S.(2013年)。使用多个调解人进行调解分析。流行病学方法2 95-115. ·Zbl 1359.92009年9月 ·doi:10.1515/em-2012-0010
[52] VANDERWEELE,T.J.、VANSTEELANDT,S.和ROBINS,J.M.(2014)。暴露诱导介质-输出混淆条件下的效应分解。流行病学25 300-6. ·doi:10.1097/EDE.00000000000034
[53] VANSTEELANDT,S.、BEKAERT,M.和LANGE,T.(2012年)。用于估计自然直接和间接影响的推测策略。流行病学方法1 7. ·Zbl 1462.62076号 ·doi:10.1515/2161-962X.1014
[54] VANSTEELANDT,S.和KEIDING,N.(2011年)。邀请评论:G-computation-Lost in translation?美国流行病学杂志173 739-742. ·doi:10.1093/aje/kwq474
[55] WANG,B.、OGBURN,E.L.和ROSENBLUM,M.(2019年)。随机试验中的协方差分析:无模型假设,精确度更高,条件偏差更小,有效置信区间。生物计量学75 1391-1400. ·Zbl 1448.62115号 ·doi:10.1111/biom.13062
[56] WANG,L.和TCHETGEN TCHETGEN,E.(2018)。使用工具变量对平均治疗效果进行有界、有效和多重稳健估计。英国皇家统计学会杂志。B系列:统计方法80 531-550. ·Zbl 1398.62348号 ·doi:10.1111/rssb.12262
[57] WANG,Z.和LOUIS,T.A.(2003)。使用桥分布函数匹配二元随机截距模型中的条件形状和边缘形状。生物特征90 765-775. ·Zbl 1436.62294号 ·doi:10.1093/biomet/90.4.765
[58] WANG,Z.和LOUIS,T.A.(2004)。带有协变量相关随机效应和似然推断的边缘化二元混合效应模型。生物计量学60 884-891. ·Zbl 1274.62182号 ·doi:10.1111/j.0006-341X.2004.00243.x
[59] XU,L.、GOTWALT,C.、HONG,Y.、KING,C.B.和MEEKER,W.Q.(2020)。分数随机加权自举的应用。美国统计学家1305 1-32·Zbl 07593703号 ·doi:10.1080/00031305.2020.1731599
[60] ZHENG,W.和VAN DER LAAN,M.J.(2012)。自然直接影响的目标最大似然估计。国际生物统计学杂志8. ·doi:10.2202/1557-4679.1361
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。