×

使用随机森林方法估计观测数据中的个体治疗效果。 (英语) Zbl 07498979号

小结:由于混淆和选择偏差的挑战,观察性数据中个体治疗效果的估计很复杂。解决这一问题的一个有用的推理框架是反事实(潜在结果)模型,该模型采取假设性的立场,即假设一个人收到了什么二者都治疗。利用反事实框架中的随机森林(RF),我们通过直接建模反应来评估个体治疗效果。我们发现,即使在复杂的非均质环境中,也可以准确估计个体治疗效果,但射频方法的类型对准确性起着重要作用。设计为适应混杂的方法,当与样本外估计并行使用时,效果最好。一种特别有前途的方法是反事实合成林。我们通过将这种新方法应用于一项大型的比较有效性试验,即Project-Aware,来说明药物使用在性风险中所起的作用。分析揭示了危险行为、吸毒和性风险之间的重要联系。本文的补充材料可在网上获得。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用
全文: DOI程序 链接

参考文献:

[1] Breiman,L.,《袋外估算》(1996)
[2] ---《随机森林,机器学习》,45,5-32(2001)·Zbl 1007.68152号
[3] Chipman,H。;McCulloch,R.,贝叶斯树:贝叶斯加性回归树,R包版本0.3-1.4(2016)
[4] Chipman,H.A。;E.I.乔治。;McCulloch,R.E.,BART:贝叶斯加性回归树,《应用统计年鉴》,4266-298(2010)·Zbl 1189.62066号
[5] Dasgupta,A。;Szymczak,S。;摩尔,J.H。;Bailey-Wilson,J.E。;Malley,J.D.,使用概率机器进行风险评估,生物数据挖掘,7,1(2014)
[6] 福斯特,J.C。;泰勒,J.M。;Ruberg,S.J.,《从随机临床试验数据中识别亚组》,《医学统计学》,第30期,第2867-2880页(2011年)
[7] Ghosh,D。;朱,Y。;Coffman,D.L.,《潜在结果框架中变量选择的惩罚回归程序》,《医学统计学》,341645-1658(2015)
[8] 埃尔南德斯,D。;Feaster,D.J。;古登,L。;Douaihy,A。;曼德勒,R。;埃里克森,S.J。;Kyle,T。;Haynes,L。;施瓦茨,R。;Das,M.,药物滥用治疗患者中自我报告的HIV和HCV筛查率和Serostatus,艾滋病与行为,20204-214(2016)
[9] Hill,J.L.,因果推断的贝叶斯非参数建模,计算与图形统计学杂志,20217-240(2011)
[10] Hirano,K。;Imbens,G.W。;Ridder,G.,使用估计倾向得分有效估计平均治疗效果,计量经济学,71,1161-1189(2003)·Zbl 1152.62328号
[11] Ishwaran,H。;Kogalur,U.,《生存、回归和分类的随机森林》(RF-SRC),R包2.2.0版(2016年)
[12] Ishwaran,H。;Kogalur,英国。;Blackstone,E.H。;Lauer,M.S.,《随机生存森林》,《应用统计年鉴》,2841-860(2008)·Zbl 1149.62331号
[13] Ishwaran,H。;Malley,J.D.,合成学习机器,生物数据挖掘,7,1(2014)
[14] 拉蒙特,A.E。;里昂,M。;Jaki,T.F。;斯图亚特,E。;Feaster,D。;Ishwaran,H。;塔玛拉特南,K。;Van Horn,M.L.,《随机临床试验中预测个体治疗效果(PITE)的识别》,《医学研究中的统计方法》(2016年)·doi:10.1177/0962280215623981
[15] Lee,B.K。;Lessler,J。;Stuart,E.A.,《使用机器学习改进倾向得分权重》,《医学统计学》,29,337-346(2010)
[16] Lunseford,J.K。;Davidian,M.,《通过倾向得分评估因果治疗效果的分层和加权:比较研究》,《医学统计学》,23,2937-2960(2004)
[17] Metsch,L.R。;Feaster,D.J。;古登,L。;沙克曼,B.R。;Matheson,T。;达斯,M。;戈登,M.R。;Huffaker,S。;Haynes,L.F。;Tross,S.,快速HIV检测降低风险咨询对获得性传播感染风险的影响:AWARE随机临床试验,美国医学协会杂志,3101701-1710(2013)
[18] 内曼,J。;Dabrowska,D。;斯皮德,T.,《概率论在农业实验中的应用》。原则论文。第9节,统计科学,5465-472(1990)·Zbl 0955.01560号
[19] Politis,D.N。;罗曼诺,J.P。;Wolf,M.,《次抽样:统计学中的斯普林格系列》(1999),柏林:斯普林格出版社,柏林·Zbl 0931.62035号
[20] 罗宾斯,J.M。;格陵兰,南部。;Hu,F.-C.,时间间隔暴露对重复二元结果边际平均值的因果影响估计,美国统计协会杂志,94687-700(1999)·Zbl 1072.62692号
[21] 罗森鲍姆,P.R。;Rubin,D.B.,《倾向评分在因果效应观察研究中的中心作用》,生物统计学,70,41-55(1983)·Zbl 0522.62091号
[22] 鲁宾,D.B.,在随机和非随机研究中估计治疗的因果效应,《教育心理学杂志》,66,688(1974)
[23] ---《因果效应的观察研究设计与分析:与随机试验设计的平行性》,《医学统计学》,2007年第26期,第20-36页
[24] 苏,X。;梅内塞斯,K。;麦克内斯,P。;Johnson,W.O.,《交互树:探索乳腺癌幸存者干预计划的差异效应》,《皇家统计学会杂志》,60,457-474(2011)
[25] 苏,X。;蔡,C.-L。;Wang,H。;Nickerson,D.M。;Li,B.,通过递归分区进行子群分析,机器学习研究杂志,10,141-158(2009)
[26] 唐,F。;Ishwaran,H.,《随机森林缺失数据算法、统计分析和数据挖掘》(2017)·Zbl 07260721号
[27] 特里科奇,P。;艾伦,J.M。;Kramer,J.M。;加州R.M。;Smith,S.C.,《ACC/AHA临床实践指南背后的科学证据》,美国医学会杂志,301,831-841(2009)
[28] Wager,S。;Athey,S.,《使用随机森林对异质性处理效果的估计和推断》,美国统计协会杂志(2017年)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。