×

具有双重鲁棒性的条件平均治疗效果估计的增强直接学习。 (英语) Zbl 07556938号

摘要:推断非均质处理效果是许多应用中的一个基本问题。在本文中,我们重点评估了条件平均治疗效果(CATE),即给定协变量的治疗之间的条件平均结果差异。传统上,基于Q-Learning的方法估计每个条件平均结果。然而,它们可能会出现型号错误。最近,已经提出了在没有结果模型规范的情况下直接学习(D-Learning)CATE的灵活的一步方法。然而,他们需要一个倾向得分的规范。我们提出稳健直接学习(RD-learning)来增强D-learning,从而实现治疗效果的双重稳健估计。如果正确指定了主效应模型或倾向得分模型,我们的CATE估计量的一致性将得到保证。该框架既可以用于二进制设置,也可以用于多rm设置,它足够通用,可以允许不同的功能空间,并结合不同的通用学习算法。在线性和非线性设置下,我们使用统计学习理论对CATE估计器的预测误差进行了深入的理论分析。我们提出的方法的有效性通过仿真研究和一个艾滋病临床试验研究的实际数据示例进行了验证。

MSC公司:

62-XX年 统计
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] ATHEY,S.和IMBENS,G.(2016)。异质因果效应的递归划分。美国国家科学院院刊113 7353-7360. ·Zbl 1357.62190号
[2] BANG,H.和ROBINS,J.M.(2005)。缺失数据和因果推理模型中的双重稳健估计。生物识别61 962-973. ·Zbl 1087.62121号
[3] BEYGELZIMER,A.和LANGFORD,J.(2009)。使用部分标签进行学习的偏移树。第15届ACM SIGKDD知识发现和数据挖掘国际会议记录129-138.
[4] BONETTI,M.和GELBER,R.D.(2004年)。临床试验中患者亚群的治疗效果模式。生物统计学5 465-481. ·Zbl 1154.62384号
[5] BOTTOU,L.,PETERS,J.,QUIñONERO-CANDELA,J.、CHARLES,D.X.、CHICKERING,D.M.、PORTUGALY,E.、RAY,D.、SIMARD,P.和SNELSON,E.(2013)。反事实推理和学习系统:计算广告的例子。机器学习研究杂志14 3207-3260. ·兹比尔1318.62206
[6] CAO,W.、TSIATIS,A.A.和DAVIDIAN,M.(2009)。改进不完全数据总体均值的双稳健估计的效率和鲁棒性。生物特征96 723-734. ·Zbl 1170.62007年
[7] CHATTERJEE,S.(2013)。套索的假设一致性。arXiv预打印arXiv:1303.5817。
[8] Chen,S.、Tian,L.、Cai,T.和Yu,M.(2017)。亚组识别和比较治疗评分的通用统计框架。生物识别73 1199-1209. ·Zbl 1405.62164号 ·doi:10.1111/biom.12676
[9] CHIPMAN,H.A.、GEORGE,E.I.和MCCULLOCH,R.E.(2010年)。BART:贝叶斯加性回归树。应用统计学年鉴4 266-298. ·Zbl 1189.62066号
[10] DALALYAN,A.S.、HEBIRI,M.、LEDERER,J.等人(2017年)。关于套索的预测性能。伯努利23 552-581. ·兹比尔1359.62295
[11] DUDíK,M.、LANGFORD,J.和LI,L.(2011)。强有力的政策评估和学习。arXiv预打印arXiv:1103.4601·Zbl 1331.62059号
[12] FAN,C.、LU,W.、SONG,R.和ZHOU,Y.(2017)。一致性辅助学习用于评估最佳个体化治疗方案。英国皇家统计学会杂志:B辑(统计方法)79 1565-1582. ·Zbl 1381.62097号
[13] FAN,J.、IMAI,K.、LIU,H.、NING,Y.和YANG,X.(2016)。提高协变量平衡倾向得分:一种双重稳健和有效的方法,普林斯顿大学技术报告,技术报告。
[14] HAHN,P.R.、MURRAY,J.S.和CARVALHO,C.M.(2020年)。因果推断的贝叶斯回归树模型:正则化、混淆和异质效应。贝叶斯分析. ·Zbl 1475.62102号
[15] HAMMER,S.M.、KATZENSTEIN,D.A.、HUGHES,M.D.、GUNDACKER,H.、SCHOOLEY,R.T.、HAUBRICH,R.H.、HENRY,W.K.、LEDERMAN,M.M.等人(1996年)。一项对CD4细胞计数为每立方毫米200到500个艾滋病毒感染成人进行核苷单药治疗和联合治疗的对比试验。新英格兰医学杂志335 1081-1090.
[16] HILL,J.L.(2011)。因果推理的贝叶斯非参数建模。计算与图形统计杂志20 217-240.
[17] HOFMANN,T.、SCHLKOPF,B.和SMOLA,A.J.(2008)。机器学习中的核心方法。统计年鉴1171-1220之间·Zbl 1151.30007号
[18] IMBENS,G.W.和RUBIN,D.B.(2015)。统计、社会和生物医学科学中的因果推理剑桥大学出版社·Zbl 1355.6202号
[19] JOHANSSON,F.、SHALIT,U.和SONTAG,D.(2016)。学习反事实推理的表征。机器学习国际会议3020-3029.
[20] KANG,J.D.和SCHAFER,J.L.(2007)。双重稳健性的解密:从不完整数据估计总体平均值的替代策略的比较。统计科学22 523-539. ·Zbl 1246.62073号
[21] KNAUS,M.C.、LECHNER,M.和STRITTMATTER,A.(2020年)。异质因果效应的机器学习估计:经验蒙特卡罗证据。计量经济学杂志.utaa014·兹伯利07546390 ·doi:10.1093/ectj/utaa014
[22] Kosorok,M.R.和Laber,E.B.(2019年)。精准医疗。统计年审及其应用6 263-286.
[23] KüNZEL,S.R.、SEKHON,J.S.、BICKEL,P.J.和YU,B.(2019年)。使用机器学习评估异质治疗效果的元学习者。国家科学院学报116 4156-4165.
[24] MOODIE,E.E.、DEAN,N.和SUN,Y.R.(2014)。Q-learning:灵活学习实用工具。生物科学统计6 223-243.
[25] Murphy,S.A.(2003年)。最佳动态治疗方案。英国皇家统计学会杂志:B辑(统计方法)65 331-355. ·Zbl 1065.62006号
[26] MURPHY,S.A.、VAN DER LAAN,M.J.、ROBINS,J.M.和GROUP,C.P.P.R.(2001)。动态状态的边际平均模型。美国统计协会杂志96 1410-1423. ·Zbl 1051.62114号
[27] NIE,X.和WAGER,S.(2017年)。非均匀处理效应的准有序估计。arXiv预印本arXiv:1712.04912·Zbl 07458256号
[28] POWERS,S.、QIAN,J.、JUNG,K.、SCHULER,A.、SHAH,N.H.、HASTIE,T.和TIBSHIRANI,R.(2018)。高维非均质处理效果估算的一些方法。医学统计学37 1767-1787年。
[29] QI,Z.,LIU,D.,FU,H.和LIU,Y.(2019)。基于多臂角度的直接学习,用于估计具有不同结果的最佳个体化治疗规则。美国统计协会杂志1-33. ·Zbl 1445.62286号
[30] QI,Z.和LIU,Y.(2018)。D-学习估计最佳个人治疗规则。电子统计杂志12 3601-3638. ·Zbl 1454.62381号
[31] QIAN,M.和MURPHY,S.A.(2011年)。个性化治疗规则的性能保证。统计学年鉴39 1180. ·Zbl 1216.62178号
[32] 罗宾斯,J.M.(2004)。最优序列决策的最优结构嵌套模型。第二届西雅图生物统计学研讨会论文集189-326. 斯普林格·Zbl 1279.62024号
[33] ROBINS,J.M.、ROTNITZKY,A.和ZHAO,L.P.(1994)。当某些回归变量不总是被观测时,回归系数的估计。美国统计协会杂志89 846-866. ·Zbl 0815.62043号
[34] ROBINSON,P.M.(1988)。根N一致半参数回归。计量经济学:计量经济学社会杂志931-954. ·Zbl 0647.62100号
[35] Rosenbaum,P.R.和Rubin,D.B.(1983年)。倾向评分在因果效应观察性研究中的中心作用。生物特征70 41-55. ·Zbl 0522.62091号 ·doi:10.1093/biomet/70.1.41
[36] ROYSTON,P.和SAUERBREI,W.(2008)。治疗和持续协变量之间的相互作用:走向个性化治疗的一步·Zbl 1269.62053号
[37] RUBIN,D.B.(1974年)。在随机和非随机研究中估计治疗的因果效应。教育心理学杂志66 688。
[38] SCHOLKOPF,B.和SMOLA,A.J.(2001)。使用内核学习:支持向量机、正则化、优化及其他麻省理工学院出版社。
[39] SCHULZ,J.和MOODIE,E.E.(2021年)。最佳给药策略的双重稳健估计。美国统计协会杂志116 256-268. ·Zbl 1457.62372号
[40] 史C.、宋R.和卢W.(2016)。具有NP维的最优治疗决策的鲁棒学习。电子统计杂志10 2894. ·Zbl 1419.62445号
[41] SIGNOROVITCH,J.E.(2007)。在高维基因组数据和临床试验中识别信息丰富的生物标记,哈佛大学博士论文。
[42] STEINWART,I.和SCOVEL,C.(2007)。使用高斯核的支持向量机的快速速率。统计年鉴35 575-607. ·Zbl 1127.68091号
[43] SU,X.,TSAI,C.-L.,WANG,H.,NICKERSON,D.M.和LI,B.(2009)。通过递归分区进行子群分析。机器学习研究杂志10
[44] TADDY,M.、GARDNER,M.,CHEN,L.和DRAPER,D.(2016)。数字实验中异质治疗效应的非参数贝叶斯分析。商业与经济统计杂志34 661-672.
[45] Tian,L.、Alizadeh,A.A.、Gentles,A.J.和Tibshirani,R.(2014)。一种估算治疗与大量协变量之间相互作用的简单方法。美国统计协会杂志109 1517-1532. ·Zbl 1368.62294号
[46] TREVOR,H.、ROBERT,T.和JH,F.(2009年)。统计学习的要素:数据挖掘、推理和预测·Zbl 1273.62005年
[47] TURNEY,K.和WILDEMAN,C.(2015)。对一些人有害吗?母亲监禁对儿童福祉的异质性影响。犯罪学与公共政策14 125-156.
[48] VAART,A.W.和WELLNER,J.A.(1996)。弱收敛和经验过程:及其在统计学中的应用施普林格·Zbl 0862.60002号
[49] WAGER,S.和ATHEY,S.(2018年)。使用随机森林评估和推断异质处理效果。美国统计协会杂志113 1228-1242·Zbl 1402.62056号
[50] WAHBA,G.(1990年)。观测数据的样条模型59.暹罗。
[51] WALLACE,M.P.和MOODIE,E.E.(2015)。通过加权最小二乘法进行双重稳健的动态治疗方案估计。生物识别71 636-644. ·Zbl 1419.62467号
[52] WANG,B.和ZOU,H.(2018)。再次审视距离加权歧视。英国皇家统计学会杂志:B辑(统计方法)80 177-198. ·Zbl 1380.62028号
[53] WANG,L.和SHEN,X.(2007)。关于L1-形式多类支持向量机:方法和理论。美国统计协会杂志102 583-594. ·Zbl 1172.62317号
[54] WATKINS,C.J.和DAYAN,P.(1992年)。Q学习。机器学习8 279-292. ·Zbl 0773.68062号
[55] WEISBERG,H.I.和PONTES,V.P.(2015)。临床试验中的事后分组:分析还是分析?临床试验12 357-364.
[56] ZHANG,B.、TSIATIS,A.A.、LABER,E.B.和DAVIDIAN,M.(2012)。估计最佳治疗方案的稳健方法。生物识别68 1010-1018. ·Zbl 1258.62116号
[57] ZHANG,B.、TSIATIS,A.A.、LABER,E.B.和DAVIDIAN,M.(2013)。序列治疗决策的最佳动态治疗方案的稳健估计。生物特征100 681-694. ·Zbl 1284.62508号
[58] ZHANG,C.,CHEN,J.,FU,H.,HE,X.,ZHAO,Y.和LIU,Y.(2018)。基于多类别结果加权边际学习的个体化治疗规则评估。中国统计局. ·Zbl 1464.62481号
[59] ZHANG,C.和LIU,Y.(2014)。基于多类别角度的大边缘分类。生物特征101 625-640. ·Zbl 1335.62110号
[60] ZHANG,C.,LIU,Y.和WU,Y.(2016)。数据稀疏约束下再生核Hilbert空间的分位数回归。机器学习研究杂志17 1374-1418之间·Zbl 1360.62201号
[61] Zhao,Y.、Zeng,D.、Rush,A.J.和Kosorok,M.R.(2012)。使用结果加权学习评估个体化治疗规则。美国统计协会杂志107 1106-1118. ·兹比尔1443.62396
[62] 赵义清、LABER、E.B.、NING、Y.、SAHA、S.和SANDS、B.E.(2019)。利用观察数据对个体化治疗规则进行有效的强化和放松学习。机器学习研究杂志20 1-23. ·Zbl 1484.62130号
[63] 赵义清、曾德华、LABER、E.B.、SONG,R.、YUAN,M.和KOSOROK,M.R.(2014)。利用删失数据估计个体化治疗的双重稳健学习。生物特征102 151-168. ·Zbl 1345.62092号
[64] Zhou,X.、Mayer-Hamblett,N.、Khan,U.和Kosorok,M.R.(2017年)。残差加权学习用于估计个体化治疗规则。美国统计协会杂志112 169-187年。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。