吴鹏;韩、沙沙;童兴伟;李润泽 治疗异质性因果推断的倾向评分回归。 (英语) Zbl 07832544号 统计正弦。 34,第2期,747-769(2024). 总结:了解治疗效果如何在几个关键特征上变化,在个性化医疗实践中至关重要。在这种情况下,通常需要对这些条件平均治疗效果进行非参数估计。然而,由于此类估计的计算困难,可用的方法很少。此外,现有的非参数方法,如逆概率加权方法,在倾向得分的值接近于零或一时,存在着限制其使用的局限性。我们提出了一种倾向得分回归(PSR)方法,该方法允许在广泛的背景下对这种条件平均治疗效果进行非参数估计。PSR由两个非参数回归组成。首先,它对倾向得分和兴趣特征进行回归,以获得中间估计值。然后,仅对利息特征的中间估计进行回归。通过以非参数的方式将倾向得分作为回归变量,PSR大大降低了计算难度,同时对倾向得分的值不太敏感。我们给出了它的几个吸引人的性质,包括一致性和渐近正态性。特别地,我们证明了显式方差估计的存在性,我们用它来评估PSR的分析行为及其精度。我们的模拟研究结果表明,在各种倾向得分极值的情况下,PSR优于现有方法。我们将我们的方法应用于2009年全国流感调查(NHFS)数据,以调查季节性流感疫苗接种和不同年龄组带薪病假的影响。 MSC公司: 62至XX 统计 关键词:非均匀处理效应;高维协变量;非参数估计;倾向得分 软件:科恩平滑;净现值 PDF格式BibTeX公司 XML格式引用 \textit{P.Wu}等人,Stat.Sin。34,第2号,747--769(2024;Zbl 07832544) 全文: 内政部 arXiv公司 参考文献: [1] Abrevaya,J.、Hus,Y.C.和Lieli,R.P.(2015)。估计条件平均治疗效果。《商业与经济统计杂志》33,485-505。 [2] Aitchison,J.和Aitken,C.(1976年)。用核方法进行多元二元判别。生物特征63,413-420·Zbl 0344.62035号 [3] Burger,A.E.、Reither,E.N.、Mamelond,S.-E.和Lim,S.(2021年)。美国成年人2009年H1N1疫苗接种的黑白差异:新冠肺炎疫情的警示故事。疫苗39、943-951。 [4] 疾病控制和预防中心(2010a)。中期结果:2009年美国2009年10月至2010年1月的州特异性甲型H1N1流感单价疫苗接种覆盖率。疾病控制和预防中心。 [5] 疾病控制和预防中心(2010年b)。2009年全国H1N1流感调查问卷【2010年第一季度】。疾病控制和预防中心。 [6] Deiss,R.G.、Arnold,J.C.、Chen,W.-J.、Echols,S.、Fairchok,M.P.、Schofield,C.等人(2015)。A/H3N2型流感患者与疫苗相关的症状严重程度降低。疫苗33,7160-7167。 [7] Ding,H.、Santibanez,T.A.、Jamieson,D.J.、Weinbaum,C.M.、Euler,G.L.、Grohskopf,L.A.等人(2011年)。孕妇流感疫苗接种覆盖率——2009年全国H1N1流感调查(NHFS)。美国妇产科杂志204,96-106。 [8] Ding,P.和Miratrix,L.W.(2015a)。对珀尔教授评论的回复。因果推理杂志3,251-252。 [9] Ding,P.和Miratrix,L.W.(2015b)。调整还是不调整?M-bias和butterfly-bias的敏感性分析。因果推理期刊3,41-57。 [10] Fan,J.和Gijbels,I.(1996年)。局部多项式建模及其应用。查普曼和霍尔/CRC·Zbl 0873.62037号 [11] Fan,J.和Yao,Q.W.(1998)。随机回归中条件方差函数的有效估计。生物特征85,645-660·Zbl 0918.62065号 [12] Fan,J.和Zhang,W.(1999)。变系数模型中的统计估计。《统计年鉴》第27期,1491-1518年·Zbl 0977.62039号 [13] Fan,Q.,Hsu,Y.C.,Lieli,R.P.和Zhang,Y.(2022)。用高维数据估计条件平均治疗效果。《商业与经济统计杂志》40,313-327。 [14] Gu,L.和Yang,L.(2015)。同时置信带的单指标链路函数的口头有效估计。《电子统计杂志》9,1540-1561·Zbl 1327.62254号 [15] Hahn,J.(1998)。关于倾向得分在平均治疗效果有效半参数估计中的作用。《计量经济学》66,315-331·Zbl 1055.62572号 [16] Härdle,W.、Spokoiny,V.和Sperlich,S.(1997)。半参数单指数与固定链接函数建模。《统计年鉴》25212-243·兹比尔0869.62033 [17] Hastie,T.和Tibshirani,R.(1993年)。变系数模型。英国皇家统计学会杂志,B辑(统计方法)55,757-796·Zbl 0796.62060号 [18] Horowitz,J.L.和Härdle,W.(1996)。具有离散协变量的单指标模型的直接半参数估计。《美国统计协会杂志》91,1632-1640·Zbl 0881.62037号 [19] Huang,M.Y.和Chan,K.C.G.(2017年)。联合充分降维和估计条件和平均治疗效果。生物计量学104583-596·Zbl 07072229号 [20] Ichimur,H.(1993)。单指标模型的半参数最小二乘(SLS)和加权SLS估计。《计量经济学杂志》58,71-120·Zbl 0816.62079号 [21] Imai,K.和Ratkovic,M.(2014)。协变量平衡倾向得分。英国皇家统计学会杂志,B辑(统计方法)76,243-263·Zbl 1411.62025号 [22] Imai,K.和Strauss,A.(2011年)。根据随机实验评估异质治疗效果,并应用于“走出去”运动的最佳规划。政治分析19,1-19。 [23] Imbens,G.W.和Rubin,D.B.(2015)。统计、社会和生物医学科学的因果推断。剑桥大学出版社·Zbl 1355.6202号 [24] Kang,J.D.和Schafer,J.L.(2007)。双重稳健性的解密:从不完整数据估计总体平均值的替代策略的比较。统计科学22,523-539·Zbl 1246.62073号 [25] Kent,D.M.、Steyerberg,E.和van Klaveren,D.(2018年)。个性化循证医学:异质治疗效果的预测方法。英国医学杂志363,k4245。 [26] Klein,R.和Spady,R.H.(1993)。二元响应模型的有效半参数估计。《计量经济学》61,387-421·Zbl 0783.62100号 [27] Lechner,M.(2019)。用于估计异质因果效应的改良因果森林。arXiv:1812.09487。 [28] Lee,S.、Okui,R.和Whang,Y.J.(2017)。条件平均处理效应函数的双稳健一致置信带。应用计量经济学杂志32,1207-1225。 [29] Li,Q.和Racine,J.S.(2007)。非参数计量经济学。普林斯顿大学出版社·Zbl 1183.62200号 [30] Li,Q.和Racine,J.S.(2010年)。定性和定量数据的平滑变系数估计和推断。生态计量理论261607-1637·兹比尔1230.62053 [31] Little,R.和An,H.(2004)。基于稳健似然分析的缺失值多元数据。《中国统计》第14期,949-968页·Zbl 1073.62050 [32] Mammen,E.、Rothe,C.和Schienle,M.(2012年)。具有非参数生成协变量的非参数回归。《统计年鉴》40,1132-1170·Zbl 1274.62294号 [33] Nie,X.和Wager,S.(2021)。非均匀处理效应的准有序估计。生物特征108、299-319·Zbl 07458256号 [34] Ning,Y.、Sida,P.和Imai,K.(2020年)。通过高维协变量平衡倾向得分稳健估计因果效应。生物特征107,533-554·Zbl 1451.62050 [35] Pearl,J.(2015)。评论丁和米拉特里克斯:“调整还是不调整?”。因果推理杂志3,59-60。 [36] Racine,J.S.和Hayfield,T.(2021)。np:混合数据类型的非参数核平滑方法。网状物:https://CRAN.R-project.org/package=np。 [37] 罗森鲍姆(2002)。观察研究。斯普林格·兹伯利0985.62091 [38] Rosenbaum,P.R.和Rubin,D.B.(1983年)。倾向评分在因果效应观察性研究中的中心作用。生物特征70,41-55·Zbl 0522.62091号 [39] Rotnitzky,A.和Vansteelandt,S.(2014)。双半身像方法,185-212。《缺失数据方法手册》。CRC出版社,博卡拉顿。 [40] 鲁宾,D.B.(1974)。在随机和非随机研究中估计治疗的因果效应。《教育心理学杂志》66,688-701。 [41] 鲁宾,D.B.(1980)。对“实验数据的R随机化分析”的评论。《美国统计协会杂志》75,591-593。 [42] Rubin,D.B.(2001)。使用倾向评分帮助设计观察研究:在烟草诉讼中的应用。卫生服务和结果研究方法2,169-188。 [43] Rubin,D.B.(2009)。观察性研究的设计是否应允许各治疗组之间的协变量分布缺乏平衡?《医学统计》第28期,1420-1423年。 [44] Ruppert,D.、Sheather,S.J.和Wand,M.P.(1995年)。局部最小二乘回归的有效带宽选择器。《美国统计协会杂志》90,1257-1270·Zbl 0868.62034号 [45] Sato,M.、Singh,J.、Takemori,S.、Sonoda,T.、Zhang,Q.和Ohkuma,T.(2019年)。基于提升的推荐人评估和优化。第13届ACM推荐系统会议记录,296-304。 [46] Seaman,S.R.和Vansteelandt,S.(2018年)。介绍不完全数据的双重稳健方法。统计科学33184-197·Zbl 1397.62176号 [47] Semenova,V.和Chernozhukov,V.(2021)。借方机器学习的条件平均处理效果和其他因果函数。《计量经济学杂志》24,264-289·Zbl 07546401号 [48] Smith,T.W.和Kim,J.(2010)。带薪病假:态度和经验。公共福利基金会。 [49] Soiza,R.L.、Scicluna,C.和Thomson,E.C.(2021)。新冠肺炎疫苗在老年人中的有效性和安全性。年龄和老龄化50,279-283。 [50] Tan,Z.(2007)。评论“了解OR、PS和DR”。统计科学22,560-568·Zbl 1246.62077号 [51] Tan,Z.(2020年)。利用模型错误识别和高维数据对倾向得分进行正则化校准估计。生物特征107、137-158·Zbl 1435.62274号 [52] Velentgas,P.,Dreyer,N.A.,Nourjah,P.、Smith,S.R.和Torchia,M.M.(2013)。制定观测比较有效性研究方案:用户指南。医疗保健研究和质量机构(AHRQ)。 [53] Wager,S.和Athey,S.(2018年)。使用随机森林评估和推断异质处理效果。《美国统计协会杂志》1131228-1242·Zbl 1402.62056号 [54] Wand,M.、Moler,C.和Ripley,B.(2021)。《KernSmooth:内核平滑支持棒和琼斯的函数》(1995)。网状物:https://CRAN.R-project.org/package=KernSmooth。 [55] 王莉和杨莉(2009)。单指标模型的样条估计。中国统计局19,765-783·Zbl 1166.62023号 [56] Wei,L.、Yeying,Z.和Debashis,G.(2017)。使用充分降维估计基于回归的因果效应。生物特征104,51-65·Zbl 1506.62251号 [57] Wu,P.,Tan,Z.,Hu,W.和Zhou,X.-H.(2022a)。利用高维数据对协变量特异性治疗效果进行模型辅助推断。中国统计局34,459-479。 [58] Wu,P.,Tong,X.,Wang,Y.,Liang,J.和Zhou,X.-H.(2022b)。平均因果效应的稳健拟阶估计。生物统计与流行病学6144-163。 [59] Wu,P.,Xu,X.,Tong,X.、Jiang,Q.和Lu,B.(2021)。使用基于倾向得分的样条曲线对平均因果效应进行半参数估计。《统计规划与推断杂志》212,153-168·兹比尔1465.62169 [60] Yin,Y.(2018)。用潜在变量评估治疗效果的异质性。《中国统计》28,115-135·Zbl 1382.62058号 [61] Zhai,Y.、Santibanez,T.A.、Kahn,K.E.、Black,C.L.和de Perio,M.A.(2018年)。美国工人的带薪病假福利、流感疫苗接种和因流感样疾病请病假。疫苗36、7316-7323。 [62] Zhang,G.和Little,R.(2009年)。惩罚样条倾向预测插补方法的推广。生物统计学65,911-918·Zbl 1172.62071号 [63] Zhou,T.、Elliott,M.R.和Little,R.J.A.(2019)。用于治疗比较的惩罚样条倾向方法。《美国统计协会杂志》114,1-19·Zbl 1418.62179号 [64] Zimmert,M.和Lechner,M.(2019年)。高维混杂下因果异质性的非参数估计。网状物:https://arxiv.org/abs/1908.08779v1。 [65] 电子邮件:pengwu@btbu.edu.cnShasha Han BICMR,北京大学,北京100871,中国。 [66] 电子邮件:shashahan@u.nus.edu北京师范大学数学统计系,北京100875。电子邮件:xweitong@bnu.edu.cn 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。