×

定制损失函数的协变量平衡倾向得分。 (英语) Zbl 1420.62464号

众所周知,在观察性研究中,倾向得分通常通过最大似然估计,但即使在规范搜索后,也可能无法平衡高维预处理协变量。
本论文的目的是介绍一个总体框架,该框架统一并概括了最近的几项建议,以改进观察研究设计中倾向评分模型的协变量平衡。根据概念上简单的解决方案,作者为了估计拟优化的倾向得分,而不是最广泛使用的负伯努利似然,特殊损失函数(协变量平衡计分规则(CBSR))由广义线性模型(GLM)中的链接函数和估计唯一确定。因此,作者成功地证明了CBSR在有限样本中更为稳健,并且与伯努利似然相比,它在估计加权平均处理效果时不会失去渐近效率。
此外,作者还提出了在更丰富的函数类中平衡协变量函数的实用策略,以估计逆概率加权估计量的最大偏差,并在有限样本中构造诚实的置信区间。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
62J12型 广义线性模型(逻辑模型)
10层62层 点估计
62层25 参数公差和置信区域
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Abadie,A.和Imbens,G.W.(2006年)。平均治疗效果匹配估计量的大样本性质。计量经济学74 235-267·Zbl 1112.62042号 ·doi:10.1111/j.1468-0262.2006.5655.x号文件
[2] Athey,S.、Imbens,G.W.、Wager,S.等人(2016年)。近似剩余平衡:对高维平均治疗效果的去偏倚推断。J.R.统计社会服务。B.统计方法80 597-623·Zbl 1398.62194号 ·doi:10.1111/rssb.12268
[3] Austin,P.C.和Stuart,E.A.(2015)。在观察性研究中,当使用治疗权重的逆概率(IPTW),使用倾向得分来估计因果治疗效应时,应转向最佳实践。《美国法律总汇》第34卷第3661-3679页。
[4] Breiman,L.、Friedman,J.H.、Olshen,R.A.和Stone,C.J.(1984)。分类和回归树。Wadsworth Advanced Books and Software,加利福尼亚州贝尔蒙特·Zbl 0541.62042号
[5] Caliendo,M.和Kopeinig,S.(2008年)。一些实施倾向得分匹配的实用指南。《经济学杂志》。Surv.22 31-72。
[6] Chan,K.C.G.,Yam,S.C.P.和Zhang,Z.(2016)。通过经验平衡校准加权对平均治疗效果进行全球有效的非参数推断。J.R.统计社会服务。B.统计方法78 673-700·Zbl 1414.62107号
[7] Cochran,W.G.(1953年)。分析研究中的匹配。Am.J.公共卫生国家健康43 684-691。
[8] Cochran,W.G.(1968年)。在观察性研究中,通过子分类调整消除偏差的有效性。生物统计学24 295-313。
[9] Deville,J.-C.和Särndal,C.-E.(1992年)。调查抽样中的校准估计器。J.Amer。统计师。协会87 376-382·Zbl 0760.62010号
[10] Efron,B.、Hastie,T.、Johnstone,I.和Tibshirani,R.(2004)。最小角度回归。统计年鉴32 407-499·Zbl 1091.62054号 ·doi:10.1214/009053604000000067
[11] Friedman,J.、Hastie,T.和Tibshirani,R.(2000)。加性逻辑回归:助推的统计学观点。《统计年鉴》28 337-407·兹比尔1106.62323 ·doi:10.1214/aos/1016218223
[12] Friedman,J.H.(2001)。贪婪函数近似:梯度增强机。《统计年鉴》29 1189-1232·Zbl 1043.62034号 ·doi:10.1214/aos/1013203451
[13] Gneiting,T.和Raftery,A.E.(2007年)。严格正确的评分规则、预测和评估。J.Amer。统计师。协会102 359-378·Zbl 1284.62093号 ·doi:10.1198/0162145000001437
[14] Graham,B.S.、De Xavier Pinto,C.C.和Egel,D.(2012)。缺失数据的力矩条件模型的逆概率倾斜。经济收益率。螺柱79 1053-1079·Zbl 1409.62104号
[15] Gretton,A.、Borgwardt,K.M.、Rasch,M.J.、Schölkopf,B.和Smola,A.(2012)。内核双样本测试。J.马赫。学习。第13723-773号决议·Zbl 1283.62095号
[16] Hainmueller,J.(2011)。因果效应的熵平衡:在观察性研究中产生平衡样本的多元重加权方法。政治分析20 25-46。DOI:10.1093/pan/mpr025。
[17] Hastie,T.、Tibshirani,R.和Friedman,J.(2009)。《统计学习的要素:数据挖掘、推理和预测》,第二版,施普林格出版社,纽约·Zbl 1273.62005年
[18] Hazlett,C.(2016)。核平衡:一种用于估计因果效应的灵活的非参数加权程序。可从arXiv:1605.00155获取·Zbl 1453.62431号
[19] Heckman,J.J.、Ichimura,H.和Todd,P.E.(1997年)。匹配作为计量经济评估估计器:来自职业培训计划评估的证据。经济收益率。螺柱64 605-654·Zbl 0887.90039号 ·doi:10.2307/2971733
[20] Hirano,K.和Imbens,G.W.(2001)。使用倾向评分权重估计因果效应:右心导管插入术数据的应用。卫生服务。结果研究方法2 259-278。DOI:10.1023/A:1020371312283。
[21] Hirano,K.、Imbens,G.W.和Ridder,G.(2003)。使用估计的倾向得分有效估计平均治疗效果。计量经济学71 1161-1189·Zbl 1152.62328号 ·doi:10.111/1468-0262.00442
[22] Hofmann,T.、Schölkopf,B.和Smola,A.J.(2008)。机器学习中的核心方法。统计年鉴36 1171-1220·兹比尔1151.3007 ·doi:10.1214/00905360000000677
[23] Imai,K.、King,G.和Stuart,E.A.(2008年)。实验主义者和观察主义者对因果推理的误解。J.罗伊。统计师。Soc.序列号。A171 481-502。
[24] Imai,K.和Ratkovic,M.(2014)。协变量平衡倾向得分。J.R.统计社会服务。B.统计方法76 243-263·兹比尔1411.62025
[25] Imbens,G.W.(2004)。异质性下平均治疗效果的非参数估计:综述。经济收益率。统计数字86 4-29。
[26] Imbens,G.W.和Rubin,D.B.(2015)。统计学、社会学和生物医学科学的因果推断:导论。剑桥大学出版社,纽约·Zbl 1355.6202号
[27] Janson,L.、Foygel Barber,R.和Candès,E.(2017年)。特征棱镜:高维信噪比的推断。J.R.统计社会服务。B.统计方法79 1037-1065·Zbl 1373.62355号 ·doi:10.1111/rssb.12203
[28] Kallus,N.(2016)。因果推理的广义最优匹配方法。可从arXiv:1612.08321获取·兹比尔1498.62035
[29] Kang,J.D.Y.和Schafer,J.L.(2007)。双重稳健性的解密:从不完整数据估计总体平均值的替代策略的比较。统计师。科学.22 523-539·Zbl 1246.62073号 ·doi:10.1214/07-STS227
[30] Li,F.、Morgan,K.L.和Zaslavsky,A.M.(2016)。通过倾向得分加权平衡协变量。J.Amer。统计师。协会113 390-400·Zbl 1398.62075号 ·doi:10.1080/01621459.2016.1260466
[31] Lunseford,J.K.和Davidian,M.(2004)。在因果治疗效果评估中通过倾向得分进行分层和加权:一项比较研究。统计医学23 2937-2960。
[32] McCullagh,P.和Nelder,J.A.(1989)。广义线性模型,第二版,查普曼和霍尔,伦敦·Zbl 0744.62098号
[33] Müller,A.(1997)。积分概率度量及其函数生成类。申请中的预付款。大约29 429-443·Zbl 0890.60011号
[34] Norman,S.-L.T.、Landrum,M.B.、Guadagnoli,E.、Ayanian,J.Z.、Ryan,T.J.、Cleary,P.D.和McNeil,B.J.(2001)。验证老年人急性心肌梗死后冠状动脉造影的建议:使用倾向评分的匹配分析。临床杂志。流行病54 387-398。
[35] Robins,J.M.、Rotnitzky,A.和Zhao,L.P.(1994)。当某些回归变量不总是被观测时,回归系数的估计。J.Amer。统计师。协会89 846-866·Zbl 0815.62043号 ·doi:10.1080/01621459.1994.10476818
[36] Rosenbaum,P.R.和Rubin,D.B.(1983年)。倾向评分在因果效应观察性研究中的中心作用。生物特征70 41-55·兹伯利0522.62091 ·doi:10.1093/biomet/70.1.41
[37] Rosenbaum,P.R.和Rubin,D.B.(1984年)。使用倾向得分的子分类减少观察性研究中的偏见。J.Amer。统计师。协会79 516-524·doi:10.1080/01621459.1984.10478082
[38] Rosenbaum,P.R.和Rubin,D.B.(1985年)。使用包含倾向得分的多元匹配抽样方法构建对照组。阿默尔。统计39 33-38。
[39] Rubin,D.B.(1973)。匹配以消除观察研究中的偏差。生物统计学159-183。
[40] Rubin,D.B.(2008)。对于客观的因果推断,设计胜过分析。附录申请。状态2 808-804·Zbl 1149.62089号 ·doi:10.1214/08-AOAS187
[41] Rubin,D.B.(2009)。作者的回答:观察性研究的设计是否应该允许各治疗组之间的协变量分布缺乏平衡?Stat.Med.28 1420-1423年·doi:10.1002/sim.3565
[42] Savage,L.J.(1971)。激发个人的可能性和期望。J.Amer。统计师。协会66 783-801·Zbl 0253.92008号 ·doi:10.1080/01621459.1971.10482346
[43] Smith,J.A.和Todd,P.E.(2005年)。匹配是否克服了拉隆德对非实验估计器的批评?《计量经济学杂志》125 305-353·Zbl 1334.62225号 ·doi:10.1016/j.jeconom.2004.04.011
[44] Stuart,E.A.(2010年)。因果推理的匹配方法:回顾与展望。统计师。科学25 1-21·Zbl 1328.62007号 ·doi:10.1214/09-STS313
[45] Wahba,G.(1990年)。观测数据的样条模型。CBMS-NSF应用数学区域会议系列59。宾夕法尼亚州费城SIAM·Zbl 0813.62001号
[46] Wang,Y.和Zubizarreta,J.R.(2017)。近似平衡权重:从收缩率估计角度描述。可在arXiv:1705.0998上购买。
[47] Wong,R.K.W.和Chan,K.C.G.(2018年)。观察性研究中基于核的协变量功能平衡。生物特征105 199-213·Zbl 07072401号
[48] 赵琦(2018)。补充“定制损失函数的协变量平衡倾向得分”DOI:10.1214/18-AOS1698SUPP。
[49] Zhao,Q.和Percival,D.(2017)。熵平衡具有双重鲁棒性。J.因果推论5。
[50] Zubizarreta,J.R.(2015)。在不完整结果数据的估计中平衡协变量的稳定权重。J.Amer。统计师。协会110 910-922·Zbl 1373.62051号 ·doi:10.1080/01621459.2015.1023805
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。