总结

当潜在混杂因素的数量可能远大于样本量时,我们提出了一种稳健的方法来估计观察性研究中的平均治疗效果。我们的方法包括三个步骤。我们首先使用一类惩罚|百万美元$|-倾向评分和结果模型的估计值。然后,我们通过平衡精心选择的预测结果的协变量子集来校准倾向得分的初始估计值。最后,利用估计的倾向得分构造逆概率加权估计量。我们证明了所提出的估计量,我们称之为高维协变量平衡倾向得分,具有样本有界性,是根-|n美元$|当正确指定倾向得分模型且结果模型在协变量中是线性的时,一致、渐近正态和半参数有效。更重要的是,我们证明了我们的估计量仍然是根-|n美元$|只要正确指定了倾向得分模型或结果模型,则一致且渐近正态。我们在这两种情况下都提供了有效的置信区间,并将这些结果进一步扩展到结果模型是广义线性模型的情况。在模拟研究中,我们发现所提出的方法通常比现有方法更准确地估计平均处理效果。我们还提出了一个实证应用,在该应用中,我们估计了大学入学率对成年政治参与的平均因果效应。有一个开源软件包可用于实现所提议的方法。

本文根据牛津大学出版社标准期刊出版模式的条款出版和发行(https://academic.oup.com/journals/pages/open_access/funder_policies/chorus/standard_publication_model)
您当前没有访问此文章的权限。