×

通过高维协变量平衡倾向得分稳健估计因果效应。 (英语) Zbl 1451.62050

总结:当潜在混杂因素的数量可能远大于样本量时,我们提出了一种稳健的方法来估计观察性研究中的平均治疗效果。我们的方法包括三个步骤。我们首先对倾向得分和结果模型使用了一类惩罚(M)估计量。然后,我们通过平衡精心选择的预测结果的协变量子集来校准倾向得分的初始估计值。最后,使用估计的倾向得分来构造逆概率加权估计器。我们证明了当倾向得分模型被正确指定并且结果模型在协变量中是线性的时,所提出的估计器(我们称之为高维协变量平衡倾向得分)具有样本有界性,是根一致的、渐近正态的和半参数有效的。更重要的是,我们证明了只要倾向得分模型或结果模型被正确指定,我们的估计量就保持根一致和渐近正态。我们在这两种情况下都提供了有效的置信区间,并将这些结果进一步扩展到结果模型是广义线性模型的情况。在模拟研究中,我们发现所提出的方法通常比现有方法更准确地估计平均处理效果。我们还提供了一个实证应用,其中我们估计了大学入学率对成年政治参与的平均因果影响。有一个开源软件包可用于实现所提议的方法。

MSC公司:

62G35型 非参数稳健性
62G07年 密度估算
62第25页 统计学在社会科学中的应用
2007年6月62日 非马尔科夫过程:假设检验

软件:

CBPS公司
PDF格式BibTeX公司 XML格式引用