×

调和基于设计和基于模型的分批实验因果推断。 (英语) Zbl 1486.62230号

摘要:分割地块设计起源于农业科学,实验单元也被称为子地块,嵌套在称为整体地块的组内。它分别在整个地块和子地块级别分配不同的干预措施,为适应难以改变的因素提供了方便的方法。通过设计,同一整块地块内的子地块接受相同水平的整块地块干预,从而在最终治疗任务中形成一个群体结构。一种常见的策略是对治疗指标的结果进行普通最小二乘(OLS)回归,并将稳健的标准误差聚集在整体水平上。当整个批次大小发生变化时,它并没有给出有关治疗效果的一致估计。另一种常见的策略是用正常随机效应和误差拟合结果的线性混合效应模型。这是一种纯粹的基于模型的方法,对违反参数假设的情况很敏感。相反,基于设计的推理不假设结果模型,只依赖物理实验确定的可控随机化机制。我们首先将现有的基于Horvitz-Thompson估计的基于设计的推理推广到Hajek估计,并在分裂抽样随机化下建立了两者的有限总体中心极限定理。然后,我们将结果与基于模型的方法下的结果进行了协调,并提出了两种回归策略,即(i)基于逆概率加权的单位级数据的加权最小二乘(WLS)拟合,以及(ii)基于整体总体结果的聚合数据的OLS拟合,分别重现Hajek和Horvitz-Thompson估值器。这一点,再加上我们在该过程中建立的用于估计真正基于设计的协方差的相应聚类-总体协方差的渐近保守性,证明了基于设计推理的回归估计量的有效性。鉴于协变量调整回归公式的灵活性,我们进一步将理论扩展到具有协变量的情况,并通过渐近理论和模拟证明了基于回归的协变量调整的效率增益。重要的是,我们所有的理论要么是基于数值的,要么是基于设计的,并且不管回归方程在多大程度上代表了真实的数据生成过程。

理学硕士:

62K15型 因子统计设计
62G05型 非参数估计
62J05型 线性回归;混合模型
62D05型 抽样理论、抽样调查
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] ABADIE,A.、ATHEY,S.、IMBENS,G.W.和WOOLDRICGE,J.M.(2017)。您应该在什么时候调整集群的标准错误?国家经济研究局技术报告。
[2] ABADIE,A.、ATHEY,S.、IMBENS,G.W.和WOOLDRIDGE,J.M.(2020年)。回归分析中基于抽样的不确定性与基于设计的不确定性。计量经济学88 265-296. ·Zbl 1467.62119号 ·doi:10.3982/ecta12675
[3] Basse,G.和Feller,A.(2018年)。分析存在干扰的两阶段实验。J.Amer。统计师。协会。113 41-55. ·Zbl 1398.62030号 ·doi:10.1080/01621459.2017.1323641
[4] 贝尔·R.M.和麦卡弗里·D.F.(2002)。多阶段样本线性回归标准误差的偏差降低。调查。Methodol公司。28 169-181.
[5] BOX,G.E.P.和ANDERSEN,S.L.(1955年)。置换理论在稳健准则推导和偏离假设研究中的应用。J.R.统计社会服务。B.统计方法。17 1-34. ·Zbl 0065.12402号
[6] 卡梅隆A.和米勒D.(2015)。从业者对集群推论的指导。J.Hum.资源。50 317-372.
[7] CHONG,A.、GONZALEZ-NAVARRO,M.、KARLAN,D.和VALDIVIA,M.(2020年)。信息技术能改善青少年的性教育吗?哥伦比亚随机评估的证据。世界银行经济。版次。34 371-392.
[8] COX,D.R.和REID,N.(2000年)。实验设计理论查普曼和霍尔/CRC,伦敦·Zbl 1009.62061号
[9] DASGUPTA,T.、PILLAI,N.S.和RUBIN,D.B.(2015)。使用潜在结果从\[{2^K}\]析因设计中进行因果推断。J.R.统计社会服务。B.统计方法。77 727-753. ·Zbl 1414.62337号 ·doi:10.1111/rssb.12085
[10] 费舍尔,R.A.(1935)。实验设计第1版,奥利弗和博伊德,伦敦爱丁堡。
[11] FOGARTY,C.B.(2018a)。关于减轻精细分层实验的分析局限性。J.R.统计社会服务。B.统计方法。80 1035-1056. ·Zbl 1407.62288号 ·doi:10.1111/rssb.12290
[12] FOGARTY,C.B.(2018b)。配对实验中平均治疗效果的回归辅助推断。生物特征105 994-1000. ·Zbl 1506.62433号 ·doi:10.1093/biomet/asy034
[13] FREEDMAN,D.A.(2008)。关于对实验数据的回归调整。申请中的预付款。数学。40 180-193. ·Zbl 1130.62003号 ·doi:10.1016/j.aam.2006.12.003
[14] FRICANO,C.J.、DESPENZA JR.,T.、FRAZEL,P.W.、LI,M.、O’MALLEY,J.A.、WESTBROOK,G.L.和LUIKART,B.W.(2014)。脂肪酸增加Pten击倒神经元的神经元肥大。前面。分子神经科学7 30.
[15] FULLER,W.A.(2009年)。抽样统计纽约威利·Zbl 1179.62019号
[16] HINKELMANN,K.和KEMPTHORNE,O.(2008)。实验设计与分析。音量. 1. 纽约威利·Zbl 1146.62054号
[17] Hudgens,M.G.和Halloran,M.E.(2008)。干扰因果推理。J.Amer。统计师。协会。103 832-842. ·Zbl 1471.62507号 ·doi:10.1198/0162145000000292
[18] IMAI,K.、JIANG,Z.和MALANI,A.(2021)。两阶段随机实验中干扰和不遵从的因果推理。J.Amer。统计师。协会。116 632-644. ·Zbl 1464.62208号 ·doi:10.1080/016214592020.1775612
[19] IMAI,K.、KING,G.和NALL,C.(2009年)。配对在分组随机实验中的重要作用,以及在墨西哥全民健康保险评估中的应用。统计师。科学。24 29-53. ·Zbl 1327.62061号 ·doi:10.1214/08-STS274
[20] Imbens,G.W.和Rubin,D.B.(2015)。统计、社会和生物医学科学因果推断:导言剑桥大学出版社,纽约·Zbl 1355.6202号 ·doi:10.1017/CBO9781139025751
[21] JI,X.,FINK,G.,ROBYN,P.J.和SMALL,D.S.(2017年)。步进楔形聚类随机试验的随机推断:在社区健康保险中的应用。附录申请。统计。11 1-20. ·兹比尔1366.62196 ·doi:10.1214/16-AOAS969
[22] JONES,B.和NACHTSHEIM,C.J.(2009年)。分割图设计:什么、为什么和如何。J.资格。Technol公司。41 340-361.
[23] KEMPTHORNE,O.(1952年)。实验设计与分析.威利,纽约;CRC出版社,伦敦·Zbl 0049.09901号
[24] Li,X.和Ding,P.(2017)。有限总体中心极限定理的一般形式及其在因果推理中的应用。J.Amer。统计师。协会。112 1759-1769. ·doi:10.1080/01621459.2017.1295865
[25] Liang,K.Y.和Zeger,S.L.(1986)。使用广义线性模型进行纵向数据分析。生物特征73 13-22. ·兹比尔0595.62110 ·doi:10.1093/biomet/73.1.13
[26] Lin,W.(2013)。实验数据回归调整的不可知论注释:重新审视弗里德曼的评论。附录申请。统计。7 295-318. ·Zbl 1454.62217号 ·doi:10.1214/12-AOAS583
[27] Liu,L.和Hudgens,M.G.(2014)。存在干扰时因果效应的大样本随机推断。J.Amer。统计师。协会。109 288-301. ·兹比尔1367.62239 ·doi:10.1080/016214519.2013.844698
[28] 刘华和杨扬(2020)。分层随机试验中经回归调整的平均治疗效果估计。生物特征107 935-948. ·Zbl 1457.62046号 ·doi:10.1093/biomet/asaa038
[29] MACKINNON,J.G.、NIELSEN,M.和WEBB,M.D.(2021年)。集群式推论:实证实践指南。第1456号工作文件,女王大学经济系。
[30] MIDDLETON,J.A.和ARONOW,P.M.(2015)。分组随机实验中平均治疗效果的无偏估计。统计、政治和政策6 39-75.
[31] 米拉特里克斯,L.W.(2013)。通过随机试验中的后分层调整治疗效果估计。J.R.统计社会服务。B.统计方法。75 369-396. ·Zbl 07555452号 ·文件编号:10.1111/j.1467-9868.2012.01048.x
[32] MIRATRIX,L.W.、WEISS,M.J.和HENDERSON,B.(2021)。应用研究人员指南,用于评估多站点单独随机试验的效果:估计值、估计值和估计值。J.Res.教育。效率。14 270-308.
[33] MOEN,E.L.、FRICANO-KUGLER,C.J.、LUIKART,B.W.和O’MALLEY,A.J.(2016)。分析聚集数据:为什么以及如何解释嵌套在研究参与者中的多个观察结果?公共科学图书馆11 e0146721·doi:10.1371/journal.pone.0146721
[34] MUKERJEE,R.和DASGUPTA,T.(2021)。从可能不平衡的分裂点设计进行因果推断:基于随机的观点。统计师。西尼卡. ·Zbl 1483.62041号
[35] MUKERJEE,R.、DASGUPTA,T.和RUBIN,D.B.(2018年)。使用有限总体抽样的标准工具改进复杂实验的因果推断。J.Amer。统计师。协会。113 868-881. ·Zbl 1398.62213号 ·doi:10.1080/01621459.2017.1294076
[36] NEYMAN,J.(1935年)。农业试验中的统计问题(讨论)。补充J.R.Stat.Soc。2 107-180之间。
[37] OHLSSON,E.(1989)。有限总体两阶段抽样的渐近正态性。普罗巴伯。理论相关领域81 341-352. ·Zbl 0661.62007号 ·doi:10.1007/BF00340058
[38] 奥尔肯,B.A.(2007)。监测腐败:来自印尼实地实验的证据。政治经济学杂志。115 200-249.
[39] PASHLEY,N.E.和MIRATRIX,L.W.(2021)。关于分块和匹配对设计的方差估计的见解。J.教育。贝哈夫。统计。46 271-296.
[40] PUSTEJOVSKY,J.E.和TIPTON,E.(2018年)。固定效应模型中用于聚类鲁棒方差估计和假设检验的小样本方法。J.公交车。经济。统计师。36 672-683. ·doi:10.1080/07350015.2016.1247004
[41] Rosenbaum,P.R.(2002)。观察研究,第2版。统计学中的斯普林格系列纽约州施普林格·Zbl 0985.62091号 ·doi:10.1007/978-1-4757-3692-2
[42] SABBAGHI,A.和RUBIN,D.B.(2014)。对内曼·费希尔争议及其后果的评论。统计师。科学。29 267-284. ·Zbl 1332.62007年 ·doi:10.1214/13-STS454
[43] SCHOCHET,P.Z.(2010)。内曼因果推理模型支持回归调整吗?J.统计。计划。推断140 246-259. ·Zbl 1178.62079号 ·doi:10.1016/j.jspi.2009.07.008
[44] SCHOCHET,P.Z.、PASHLEY,N.E.、MIRATRIX,L.W.和KAUTZ,T.(2021)。分组分组RCT的基于设计的比率估计和中心极限定理。J.Amer。统计师。协会。·Zbl 1515.62118号 ·doi:10.1080/01621459.2021.1906685
[45] NEYMAN,J.(1923年)。概率论在农业实验中的应用。统计师。科学。5 465-472. ·Zbl 0955.01560号
[46] SU,F.和DING,P.(2021)。聚类随机实验的模型辅助分析。J.R.统计社会服务。B.统计方法。83 994-1015·Zbl 07555289号 ·doi:10.1111/rssb.12468
[47] WU,C.-F.(1981)。关于一些随机设计的稳健性和效率。安。统计师。9 1168-1177. ·Zbl 0474.62075号
[48] WU,J.和DING,P.(2021)。随机实验中弱零假设的随机检验。J.Amer。统计师。协会。116 1898-1913. ·Zbl 1506.62255号 ·doi:10.1080/01621459.2020.1750415
[49] WU,C.F.J.和HAMADA,M.S.(2009年)。实验:规划、分析和优化,第2版。概率统计中的威利级数新泽西州霍博肯威利·Zbl 1229.62100号
[50] YATES,F.(1935年)。复杂实验。补充J.R.Stat.Soc。2 181-247.
[51] YATES,F.(1937年)。析因实验的设计与分析伦敦哈彭登帝国土壤科学局。
[52] 赵A.和丁P.(2021a)。基于回归的因果推理与析因实验:估计、模型规范和基于设计的属性。生物特征.arXiv:2101.02400。
[53] 赵A.和丁P.(2021b)。平均治疗效果的协变量调整Fisher随机化试验。J.计量经济学225 278-294. ·Zbl 07414292号 ·doi:10.1016/j.jeconom.2021.04.007
[54] 赵安、丁平(2022)。补充“分裂试验中基于设计和基于模型的因果推断的协调”https://doi.org/10.1214/21-AOS2144SUPP网站
[55] ZHAO,A.,DING,P.,MUKERJEE,R.和DASGUPTA,T.(2018)。基于随机分组设计的因果推断。安。统计师。46 1876-1903 ·兹比尔1407.62292 ·doi:10.1214/17-AOS1605
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。