IDEAS主页打印自https://ideas.repec.org/p/arx/papers/2107.02780.html
  我的参考书目  保存此纸张

损坏数据的因果推断:测量误差、缺失值、离散化和差异隐私

作者

上市的:
  • 阿尼什·阿加瓦尔
  • 拉赫尔·辛哈

摘要

美国人口普查局(US Census Bureau)将蓄意破坏2020年美国人口普查的数据集,增强受访者的隐私,同时可能降低经济分析的准确性。为了研究这种权衡是否不可避免,我们建立了一个具有高维损坏数据的因果推理半参数模型。我们提出了一个使用数据清理调整的置信区间进行数据清理、估计和推断的过程。我们用有限的样本参数证明了一致性和高斯逼近,对于非参数估计优雅退化的半参数估计,其速率为$n^{1/2}$。我们的关键假设是,真正的协变量是近似低秩的,我们将其解释为近似重复测量,并进行了实证验证。我们的分析为矩阵补全、统计学习和半参数统计提供了非统计理论贡献。经校准的模拟验证了我们的数据清理调整置信区间的覆盖范围,并证明了我们的结果与普查衍生数据的相关性。

建议引用

  • 阿尼什·阿加瓦尔和拉胡尔·辛格,2021年。"损坏数据的因果推断:测量误差、缺失值、离散化和差异隐私,"文件2107.02780,arXiv.org,2024年2月修订。
  • 手柄:RePEc:arx:论文:2107.02780
    作为

    从出版商下载全文

    文件URL: http://arxiv.org/pdf/2107.02780
    文件功能:最新版本
    下载限制:
    ---><---

    IDEAS上列出的参考文献

    作为
    1. Evdokimov,Kirill&White,Halbert,2012年。"Kotlarski引理的一些推广,"计量经济学理论剑桥大学出版社,第28卷(4),第925-932页,8月。
    2. 维克多·切尔诺朱科夫(Victor Chernozhukov)、丹尼斯·切特维里科夫(Denis Chetverikov)、默特·德米勒(Mert Demirer)、埃丝特·杜弗洛(Esther Duflo)、克里斯蒂安·汉森(Christian Hansen)、惠特尼·纽伊(Whitne。"治疗和结构参数的双/脱苦机器学习,"计量经济学杂志,英国皇家经济学会,第21卷(1),第1-68页,2月。
      • 维克多·切尔诺朱科夫(Victor Chernozhukov)、丹尼斯·切特维里科夫(Denis Chetverikov)、默特·德米勒(Mert Demirer)、埃丝特·杜弗洛(Esther Duflo)、克里斯蒂安·汉森(Christian Hansen)、惠特尼·纽伊(Whitne。"治疗和结构参数的双/脱脂机器学习,"NBER工作文件23564,国家经济研究局。
      • 维克多·切尔诺朱科夫(Victor Chernozhukov)、丹尼斯·切特维里科夫(Denis Chetverikov)、默特·德米雷尔(Mert Demirer)、埃丝特·杜弗洛(Esther Duflo)、克里斯蒂安·汉森(Christian Hansen)、惠特尼·K·纽伊(Whitney K.Newey)和詹姆斯·罗宾斯(James Robins),2017年。"治疗和结构参数的双/脱苦机器学习,"CeMMAP工作文件CWP28/17,财政研究所微观数据方法与实践中心。
      • 维克多·切尔诺朱科夫(Victor Chernozhukov)、丹尼斯·切特维里科夫(Denis Chetverikov)、默特·德米雷尔(Mert Demirer)、埃丝特·杜弗洛(Esther Duflo)、克里斯蒂安·汉森(Christian Hansen)、惠特尼·K·纽伊(Whitney K.Newey)和詹姆斯·罗宾斯(James Robins),2017年。"治疗和结构参数的双/脱苦机器学习,"CeMMAP工作文件28/17,财政研究所。
    3. Peter M Robinson,1988年。"根-N-一致半参数回归,"计量经济学《计量经济学协会》,第56卷(4),第931-954页,7月。
    4. Newey,Whitney K,1994年。"半参数估计的渐近方差,"计量经济学《计量经济学协会》,第62卷(6),第1349-1382页,11月。
    5. Susanne M.Schennach,2004年。"具有测量误差的非线性模型的估计,"计量经济学《计量经济学协会》,第72卷(1),第33-75页,1月。
    6. S.M.Schennach和Yingyao Hu,2013年。"无侧信息经典测量误差模型的非参数辨识与半参数估计,"美国统计协会杂志《泰勒和弗朗西斯杂志》,第108卷(501),第177-186页,3月。
    7. 维克多·切尔诺朱科夫(Victor Chernozhukov)、胡安·卡洛斯·埃斯卡尼亚诺(Juan Carlos Escanciano)、Hidehiko Ichimura&Whitney K.Newey&James M.Robins,2022年。"局部稳健半参数估计,"计量经济学《计量经济学会》,第90卷(4),第1501-1535页,7月。
      • Victor Chernozhukov和Juan Carlos Escanciano、Hidehiko Ichimura和Whitney K.Newey,2016年。"局部稳健半参数估计,"CeMMAP工作文件CWP31/16,财政研究所微观数据方法与实践中心。
      • 维克多·切尔诺朱科夫(Victor Chernozhukov)、胡安·卡洛斯·埃斯卡尼亚诺(Juan Carlos Escanciano)、Hidehiko Ichimura&Whitney K.Newey&James M.Robins,2016年。"局部稳健半参数估计,"文件1608.00033,arXiv.org,2020年8月修订。
      • 维克多·切尔诺朱科夫(Victor Chernozhukov)、胡安·卡洛斯·埃斯卡尼亚诺(Juan Carlos Escanciano)、Hidehiko Ichimura&Whitney K.Newey&James M.Robins,2018年。"局部稳健半参数估计,"CeMMAP工作文件CWP30/18,财政研究所微观数据方法与实践中心。
      • Victor Chernozhukov和Juan Carlos Escanciano、Hidehiko Ichimura和Whitney K.Newey,2016年。"局部稳健半参数估计,"CeMMAP工作文件2016年3月31日,财政研究所。
    8. 惠特尼·K·纽伊、谢福兴和詹姆斯·罗宾斯,2004年。"二次核与半参数估计的一个小偏差性质,"计量经济学《计量经济学协会》,第72卷(3),第947-962页,5月。
    9. Anish Agarwal&Devavrat Shah&Dennis Shen&Dogyoon Song,2021年。"关于主成分回归的稳健性,"美国统计协会杂志《泰勒与弗朗西斯杂志》,第116卷(536),第1731-1745页,10月。
    10. 惠特尼·K·纽伊,2001年。"非线性误差变量模型的柔性模拟矩估计,"经济学与统计学综述麻省理工学院出版社,第83卷(4),第616-627页,11月。
    11. Li,Tong&Vuong,Quang,1998年。"多指标测量误差模型的非参数估计,"多元分析杂志爱思唯尔,第65卷(2),第139-165页,5月。
    12. 范德拉安·马克·J和鲁宾·丹尼尔,2006年。"目标最大似然学习,"国际生物统计学杂志De Gruyter,第2卷(1),第1-40页,12月。
    13. Yingyao Hu和Susanne M.Schennach,2008年。"非经典测量误差模型的仪器变量处理,"计量经济学《计量经济学协会》,第76卷(1),第195-216页,1月。
    14. 豪斯曼,J.A.&纽伊,W.K.&鲍威尔,J.L.,1995年。"一些恩格尔曲线的非线性误差估计,"计量经济学杂志爱思唯尔,第65卷(1),第205-233页,1月。
    15. 阿尔贝托·阿巴迪,2003年。"治疗反应模型的半参数工具变量估计,"计量经济学杂志Elsevier,第113(2)卷,第231-263页,4月。
    16. 维克托·切尔诺朱科夫(Victor Chernozhukov)、惠特尼·纽伊(Whitney Newey)、拉胡尔·辛格(Rahul Singh)和瓦西里斯·西尔卡尼(Vasilis Syrgkanis),2020年。"Riesz表示的对抗估计,"文件2101.00009,arXiv.org,2024年4月修订。
    17. 艾春荣,陈晓红,2003。"含有未知函数的条件矩约束模型的有效估计,"计量经济学《计量经济学协会》,第71卷(6),第1795-1843页,11月。
    18. 李彤,2002。"非线性变量误差模型的稳健一致估计,"计量经济学杂志爱思唯尔,第110卷(1),第1-26页,9月。
    19. 维克托·切尔诺朱科夫(Victor Chernozhukov)、卡斯帕·伍特里奇(Kaspar Wuthrich)和朱殷楚(Yinchu Zhu),2018年。"合成控件的$t$-测试,"文件1812.10820,arXiv.org,2024年1月修订。
    20. 王立群和肖成,2011。"半参数非线性误差-变量模型的矩估计方法及可辨识性,"计量经济学杂志爱思唯尔,第165(1)卷,第30-44页。
    21. 杰里·豪斯曼(Jerry A.Hausman)和纽伊(Newey)、惠特尼·K·和一村(Whitney K.&Ichimura)、希德希科(Hidehiko)和鲍威尔(Powell)、詹姆斯·L·。"变量模型中多项式误差的识别与估计,"计量经济学杂志爱思唯尔,第50卷(3),第273-295页,12月。
    完整参考文献 (包括与IDEAS上的项目不匹配的项目)

    引文

    引文由CitEc项目,订阅其RSS源用于此项目。
    作为


    引用人:

    1. Anish Agarwal&Munther Dahleh&Devavrat Shah&Dennis Shen,2021年。"因果矩阵完成,"文件2109.15154,arXiv.org。
    2. Isaac Meza和Rahul Singh,2021年。"嵌套非参数工具变量回归:长期、中介和时变治疗效应,"文件2112.14249,arXiv.org,2024年3月修订。
    3. Fengshi Niu&Harsha Nori&Brian Quistorff&Rich Caruana&Donald Ngwe&Aadharsh Kannan,2022年。"异质因果效应的差异私人估计,"文件2202.11043,arXiv.org。

    最相关的项目

    这些是最常引用与本书相同作品的项目,也被与本书同样的作品引用。
    1. 宋素勇,2015。"非经典测量误差下条件矩约束模型的半参数估计,"计量经济学杂志,爱思唯尔,第185卷(1),第95-109页。
    2. 陈启钊(Qizhao Chen)、瓦西里斯·雪兰莪(Vasilis Syrgkanis)和摩根·奥斯特(Morgane Austern),2022年。"稳定估计的无样本分裂的Debiased机器学习,"文件2206.01825,arXiv.org,2022年11月修订。
    3. Susanne M.Schennach,2012年。"非线性模型中的测量误差——综述,"CeMMAP工作文件41/12,财政研究所。
    4. Isaac Meza和Rahul Singh,2021年。"嵌套非参数工具变量回归:长期、中介和时变治疗效应,"文件2112.14249,arXiv.org,2024年3月修订。
    5. 拉胡尔·辛格(Rahul Singh),2021年。"核岭Riesz表示:泛化误差和误指定,"文件2102.11076,arXiv.org,2024年5月修订。
    6. Yingyao Hu和Geert Ridder,2012年。"利用边际信息估计回归量有误的非线性模型,"应用计量经济学杂志John Wiley&Sons,Ltd.,第27卷(3),第347-385页,4月。
    7. 陈晓红,胡应耀,2006。"具有任意测量误差的两个样本非线性模型的识别与推断,"考尔斯基金会讨论文件1590年,耶鲁大学考尔斯经济研究基金会。
    8. 维克托·切尔诺朱科夫(Victor Chernozhukov)、惠特尼·纽伊(Whitney Newey)、拉胡尔·辛格(Rahul Singh)和瓦西里斯·西尔卡尼(Vasilis Syrgkanis),2020年。"Riesz表示的对抗估计,"文件2101.00009,arXiv.org,2024年4月修订。
    9. 维克多·切尔诺朱科夫(Victor Chernozhukov)、胡安·卡洛斯·埃斯卡尼亚诺(Juan Carlos Escanciano)、Hidehiko Ichimura&Whitney K.Newey&James M.Robins,2022年。"局部稳健半参数估计,"计量经济学《计量经济学会》,第90卷(4),第1501-1535页,7月。
      • Victor Chernozhukov和Juan Carlos Escanciano、Hidehiko Ichimura和Whitney K.Newey,2016年。"局部稳健半参数估计,"CeMMAP工作文件CWP31/16,财政研究所微观数据方法与实践中心。
      • 维克多·切尔诺朱科夫(Victor Chernozhukov)、胡安·卡洛斯·埃斯卡尼亚诺(Juan Carlos Escanciano)、Hidehiko Ichimura&Whitney K.Newey&James M.Robins,2016年。"局部稳健半参数估计,"文件1608.00033,arXiv.org,2020年8月修订。
      • 维克多·切尔诺朱科夫(Victor Chernozhukov)、胡安·卡洛斯·埃斯卡尼亚诺(Juan Carlos Escanciano)、Hidehiko Ichimura&Whitney K.Newey&James M.Robins,2018年。"局部稳健半参数估计,"CeMMAP工作文件CWP30/18,财政研究所微观数据方法与实践中心。
      • Victor Chernozhukov和Juan Carlos Escanciano、Hidehiko Ichimura和Whitney K.Newey,2016年。"局部稳健半参数估计,"CeMMAP工作文件2016年3月31日,财政研究所。
    10. Geert Ridder和Yingyao Hu,2004年。"利用边缘信息估计具有测量误差的非线性模型,"计量经济学会2004北美夏季会议21,计量经济学会。
    11. V Chernozhukov&W K Newey&R Singh,2023年。"具有有限样本保证的简单通用debiased机器学习定理,"生物特征《Biometrika信托》,第110卷(1),第257-264页。
    12. De Nadai,Michele&Lewbel,Arthur,2016年。"方程两侧有测量误差的变量模型中的非参数误差,"计量经济学杂志爱思唯尔,第191(1)卷,第19-32页。
    13. Andrei Zeleneev和Kirill Evdokimov,2023年。"具有测量误差的半参数模型的简单估计,"CeMMAP工作文件10/23,财政研究所。
    14. 基里尔·埃夫多基莫夫(Kirill S.Evdokimov)和安德烈·泽列涅夫(Andrei Zeleneev),2023年。"具有测量误差的半参数模型的简单估计,"文件2306.14311,arXiv.org,2024年3月修订。
    15. Hidehiko Ichimura&Whitney K.Newey,2022年。"半参数估计的影响函数,"数量经济学《计量经济学协会》,第13卷(1),第29-61页,1月。
    16. 胡应尧,2008。"利用工具变量识别和估计具有误分类误差的非线性模型:一个一般解,"计量经济学杂志爱思唯尔,第144(1)卷,第27-61页,5月。
    17. 王立群和肖成,2011。"半参数非线性误差-变量模型的矩估计方法及可辨识性,"计量经济学杂志爱思唯尔,第165(1)卷,第30-44页。
    18. Susanne M.Schennach,2013年。"协变量中Berkson误差的回归——一种非参数方法,"文件1308.2836,arXiv.org。
    19. 陈晓红,韩红,Denis Nekipelov,2011。"测量误差的非线性模型,"经济文学杂志,美国经济协会,第49卷(4),第901-937页,12月。
    20. 陈晓红(Xiaohong Chen)、胡应耀(Yingyao Hu)和亚瑟·莱贝尔(Arthur Lewbel),2007年。"无附加信息的非经典变量误差模型的非参数辨识与估计,"波士顿学院经济学工作论文676,波士顿学院经济系。

    有关此项目的更多信息

    NEP字段

    这篇论文已在下面宣布NEP报告:

    统计

    访问和下载统计

    更正

    本网站上的所有材料均由各自的出版商和作者提供。您可以帮助纠正错误和遗漏。请求更正时,请提及此项目的句柄:RePEc:arx:论文:2107.02780。请参阅一般信息关于如何更正RePEc中的材料。

    如果您编写了此项目,但尚未在RePEc注册,我们鼓励您这样做在这里。这允许将您的个人资料链接到此项目。它还允许您接受我们不确定的该项目的潜在引用。

    如果CitEc公司识别了书目参考,但没有将RePEc中的项目链接到它,您可以帮助这个表格.

    如果你知道引用这一条的缺失条目,你可以通过以与上述相同的方式为每个引用条目添加相关引用来帮助我们创建这些链接。如果您是此项目的注册作者,您可能还需要检查您的RePEc作者服务个人资料,因为可能有一些引文等待确认。

    有关此项目的技术问题,或更正其作者、标题、摘要、书目或下载信息,请联系:arXiv管理员(以下电子邮件可用)。供应商的一般联系方式:http://arxiv.org/.

    请注意,更正可能需要几周时间才能筛选出来各种RePEc服务。

    思想是一个经济学研究论文服务。RePEc使用各出版商提供的书目数据。