×

因果推理的广义最优匹配方法。 (英语) Zbl 1498.62035号

摘要:我们开发了一个包含匹配、协变量平衡和双重稳健方法的框架,用于从观测数据进行因果推断,称为广义最优匹配(GOM)。该框架是通过推广一种新的最优匹配函数分析公式而给出的,产生了一类GOM方法,我们为其提供了一个统一的理论来分析可处理性和一致性。GOM中包括了许多常用的现有方法,并且使用它们的GOM解释,可以扩展到最优地自动权衡差额,并优于标准方法。作为一个子类,GOM产生了核最优匹配(KOM),正如新的理论和经验结果所支持的那样,它因将其他方法的许多积极特性结合在一起而引人注目。KOM作为一个线性约束凸二次优化问题求解,既继承了匹配的可解释性和无模型一致性,又可以实现精确回归的(sqrt{n})一致性和双稳健方法的偏差减少和鲁棒性。在有限重叠的设置中,KOM为部分识别和稳健覆盖的区间估计提供了一种非常透明的方法。我们用合成数据和实际数据在示例中演示了这一点。

MSC公司:

62D20型 观察性研究的因果推断
68T05型 人工智能中的学习和自适应系统
90C25型 凸面编程
65K10码 数值优化和变分技术

软件:

精密天平
PDF格式BibTeX公司 XML格式引用
全文: arXiv公司 链接

参考文献:

[1] 阿尔贝托·阿巴迪和吉多·维本斯。平均治疗效果匹配估计量的大样本性质。《计量经济学》,74(1):235-2672006年·Zbl 1112.62042号
[2] 阿尔贝托·阿巴迪和吉多·维本斯。成对实验中条件方差的估计。《经济与统计年鉴》,第175-187页,2008年·Zbl 1153.91752号
[3] 阿尔贝托·阿巴迪和吉多·维本斯。平均治疗效果的偏差校正匹配估值器。《商业与经济统计杂志》,29(1):1-112011·Zbl 1214.62031号
[4] RK Ahuja、TL Magnanti和JB Orlin。网络流:理论、算法和应用。普伦蒂斯·霍尔,上马鞍河,1993年·Zbl 1201.90001号
[5] 苏珊·雅西(Susan Athey)、吉多·维本斯(Guido W Imbens)和斯特凡·瓦格(Stefan Wager)。通过近似剩余平衡有效推断高维平均治疗效果。arXiv预印本arXiv:1604.071252016·Zbl 1398.62194号
[6] 阿兰·贝林特(Alain Berlinet)和克里斯汀·托马斯·阿格南(Christine Thomas-Agnan)。在概率统计中再现核希尔伯特空间。Kluwer学术,2004年·Zbl 1145.6202号
[7] 迪米特里斯·伯特西马斯(Dimitris Bertsimas)、麦克·约翰逊(Mac Johnson)和内森·卡卢斯(Nathan Kallus)。在设计涉及小样本的实验时,优化相对于随机化的力量。运筹学,63(4):868-8762015·兹比尔1329.90078
[8] 斯蒂芬·波伊斯·博伊德和利文·范登伯格。凸优化。剑桥大学出版社,剑桥,2004年·Zbl 1058.90049号
[9] Jeanne Brooks-Gunn、Fong-ruey Liaw和Pamela Kato Klebanov。早期干预对低出生体重早产儿认知功能的影响。《儿科杂志》,120(3):350-3591992。
[10] Kwon Chuen Gary Chan、Sheung Chi Phillip Yam和Zheng Zhang。通过经验平衡校准加权对平均治疗效果进行全球有效的非参数推断。《皇家统计学会杂志:B辑(统计方法)》,78(3):673-700,2016年·Zbl 1414.62107号
[11] Richard Crump、V Joseph Hotz、Guido Imbens和Oscar Mitnik。移动目标:通过改变2006年的估计,解决平均治疗效果估计中有限的重叠问题·Zbl 1163.62083号
[12] 亚历克西斯·戴蒙德(Alexis Diamond)和贾斯吉特·塞孔(Jasjeet S Sekhon)。估计因果效应的遗传匹配:在观察性研究中实现平衡的通用多元匹配方法。《经济与统计评论》,95(3):932-9452013。
[13] 大卫·L·多诺霍。统计估计和最佳回收率。《统计年鉴》,第238-270页,1994年·Zbl 0805.62014号
[14] Bradley Efron和Robert J Tibshirani。引导程序简介。CRC出版社,1994年。32 ·Zbl 0835.62038号
[15] Jerome Friedman、Trevor Hastie和Robert Tibshirani。统计学习的要素。施普林格,柏林,2001年·Zbl 0973.62007号
[16] 丹尼尔·盖西(Daniel P Giesy)。赋范线性空间中的凸性条件。美国数学学会学报,125(1):114-1461966·Zbl 0183.13204号
[17] 保罗·W·戈德堡、克里斯托弗·基·威廉姆斯和克里斯托弗·M·毕晓普。具有输入相关噪声的回归:高斯过程处理。《神经信息处理系统进展》,第493-499页,1998年。
[18] Bernard G Greenberg。协方差分析和平衡在分析调查中的应用。《美国公共卫生与国家卫生杂志》,43(6 Pt 1):692-6991953年。
[19] 阿瑟·格雷顿(Arthur Gretton)、卡斯滕·博格沃德(Karsten M Borgwardt)、马尔特·拉什(Malte Rasch)、伯恩哈德·施奥尔科普夫(Bernhard Sch¨olkopf)和亚历克斯·J·斯莫拉。两样本问题的核方法。神经信息处理系统进展,第513-520页,2006年。
[20] M Grotschel、L Lovasz和A Schrijver。几何算法和组合优化。施普林格,纽约,1993年·Zbl 0837.05001号
[21] James J Heckman、Hidehiko Ichimura和Petra E Todd。匹配作为计量经济评估估计器:来自职业培训计划评估的证据。《经济研究综述》,64(4):605-6541997年·Zbl 0887.90039号
[22] 詹妮弗·希尔。因果推理的贝叶斯非参数建模。《计算与图形统计杂志》,2012年。
[23] Daniel E Ho、Kosuke Imai、Gary King和Elizabeth A Stuart。匹配作为非参数预处理,用于减少参数因果推理中的模型依赖性。政治分析,15(3):199-2362007。
[24] 斯特凡诺·米亚库斯(Stefano M Iacus)、加里·金(Gary King)和朱塞佩·波罗(Giuseppe Porro)。没有平衡检查的因果推断:粗糙的精确匹配。政治分析,第mpr0132011a页·Zbl 1396.62011年
[25] 斯特凡诺·米亚库斯(Stefano M Iacus)、加里·金(Gary King)和朱塞佩·波罗(Giuseppe Porro)。单调不平衡边界的多元匹配方法。《美国统计协会杂志》,106(493):345-3612011b·Zbl 1396.62011年
[26] Guido W Imbens和Donald B Rubin。统计、社会和生物医学科学中的因果推理。剑桥大学出版社,2015年·Zbl 1355.6202号
[27] 内森·卡卢斯。因果推理的最佳匹配框架。2017年第20届国际人工智能与统计会议论文集。
[28] 内森·卡卢斯。控制实验设计中的最优先验平衡。英国皇家统计学会杂志:B辑(统计方法),80(1):85-1122018·兹比尔06840458
[29] Nathan Kallus和Michele Santacatterina。核最优正交性加权:一种估计连续治疗效果的平衡方法。arXiv预印本arXiv:1910.119722019a。
[30] 内森·卡卢斯和米歇尔·桑塔卡特琳娜。使用核最优匹配对广义平均治疗效果进行最优估计。arXiv预印本arXiv:1908.047482019b。
[31] 内森·卡卢斯(Nathan Kallus)、布伦顿·彭尼科克(Brenton Pennicooke)和米歇尔·桑塔卡特琳娜(Michele Santacaterina)。在脊柱手术干预的观察研究中,使用核最优匹配对样本平均治疗效果进行更稳健的估计。arXiv预印本arXiv:1811.042742018。
[32] Leonid Vasilevich Kantorovich和G Sh Rubinstein。在完全可加函数空间上。维斯特尼克·列宁格勒。大学,13(7):52-591958·Zbl 0082.11001号
[33] 加里·金(Gary King)和曾兰彻(Langche Zeng)。极端反事实的危险。政治分析,14(2):131-1592006。
[34] 米歇尔·勒杜和米歇尔·塔拉格兰德。巴拿赫空间中的概率:等周和过程。施普林格,1991年·Zbl 0748.60004号
[35] Winston Lin.关于实验数据回归调整的不可知论注释:重新审视自由人的批判。应用统计年鉴,7(1):295-3182013·Zbl 1454.62217号
[36] 伯纳德·莫雷。类型、子类型和k-凸性。巴拿赫空间几何手册,2:1299-13322003·Zbl 1074.46006号
[37] 阿尔弗雷德·穆勒(Alfred M¨uller)。积分概率度量及其函数生成类。应用概率的进展,第429-443页,1997年·Zbl 0890.60011号
[38] G皮西耶。Sur les espaces quine contiennent pas de'1无形式'ement。C.R.学院。科学。巴黎塞纳。,277:991-994, 1973. ·Zbl 0271.46011号
[39] 赵庆元和珀西瓦尔·丹尼尔。熵平衡具有双重鲁棒性。《因果推理杂志》,5(1),2017年。
[40] 詹姆斯·M·罗宾斯。顺序可忽略的缺失数据和因果推理模型中的鲁棒估计。《美国统计协会期刊》,第6-10页,1999年。
[41] 詹姆斯·罗宾斯(James M Robins)、安德烈亚·罗特尼茨基(Andrea Rotnitzky)和赵璐萍(Lue Ping Zhao)。当某些回归变量不总是被观测时,回归系数的估计。美国统计协会杂志,89(427):846-8661994·Zbl 0815.62043号
[42] 保罗·罗森鲍姆。观察性研究的最佳匹配。《美国统计协会杂志》,84(408):1024-10321989年。
[43] 保罗·罗森鲍姆。观察性研究的最佳设计特征。《皇家统计学会杂志:B辑(方法学)》,53(3):597-6101991年·Zbl 0800.62465号
[44] 保罗·罗森鲍姆。观察研究设计。施普林格,纽约,2010年·Zbl 1308.62005号
[45] Paul R Rosenbaum和Donald B Rubin。因果效应观察性研究中倾向评分的中心作用。《生物统计学》,70(1):41-551983年·Zbl 0522.62091号
[46] Paul R Rosenbaum、Richard N Ross和Jeffrey H Silber。卵巢癌治疗的观察性研究中的最小距离匹配采样和精细平衡。美国统计协会杂志,102(477):75-832007·Zbl 1284.62670号
[47] 哈尔西·L·罗伊登。实际分析。普伦蒂斯·霍尔,1988年·Zbl 1191.26002号
[48] 唐纳德·鲁宾(Donald B Rubin),通过匹配消除观察研究中的偏见。生物统计学,第159-183页,1973年。
[49] Donald B Rubin,等百分比偏差减少的多元匹配方法,i:一些例子。生物统计学,第109-120页,1976a·Zbl 0326.62043号
[50] Donald B Rubin。等百分比偏差减少的多元匹配方法,ii:固定样本大小的偏差减少最大值。《生物计量学》,第121-1321976b页·Zbl 0326.62044号
[51] Donald B Rubin,关于“实验数据的随机化分析:fisher随机化测试评论”的评论。美国统计协会杂志,75(371):591-5931980。
[52] 唐纳德·B·鲁宾和尼尔·托马斯。椭球分布的仿射不变匹配方法。《统计年鉴》,第1079-10931992页·Zbl 0761.62065号
[53] 弗雷德里克·塞拉夫耶、迈克尔·希金斯和贾斯吉特·塞孔。大规模选民动员实验结果的广义完全匹配和外推。arXiv预印本arXiv:1202.37572017。
[54] 丹尼尔·谢尔夫斯坦(Daniel O Scharfstein)、安德烈亚·罗特尼茨基(Andrea Rotnitzky)和詹姆斯·罗宾斯(James M Robins)。使用半参数无响应模型调整不可忽视的退出。《美国统计协会杂志》,94(448):1096-11201999·Zbl 1072.62644号
[55] Bernhard Scholkopf和Alexander J Smola。使用内核学习:支持向量机、正则化、优化及其他。麻省理工学院出版社,2001年。
[56] Bharath K Sriperumbudur、Kenji Fukumizu和Gert RG Lanckriet。测量的普遍性、特征核和rkhs嵌入。arXiv预印本arXiv:1003.08872010·Zbl 1280.68198号
[57] 伊丽莎白·A·斯图亚特。因果推理的匹配方法:回顾与展望。《统计科学:数理统计研究所评论期刊》,25(1):12010年1月·Zbl 1328.62007号
[58] 罗伯特·提比拉尼(Robert Tibshirani)。通过套索回归收缩和选择。英国皇家统计学会杂志。B系列(方法学),第267-288页,1996年·Zbl 0850.62538号
[59] 霍尔格·温德兰(Holger Wendland)。分散数据近似,第17卷。剑桥大学出版社,2004年·Zbl 1185.65022号
[60] 克里斯托弗·基·威廉姆斯和卡尔·爱德华·拉斯穆森。机器学习的高斯过程。麻省理工学院出版社,马萨诸塞州剑桥,2006年·Zbl 1177.68165号
[61] 安德鲁·戈登·威尔逊和瑞安·普雷斯科特·亚当斯。用于模式发现和外推的高斯过程核。在2013年国际机器学习会议上,第1067-1075页。
[62] Dan Yang、Dylan S Small、Jeffrey H Silber和Paul R Rosenbaum。肥胖和手术结果研究中的最佳匹配,与精细平衡的偏差最小。生物统计学,68(2):628-6362012·Zbl 1274.62910号
[63] 张坤(Kun Zhang)、乔纳斯·彼得斯(Jonas Peters)、多米尼克·詹津(Dominik Janzing)和伯恩哈德·施奥尔科普夫(Bernhard Sch¨olkopf)。基于核的条件独立性测试及其在因果发现中的应用。arXiv预印本arXiv:1202.37752012。
[64] 赵清源。定制损失函数的协变量平衡倾向得分。arXiv预印本arXiv:1601058902016·Zbl 1420.62464号
[65] 何塞·祖比扎雷塔。在术后肾衰竭的观察研究中使用混合整数规划进行匹配。《美国统计协会杂志》,107(500):1360-13712012·Zbl 1258.62119号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。