×

校准技术包括调查抽样、缺失数据分析和因果推断。 (英语) Zbl 07779064号

摘要:我们对在三个不同领域开发的校准方法进行了批判性回顾:调查抽样、缺失数据分析和因果推断。我们强调了缺失数据分析和因果推断中使用的校准技术与调查抽样中传统校准权重和估计的联系和变化,并通过模型校准和经验似然提供了一个通用框架,以统一最近文献中提出的不同校准方法。目的是证明校准方法在实现缺失数据分析和因果推断的一些高度期望属性方面的成功和有效性。
©2022国际统计研究所。

理学硕士:

62Gxx公司 非参数推理
62Dxx号 统计抽样理论及相关课题
62件 统计学的应用

软件:

sbw公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Abadie,A.和Imbens,G.W.(2006年)。平均治疗效果匹配估计量的大样本性质。《计量经济学》,74(1),235-267·Zbl 1112.62042号
[2] Athey,S.,Imbens,G.W.&Wager,S.(2018年)。近似残差平衡:在高维度中对平均治疗效果进行减损推断。J.R.Stat.Soc.:序列号。B(Stat.Methodol.),80(4),597-623·Zbl 1398.62194号
[3] Bang,H.和Robins,J.M.(2005)。缺失数据和因果推理模型中的双重稳健估计。生物统计学,61(4),962-973·Zbl 1087.62121号
[4] Chan,K.C.G.&Yam,S.C.P.(2014)。Oracle,在缺少响应的问题中进行多个稳健和多用途的校准。统计科学。,29(3), 380-396. ·Zbl 1331.62070号
[5] Chan,K.C.G.,Yam,S.C.P.&Zhang,Z.(2016)。通过经验平衡校准加权对平均治疗效果进行全球有效的非参数推断。J.R.Stat.Soc.:序列号。B(Stat.Methodol.),78(3),673-700·Zbl 1414.62107号
[6] Chattopadhyay,A.、Hase,C.H.和Zubizarreta,J.R.(2020年)。平衡与建模方法在实践中的权重。《统计医学》,39(24),3227-3254。
[7] Chen,S.和Haziza,D.(2017)。用于处理调查中无应答项目的多重稳健插补程序。《生物特征》,104(2),439-453·Zbl 1506.62229号
[8] Chen,J.和Sitter,R.R.(1999年)。在复杂调查中有效使用辅助信息的伪经验似然方法。统计正弦。,9, 385-406. ·Zbl 0930.62005号
[9] Chen,J.、Sitter,R.R.和Wu,C.(2002)。使用经验似然方法获得调查回归估计值中的范围限制权重。《生物特征》,89(1),230-237·Zbl 0997.62008号
[10] Chen,M.、Thompson,M.E.和Wu,C.(2018)。按设计缺失数据的复杂调查的经验似然法。统计正弦。,28, 2027-2048. ·Zbl 1406.62012年
[11] Chen,S.和Haziza,D.(2018年)。缺失数据乘法稳健估计的Jackknife经验似然方法。计算。统计数据。分析。,127, 258-268. ·Zbl 1469.62042号
[12] Chen,S.和Haziza,D.(2019年)。用于处理缺失数据的乘法稳健非参数多重插补。统计正弦。,29, 2035-2053. ·Zbl 1432.62145号
[13] Davidian,M.,Tsiatis,A.A.,Leon,S.,An,H.,Little,R.,Brumback,A.B.,Brumpack,L.C.,Molenberghs,G.&Schaferand,J.L.(2005)。缺失数据的预测试-后测试研究中治疗效果的半参数估计[附评论和反驳]。Inst.数学。《统计》,20(3),261-301·Zbl 1100.62554号
[14] Deming,W.E.&Stephan,F.F.(1940年)。当预期边际总和已知时,对采样频率表进行最小二乘调整。安。数学。《统计》,11(4),427-444。
[15] Devaud,D.&Tillé,Y.(2019年)。Deville和Särndal的校准:重温一个已有25年历史的成功优化问题。测试,281033-1065·Zbl 1439.62056号
[16] 德维尔,J.&Särndal,C.-E。(1992). 调查抽样中的校准估计器。《美国法律总汇汇编》,87(418),376-382·Zbl 0760.62010号
[17] Duan,X.和Yin,G.(2017年)。估计具有缺失响应的总体平均值的集合方法。斯堪的纳维亚J.Stat.,44,899-917·Zbl 1397.62047号
[18] Hainmueller,J.(2012)。因果效应的熵平衡:在观察性研究中产生平衡样本的多元重加权方法。政治分析。,20(1), 25-46.
[19] Han,P.(2014年a)。对缺失数据分析中的乘法鲁棒估计器的进一步研究。J.统计计划。推断。,148, 101-110. ·Zbl 1432.62073号
[20] Han,P.(2014年b)。缺失数据回归分析中的乘法稳健估计。《美国统计协会期刊》,109(507),1159-1173·Zbl 1368.62279号
[21] Han,P.(2016年a)。结合逆概率加权和多重插补提高估计的稳健性。斯堪的纳夫。《美国联邦法律大全》,第43卷,第246-260页·Zbl 1371.62008年
[22] Han,P.(2016年b)。辍学纵向研究的内在效率和多重稳健性。《生物特征》,103(3),683-700·Zbl 1506.62239号
[23] Han,P.(2018)。数据缺失时的校准和多重稳健性不是随机的。统计正弦。,28, 1725-1740. ·Zbl 1406.62048号
[24] Han,P.,Kong,L.,Zhao,J.&Zhou,X.(2019)。不完全数据分位数估计的一般框架。J.R.Stat.Soc.:序列号。B(Stat.Methodol.),81(2),305-333·Zbl 1420.62173号
[25] Han,P.和Wang,L.(2013)。缺失数据的估计:超越双重稳健性。《生物特征》,100(2),417-430·Zbl 1284.62260号
[26] Hansen,H.M.、Madow,W.G.和Tepping,B.J.(1983年)。抽样调查中模型相关和概率抽样推断的评估。《美国统计协会期刊》,78(384),776-793。
[27] Hernan,M.A.和Robins,J.M.(2020年)。因果推理:假设。博卡拉顿:查普曼和霍尔/CRC。
[28] Hirano,K.、Imbens,G.W.和Ridder,G.(2003)。使用估计的倾向得分有效估计平均治疗效果。《计量经济学》,71(4),1161-1189·兹比尔1152.62328
[29] 霍维茨·D.G.和汤普森·D.J.(1952)。从有限宇宙中不替换抽样的推广。《美国统计协会期刊》,47(260),663-685·Zbl 0047.38301号
[30] 黄,C.-Y。,Qin,J.&Follmann,D.A.(2008)。预测试-后测试研究中基于经验似然的治疗效果评估。《美国统计协会期刊》,103(483),1270-1280·Zbl 1205.62033号
[31] Imai,K.和Ratkovic,M.(2014)。协变量平衡倾向得分。J.R.Stat.Soc.:序列号。B(Stat.Methodol.),76(1),243-263·Zbl 1411.62025号
[32] Imbens,G.W.&Rubin,D.B.(2015)。统计学、社会学和生物医学科学的因果推断:导论。剑桥大学出版社·Zbl 1355.6202号
[33] Kang,J.D.Y.和Schafer,J.L.(2007)。解密双重稳健性——从不完整数据中估计总体平均值的替代策略的比较。统计科学。,22(4), 523-539. ·Zbl 1246.62073号
[34] Kim,J.K.(2010)。在抽样调查中使用指数倾斜进行校准估计。Surv公司。Methodol.方法。,36(2), 145-155.
[35] Kim,J.K.和Park,M.(2010年)。调查抽样中的校准估计。国际统计版次,78(1),21-39。
[36] Kott,P.S.(2006)。使用校准加权来调整无响应和覆盖误差。调查方法,32,133-142。
[37] Kott,P.S.&Chang,T.(2010年)。使用校准权重调整不可忽视的装置无响应。《美国统计协会期刊》,105(491),1265-1275·Zbl 1390.62011年
[38] Lee,D.、Yang,S.、Dong,L.、Wang,X.、Zeng,D.和Cai,J.(2021)。使用观察性研究提高试验的概括性。生物识别。https://doi.org/10.1111/biom.13609 ·Zbl 1522.62171号 ·doi:10.1111/biom.13609
[39] Li,W.,Gu,Y.和Liu,L.(2020年)。解密一类多重稳健估计量。《生物统计学》,107(4),919-933·Zbl 1457.62034号
[40] Little,R.J.(1983年)。抽样调查中模型依赖和概率抽样推断的评估:评论。《美国统计协会期刊》,78(384),797-799。
[41] Little,R.J.(2004)。模仿还是不模仿?有限总体抽样的竞争推理模式。《美国统计协会期刊》,99(466),546-556·Zbl 1117.62389号
[42] Little,R.J.A.和Rubin,D.B.(2002年)。缺失数据的统计分析,2。John Wiley&Sons,Inc.:纽约·Zbl 1011.62004号
[43] Liu,Y.和Fan,Y.2021。有偏样本经验似然加权:逆概率加权的替代方法。arXiv:2111.12955。
[44] Lumley,T.、Shaw,P.A.和Dai,J.Y.(2011年)。不完全数据的测量校准估计器和半参数模型之间的联系。国际统计版次,79,200-220·Zbl 1422.62048号
[45] Lundström,S.和Särndal,C.‐E。(1999). 校准作为治疗无反应的标准方法。J.办公室。《法律总汇》,15(2),305-327。
[46] Molina,J.、Rotnitzky,A.、Sued,M.和Robins,J.M.(2017年)。因子化似然模型的多重稳健性。《生物特征》,104(3),561-581·Zbl 07072228号
[47] Newey,W.K.&Smith,R.J.(2004)。GMM和广义经验似然估计的高阶性质。《计量经济学》,72(1),219-255·Zbl 1151.62313号
[48] 奈曼,J.(1934)。关于代表性方法的两个不同方面:分层抽样方法和有目的的选择方法。J.R.Stat.Soc.,第97、558-606页。
[49] Ning,Y.、Sida,P.和Imai,K.(2020年)。通过高维协变量平衡倾向得分稳健估计因果效应。《生物统计学》,107533-554·Zbl 1451.62050
[50] Owen,A.(1988年)。单个函数的经验似然比置信区间。《生物特征》,75(2),237-249·Zbl 0641.62032号
[51] Owen,A.(2001年)。经验可能性。查普曼和霍尔/CRC出版社:纽约·Zbl 0989.62019
[52] Qin,J.和Lawless,J.(1994)。经验似然和一般估计方程。安.统计师。,22(1), 300-325. ·Zbl 0799.62049号
[53] Qin,J.、Leung,D.和Shao,J.(2002)。在不可忽视的无响应或信息抽样下使用调查数据进行估计。美国统计协会期刊,97,193-200·Zbl 1073.62513号
[54] Qin,J.&Zhang,B.(2007)。缺失反应问题中基于经验似然的推断及其在观察研究中的应用。J.R.Stat.Soc.:序列号。B(Stat.Methodol.),69(1),101-122·Zbl 07555352号
[55] Robins,J.M.、Rotnitzky,A.和Zhao,L.P.(1994年)。当某些回归变量不总是被观测时,回归系数的估计。《美国统计协会期刊》,89(427),846-866·兹比尔0815.62043
[56] Robins,J.M.、Rotnitzky,A.和Zhao,L.P.(1995年)。缺失数据下重复结果的半参数回归模型分析。《美国统计协会期刊》,90(429),106-121·Zbl 0818.62042号
[57] Robins,J.、Sued,M.、Lei‐gomez,Q.和Rotnitzky,A.(2007)。备注:当“逆概率”权重高度可变时,双稳健估计的性能。统计科学。,22(4),544-559·Zbl 1246.62076号
[58] Rosenbaum,P.R.(1987)。基于模型的直接调整。《美国统计协会杂志》,82(398),387-394·Zbl 0622.62010号
[59] Rosenbaum,P.R.、Ross,R.N.和Silber,J.H.(2007)。卵巢癌治疗的观察性研究中的最小距离匹配采样和精细平衡。美国统计协会期刊,102,75-83·Zbl 1284.62670号
[60] Rosenbaum,P.R.&Rubin,D.B.(1983年)。倾向评分在因果效应观察性研究中的中心作用。《生物特征》,70(1),41-55·Zbl 0522.62091号
[61] Rosenbaum,P.R.&Rubin,D.B.(1985年)。使用包含倾向得分的多元匹配抽样方法构建对照组。美国统计局。,39(1), 33-38.
[62] Royall,R.M.(1970年)。关于线性回归模型下的有限总体抽样理论。《生物特征》,57,377-387·Zbl 0197.16303号
[63] 鲁宾,D.B.(1976)。推断和缺失数据。《生物特征》,63(3),581-592·Zbl 0344.62034号
[64] 鲁宾,D.B.(1983)。抽样调查中模型依赖和概率抽样推断的评估:评论。《美国法律总汇汇编》,78(384),803-805。
[65] Rubin,D.R.、Stern,H.S.和Vehovar,V.(1995)。处理“不知道”调查答复:斯洛文尼亚公民投票的案例。《美国法律总汇汇编》第90卷,第822-828页。
[66] 塞恩达尔,C.‐E。(2007). 测量理论和实践中的校准方法。Surv公司。Methodol.方法。,33(2), 99-119.
[67] Scharfstein,D.O.,Rotnitzky,A&Robins,J.M.(1999)。使用半参数无响应模型调整不可忽视的辍学。《美国统计协会期刊》,94(448),1096-1120·Zbl 1072.62644号
[68] Seaman,S.R.和Vanstelland,S.(2018)。介绍不完全数据的双重稳健方法。统计科学。,33(2), 184-197. ·Zbl 1397.62176号
[69] Shi,X.、Miao,W.、Nelson,J.C.和Tchetgen Tchetgon,E.(2020年)。针对分类的未测量混淆,使用双重阴性控制调整进行多重稳健因果推断。J.R.Stat.Soc.:序列号。B(Stat.Methodol.),82(2),521-540·Zbl 07554764号
[70] Sitter,R.R.和Wu,C.(2002年)。辅助信息存在下二次有限总体函数的有效估计。《美国统计协会期刊》,97(458),535-543·Zbl 1073.62515号
[71] Tan,Z.(2006)。使用倾向得分进行因果推理的分布方法。《美国统计协会期刊》,101(476),1619-1637·Zbl 1171.62320号
[72] Tan,Z.(2010)。带反加权的有界、有效和双重稳健估计。《生物特征》,97(3),661-682·Zbl 1195.62037号
[73] Tan,Z.(2014)。抽样和缺失数据问题中校准估计器的二阶渐近理论。J.多变量。分析。,131, 240-253. ·Zbl 1298.62023号
[74] Tan,Z.(2020年)。使用模型错误指定和高维数据对倾向得分进行正则化校准估计。《生物统计学》(Biometrika),第107期,第137-158页·Zbl 1435.62274号
[75] Tan,Z.和Wu,C.(2015)。复杂调查的广义伪经验似然推断。加拿大。《美国联邦法律大全》,43(1),1-17·Zbl 1314.62037号
[76] Tsiatis,A.A.(2006年)。半参数理论与缺失数据,1。施普林格:纽约·Zbl 1105.6202号
[77] 范德法特,A.W.(1998)。渐进统计。剑桥大学出版社·Zbl 0910.62001号
[78] Wang,L.和Han,P.(2017)。因果处理效应的乘法稳健估计。未发表的手稿。
[79] Wang,L.和Tchetgen-Tchetgen,E.(2018)。使用工具变量对平均治疗效果进行有界、有效和多重稳健估计。J.R.Stat.Soc.:序列号。B(Stat.Methodol.),80(3),531-550·Zbl 1398.62348号
[80] Wang,Y.和Zubizarreta,J.R.(2020年)。最小离散近似平衡权:渐近性质和实际考虑。《生物统计学》,107(1),93-105·Zbl 1435.62054号
[81] Wu,C.(2003)。调查抽样中的最佳校准估计器。《生物特征》,90(4),937-951·Zbl 1436.62050
[82] Wu,C.(2005)。调查抽样中伪经验似然法的算法和R代码。调查方法。,31(2), 239.
[83] Wu,C.&Lu,W.(2016)。复杂调查的校准加权方法。国际统计版次,84(1),79-98·Zbl 07763473号
[84] Wu,C.&Rao,J.N.K.(2006)。复杂调查的伪经验似然比置信区间。加拿大统计杂志,34(3),359-375·Zbl 1104.62008年
[85] Wu,C.和Sitter,R.R.(2001年)。使用测量数据中完整辅助信息的模型校准方法。《美国统计协会期刊》,96(453),185-193·Zbl 1015.62005号
[86] Wu,C.&Thompson,M.E.(2020年)。抽样理论与实践。施普林格:查姆·Zbl 1434.62003年
[87] Wu,C.和Zhang,S.(2019)。评论:Deville和Särndal的校准:重温一个25年前成功的优化问题。测试,281082-1086·Zbl 1447.62015年
[88] Zhang,S.和Han,P.2019。缺失数据GLM的多重稳健估计的简单实现。未出版的手稿。
[89] Zhang,S.,Han,P.&Wu,C.(2019年)。缺失数据的非随机前测后测研究的经验似然推断。电子。《统计杂志》,13(1),2012-2042年·Zbl 1420.62209号
[90] Zhao,Q.和Percival,D.(2017)。熵平衡具有双重鲁棒性。J.因果推断。,5(1)。
[91] Zubizarreta,J.R.(2015)。平衡不完整结果数据估计协方差的稳定权重。《美国统计协会期刊》,110(511),910-922·Zbl 1373.62051号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。