×

缺失数据和因果推断的粗化倾向得分和混合估计。 (英语) Zbl 07763456号

摘要:在缺失数据和因果推断领域,双稳健(DR)估计器备受关注,它涉及结果回归(RG)模型和倾向得分(PS)模型。如果正确指定了任一模型,则这些DR估计是一致的和渐近正态的。尽管DR估计器在理论上很有吸引力,但其实际效用仍存在争议(例如[J.D.Y.Kang博士J.L.Schafer(谢弗),统计科学。22,第4期,523–539(2007年;兹比尔1246.62073)]). 主要问题之一是,由于估计的PS的极值,近零分母可能导致不稳定估计。相比之下,当RG模型正确且通常比DR估计更稳定时,仅基于RG模型的常规RG估计是有效的,尽管RG模型不正确时可能会有偏差。鉴于RG和DR估计量的独特优势,我们提出了一类混合估计量,试图在RG和RD估计量之间取得合理的平衡。这些混合估值器是由启发式参数驱动的,与基于原始模型的PS估值相比,粗化PS估值不太可能采用极值,对PS模型的错误指定也不太敏感。在模拟研究中,将建议的估计值与现有估计值进行了比较,并用一项有关产科分娩进展和分娩结局的大型观察性研究的实际数据进行了说明。
{©2014 The Authors.International Statistical Review©2014国际统计研究所}

MSC公司:

62层35 鲁棒性和自适应程序(参数推断)
62D99型 统计抽样理论及相关课题
62J99型 线性推理、回归
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 安德烈斯·R。L.和DayM.‐C.(2000)。与母亲吸烟相关的围产期并发症。塞明。新生儿。,5, 231-241.
[2] 孟加拉国和罗宾斯J。M.(2005)。缺失数据和因果推理模型中的双重稳健估计。生物。,61, 962-972. ·Zbl 1087.62121号
[3] 城堡A。,亚当斯。K.、MelvinC。L.、KelschC.和博尔顿。L.(1999)。怀孕期间吸烟的影响:五项荟萃分析。《美国法学评论》。医学,16,208-215。
[4] 曹禺。,齐亚西亚。A.和DavidianM。(2009). 改进不完全数据总体均值的双稳健估计的效率和鲁棒性。《生物特征》,96,723-734·Zbl 1170.62007年
[5] 达戈斯蒂诺。B.Jr.(1998)。倾向评分法,用于在治疗与非随机对照组的比较中减少偏差。统计师。医学,172265-2281。
[6] DudoitS.、。,范德兰。J.、KelesS.、。,莫里纳罗。M.,SinisiS。E.和Teng S。L.(2003)。基于损失的估计和交叉验证:应用于微阵列数据分析和模体发现。加州大学伯克利分校生物统计学工作论文系列。工作Pap。,137.(可从以下网站获得:http://biostats.bepress.com/ucbbiostat/paper137).
[7] Goldenberg R.L.、CulhaneJ。F.、IamsJ。D.&RomeroR公司。(2008). 早产1:流行病学和早产原因。《柳叶刀》,37175-84。
[8] HiranoK和ImbensG公司。W.(2001)。使用倾向评分权重估计因果效应:右心导管插入术数据的应用。卫生服务。和结果研究方法。,2, 259-278.
[9] 康杰。D.Y.和Schaffer J.L.(2007)。双重稳健性的解密:从不完整数据估计总体平均值的替代策略的比较(与讨论)。统计师。科学。,22, 523-539. ·Zbl 1246.62073号
[10] 利普西茨。R.,易卜拉欣J。G.和ZhaoL。第(1999)页。属性类似于最大似然的缺失协变量数据的加权估计方程。《美国统计杂志》。协会,94,1147-1160·Zbl 1072.62532号
[11] LunseverdJ。K.和Davidian M。(2004). 在因果治疗效果评估中通过倾向得分进行分层和加权:一项比较研究。统计师。医学,23,2937-2960。
[12] 罗宾斯J。M.&GreenlandS公司。(1992). 直接和间接影响的可识别性和可交换性。流行病。,143-155页。
[13] 罗宾斯J。M.、HernanM。A.和BrumbackB。(2000). 流行病学中的边缘结构模型和因果推断。流行病。,11, 550-560.
[14] 罗宾斯J。M.和RotnitzkyA。(2001). 评论P.J.Bickel J.Kwon的“半参数模型的推断:一些问题和答案”。统计师。罪。,11, 920-936.
[15] 罗宾斯J。M.、RotnitzkyA.和赵力。P.(1994)。当某些回归变量不总是被观测时,回归系数的估计。《美国统计杂志》。协会,89,846-866·Zbl 0815.62043号
[16] 罗森鲍姆。R.&RubinD.B.(1983年)。倾向评分在因果效应观察性研究中的中心作用。生物特征,70,41-55·Zbl 0522.62091号
[17] 罗森鲍姆。R.&RubinD.B.(1984)。使用倾向得分的子分类减少观察性研究中的偏见。《美国统计杂志》。协会,79,516-524。
[18] 鲁宾D。B.(1974年)。在随机和非随机研究中估计治疗的因果效应。教育学杂志。心理医生。,66、688至701。
[19] 鲁宾数据库。(1976). 推断和缺失数据。《生物统计学》,63,581-592·Zbl 0344.62034号
[20] 鲁宾D。B.和van derLaanM。J.(2008)。经验效率最大化:随机实验和生存分析中改进的局部有效协变量调整。国际生物统计杂志。,4.第5条。
[21] 谢尔夫斯坦D。O.、RotnitzkyA.和罗宾斯J。M.(1999)。使用半参数无响应轻便摩托车调整不可忽视的辍学(讨论)。《美国统计杂志》。协会,94,1096-1146·Zbl 1072.62644号
[22] 沙恩。R.&BrackenM公司。B.(2000年)。对母亲吸烟与早产关系的前瞻性研究进行系统回顾和荟萃分析。Am.J.Obset.美国律师协会。妇科。,182, 465-472.
[23] 坦兹。(2006). 使用倾向得分进行因果推理的分布方法。《美国统计杂志》。协会,101,1619-1637·Zbl 1171.62320号
[24] 坦兹。(2007年)。了解RG、PS和DR.Statist。科学。,22, 560-568. ·Zbl 1246.62077号
[25] 坦兹。(2010). 带反加权的有界、有效和双重稳健估计。《生物特征》,97,661-682·Zbl 1195.62037号
[26] 齐亚西亚。A.和DavidianM。(2007年)。注释:双重稳健性的解密:从不完整数据估计总体平均值的替代策略的比较。统计师。科学。,22, 569-573. ·Zbl 1246.62078号
[27] 范德拉恩。J.和Robins J。M.(2003)。截尾纵向数据和因果关系的统一方法纽约:Spring‐Verlag·Zbl 1013.62034号
[28] 范德拉恩。J.&RubinD.B.(2006年)。目标最大似然学习。国际生物统计杂志。,2(1). 第11条。
[29] 张杰。,TroendleJ。,雷迪大学。M.,笑声。K.,分支机构D。W.、Burkman R.、。,兰迪·H。J.、HibbardJ。美国、哈伯曼、。,拉米雷斯。M.,BailitJ。L.、霍夫曼。K.、GregoryK。D.、Gonzalez‐QuinteroV。H.、KominiarekM.、。,利尔曼。A.、HatjisC。G.和vanVeldhuisenP。(2010). 美国当代剖宫产实践。Am.J.Obset.美国律师协会。妇科。,203、326、e1-10。安全劳工联盟。
[30] 张梓。,ChenZ,TroendleJ。F.和ZhangJ。(2012). 分位数因果推断与产科应用。生物。,68, 697-706. ·Zbl 1272.62102号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。