×

通过完全条件规范对离散和连续数据进行多重插补。 (英语) 兹比尔1122.62382

摘要:多重插补的目的是从不完整的数据中为统计估计提供有效的推论。为了实现这一目标,插补值应保留数据中的结构以及该结构的不确定性,并包括有关生成缺失数据的过程的任何知识。存在两种输入多元数据的方法:联合建模(JM)和完全条件规范(FCS)。JM以参数统计理论为基础,引入了统计特性已知的插补程序。JM理论上是合理的,但联合模型可能缺乏表示典型数据特征所需的灵活性,从而可能导致偏差。FCS是一种半参数和灵活的替代方案,它通过一系列条件模型来指定多元模型,每个条件模型对应一个不完全变量。FCS提供了极大的灵活性,易于应用,但其统计特性很难确定。仿真工作表明,FCS在所研究的案例中表现良好。本文回顾并比较了这些方法。JM和FCS应用于3801名荷兰女孩的青春期发育数据,这些女孩的月经初潮(两类)、乳房发育(五类)和阴毛发育(六个阶段)数据缺失。这些数据的插补是在两种模型下创建的:带舍入的多元正态模型和条件指定的离散模型。JM方法在参考曲线中引入了偏差,而FCS没有。本文的结论是,当无法指定方便、现实的联合分发时,FCS是JM的一个有用且易于应用的灵活替代方案。

MSC公司:

第62页第10页 统计学在生物学和医学中的应用;元分析
62号02 生存分析和删失数据中的估计
65立方厘米60 统计中的计算问题(MSC2010)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Rubin DB,调查中无应答的多重插补(1987年)·数字对象标识代码:10.1002/9780470316696
[2] Rubin DB,《美国统计协会杂志》91(434),第473页–(1996)·doi:10.1080/01621459.1996.10476908
[3] Collins LM,《心理学方法》第6(3)页,第330页——(2001)·doi:10.1037/1082-989X.6.4.330
[4] Scheuren F.,美国统计学家59(4),第315页–(2005)·Zbl 05680661号 ·doi:10.1198/000313005X74016
[5] Dempster AP,统计方法39第1页–(1977年)
[6] Little Rja,缺失数据的统计分析(2002年)·doi:10.1002/9781119013563
[7] Schafer JL,不完全多元数据分析(1997)·doi:10.1201/9781439821862
[8] Schafer JL,《医学研究中的统计方法》8(1),第3页–(1999)·doi:10.1177/096228029900800102
[9] Stern HS,《心理学方法》第6(3)页,第317页–(2001)
[10] Allison PD,缺失数据(2002年)·数字对象标识代码:10.4135/9781412985079
[11] Schafer JL,《心理学方法》7(2),第147页–(2002)·doi:10.1037/1082-989X.7.2.147
[12] Rubin DB,《医学统计》10(4),第585页–(1991)·doi:10.1002/sim.4780100410
[13] Barnard J.,《医学研究方法》8(1),第17页–(1999)·doi:10.1177/096228029900800103
[14] 格陵兰S.,《美国流行病学杂志》142(12)pp 1255–(1995)·doi:10.1093/oxfordjournals.aje.a117592
[15] Kmetic A.,流行病学13(4),第437页–(2002)·doi:10.1097/00001648-200207000-00012
[16] Abraham WT,精神病学17(4),第315页–(2004)
[17] Croy CD,《美国儿童和青少年精神病学学会杂志》44(12),第1230页–(2005)·doi:10.1097/01.chi.0000181044.06337.6f
[18] Kneipp SM,《护理研究》50(6),第384页–(2001)·doi:10.1097/00006199-200111000-00010
[19] Patrician PA,《护理与健康研究》25(1),第76页–(2002)·doi:10.1002/nur.10015
[20] McCleary L.,《护理研究》51(5),第339页–(2002)·doi:10.1097/00006199-200209000-00012
[21] Fox-Wasylyshyn SM,《护理与健康研究》28(6),第488页–(2005)·doi:10.1002/nur.20100
[22] Molenberghs G.,《流行病学与圣普利克评论》47(6),第499页–(1999)
[23] Zhou XH,《医学统计学》20(9)第1541页–(2001)·doi:10.1002/sim.689
[24] Raghunathan TE,公共卫生25,第99页–(2004)·doi:10.1146/annurev.publhealth.25.102802.124410
[25] 克劳福德SL,《临床流行病学》48(2),第209页–(1995)·doi:10.1016/0895-4356(94)00124-9
[26] Faris PD,《临床流行病学》55(2),第184页–(2002)·doi:10.1016/S0895-4356(01)00433-4
[27] Oostenbrink JB,《健康经济学》14(8),第763页–(2005)·doi:10.1002/hec.966
[28] Catellier DJ,Med Sci Sports Exec 37(11)pp S555–(2005)·doi:10.1249/01.mss.000185651.59486.4e
[29] Wood AM,《国际流行病学杂志》34(1),第89页–(2005)·doi:10.1093/ije/dyh297
[30] Smits N.,《教育测量杂志》39(3)第187页–(2002)·doi:10.1111/j.1745-3984.2002.tb01173.x
[31] Peugh JL,《教育研究评论》74(4)pp 525–(2004)·doi:10.3102/00346543074004525
[32] Walczak B.,《系统》58(1)第29页–(2001)·Zbl 0986.35120号
[33] Longford NT,医学研究方法10(6)pp 429–(2001)·Zbl 1121.62636号 ·doi:10.1177/096228020101000605
[34] Olinsky A.,《运筹学杂志》151(1),第53页–(2003)·Zbl 1113.62361号 ·doi:10.1016/S0377-2217(02)00578-7
[35] Allison PD,《变态心理学杂志》112(4)pp 545–(2003)·doi:10.1037/0021-843X.112.4.545
[36] Twisk J.,《临床流行病学杂志》55(4)pp 329–(2002)·doi:10.1016/S0895-4356(01)00476-0
[37] Demirtas H.,《现代应用统计方法杂志》3(2),第305页–(2004)·doi:10.22237/jmasm/1099267500
[38] Streiner DL,加拿大精神病学杂志47(1),第68页–(2002)
[39] Kristman VL,《欧洲流行病学杂志》20(8),第657页–(2005)·doi:10.1007/s10654-005-7919-7
[40] Little R.,《生物统计学》52(4)第1324页–(1996)·Zbl 0925.62459号 ·doi:10.2307/2532847
[41] Liu G.,《生物制药统计学杂志》12(2)第207页–(2002)·doi:10.1081/BIP-120015744
[42] Houck PR,精神病学研究129(2)第209页–(2004)·doi:10.1016/j.psychres.2004.08.001
[43] 唐磊,《医学统计学》24(14),第2111页–(2005)·doi:10.1002/sim.2099年
[44] Beunckens C.,试验2(5)第379页–(2005)·doi:10.191/1740774505cn119oa
[45] Barnes SA,《医学统计》25(2),第233页–(2006年)·doi:10.1002/sim.2231
[46] Pigott TD,《评估与健康职业》24(3)第277页–(2001)·doi:10.1177/01632780122034920
[47] 易卜拉欣·JG,《美国统计协会杂志》100(469),第332页–(2005)·Zbl 1117.62360号 ·doi:10.19198/0162114504000001844
[48] Schafer JL,Neerlandica统计57(1),第19页–(2003)·Zbl 04575109号 ·doi:10.1111/1467-9574.00218
[49] 品牌Jpl,Neerlandica统计57(1)第36页–(2003)·Zbl 04575110号 ·doi:10.1111/1467-9574.00219
[50] Meng XL,《统计科学》第10卷第538页–(1995年)
[51] Van Buuren S.,《医学统计》18(6),第681页–(1999)·doi:10.1002/(SICI)1097-0258(19990330)18:6<681::AID-SIM71>3.0.CO;2-右
[52] Abayomi K.,多元插补诊断(2005年)·Zbl 1273.62257号
[53] Schenker N.,《计算统计与数据分析》22(4),第425页–(1996)·Zbl 0875.62095号 ·doi:10.1016/0167-9473(95)00057-7
[54] Rubin DB,《商业经济与统计杂志》,第4页,第87页–(1986年)
[55] 小Rja。,《商业经济与统计杂志》第6卷第287页–(1988年)
[56] Harrell F.,回归建模策略,以及线性模型、逻辑回归和生存分析的应用(2001年)·Zbl 0982.62063号
[57] Albert JH,《美国统计协会杂志》88页669–(1993)·doi:10.1080/01621459.1993.10476321
[58] Yucel RM,《美国统计协会杂志》100(472)pp 1123–(2005)·Zbl 1117.62455号 ·doi:10.1198/01621450000000754
[59] 品牌Jpl。,制定、实施和评估不完整数据集统计分析的多重插补策略(1999年)
[60] Raghunathan TE,《调查方法》第27页第85页——(2001)
[61] Parzen M.,Biometrika 92(4),第971页–(2005)·Zbl 1310.62040号 ·doi:10.1093/biomet/92.4.971
[62] Reilly M.,《医学统计学》,第16(1)页,第5页–(1997年)·doi:10.1002/(SICI)1097-0258(19970115)16:1<5::AID-SIM469>3.0.CO;2-8
[63] Junninen H.,《大气环境》38(18),第2895页–(2004)·doi:10.1016/j.atmosenv.2004.026
[64] 围场SM,Biometrika 89(3)pp 529–(2002)·Zbl 1036.62002号 ·doi:10.1093/biomet/89.3.529
[65] Heckman JJ,《经济和社会计量年鉴》,第5页,第475页–(1976年)
[66] Greenlees WS,《美国统计协会杂志》77,第251页–(1983年)·doi:10.1080/01621459.1982.1047793
[67] Wei Gcg,生物计量学47(4)第1297页–(1991)·doi:10.2307/2532387
[68] Pan W.,分析7(2),第111页–(2001)
[69] Goetghebeur E.,《生物统计学》56(4),第1139页–(2000)·Zbl 1060.62616号 ·doi:10.1111/j.0006-341X.2000.01139.x
[70] 潘伟,《生物统计学》第56(1)页,199–(2000)·Zbl 1060.62649号 ·doi:10.1111/j.0006-341X.2000.00199.x
[71] Bechger TM,遗传学32(2),第145页–(2002)
[72] Hopke PK,《生物计量学》57(1),第22页–(2001)·Zbl 1209.62359号 ·doi:10.1111/j.0006-341X.2001.00022.x号文件
[73] Lubin JH,《环境健康展望》112(17),第1691页–(2004)·doi:10.1289/ehp.7199
[74] Fridley B.,BMC遗传学4(1)pp S42–(2003)·doi:10.1186/1471-2156-4-S1-S42
[75] Heeringa SG,家庭财富粗化调查数据的多元插补(2002年)
[76] Rubin DB,1990年统计计算科会议记录
[77] Rubin DB,Neerlandica统计57(1),第3页–(2003)·Zbl 04575108号 ·doi:10.1111/1467-9574.00217
[78] Van Buuren S.,《统计计算与模拟杂志》76(12),第1049页–(2006)·Zbl 1144.62332号 ·doi:10.1080/106293060810434
[79] 新泽西州霍顿,美国统计学家,55页244–(2001)·Zbl 05680456号 ·doi:10.1198/000313001317098266
[80] Kennickell AB,调查研究方法部分会议记录第1页–(1991)
[81] Heckerman D.,《机器学习研究杂志》1第49页–(2001年)
[82] Gelman A.,《美国统计协会杂志》99(466),第537页–(2004)·Zbl 1117.62343号 ·doi:10.1198/016214500000458
[83] Van Buuren S,《生活》(2000)
[84] Arnold BC,统计模型的条件规范(1999)
[85] 古德曼洛杉矶,《美国统计协会杂志》65页226–(1970)·网址:10.1080/01621459.1970.10481076
[86] Besag J.,《统计方法学》,第36页,第192页–(1974年)·Zbl 0311.60028号
[87] 阿诺德·不列颠哥伦比亚省,《美国统计协会杂志》84,第152页–(1989)·doi:10.1080/016214591989.10478750
[88] Gelman A.,《统计方法》第55页,第185页–(1993年)
[89] Gelman A.,《统计科学》第7页,第457页–(1991年)·Zbl 1386.65060号 ·doi:10.1214/ss/117701136
[90] Royston P.,《统计杂志》4第227页–(2004)
[91] Royston P.,《Stata Journal》第5卷第527页–(2005年)
[92] Fredriks MA,儿科研究47,第316页–(2000)·doi:10.1203/00006450-2000003000-00006
[93] Marshall WA,《儿童疾病档案》,第44页,第291页–(1969年)·doi:10.1136/adc.44.235.291
[94] Mul D.,儿科研究50,第479页–(2001年)·doi:10.1203/00006450-200110000-00010
[95] 小Rja。,《美国统计协会杂志》第87页第1227页–(1992年)
[96] McCullagh P,广义线性模型(1989)·Zbl 0588.62104号 ·doi:10.1007/978-1-4899-3242-6
[97] Venables WN,《现代应用统计与S》(2002年)·doi:10.1007/978-0-387-21706-2
[98] Hastie TJ,广义加性模型(1990)
[99] 新泽西州霍顿,美国统计学家57(4),第229页–(2003)·Zbl 1182.62002号 ·doi:10.1198/0003130032314
[100] Ake CF,会议记录第112页–(2005)
[101] Allison PD,SUGI 30诉讼第113页–(2005)
[102] Belin TR,《医学统计》,第18页,3123页–(1999年)·doi:10.1002/(SICI)1097-0258(19991130)18:22<3123::AID-SIM277>3.0.CO;2-2
[103] Gelman A.,《统计科学》,第16页,第249页–(2001年)·Zbl 1059.62511号 ·doi:10.1214/s/1009213728
[104] Briggs A.,《健康经济学》,第12页,第377页–(2003年)·doi:10.1002/hec.766
[105] Chen L.,《现代应用统计方法杂志》4(1),第288页–(2005)·doi:10.22237/jmasm/1114907160
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。