×

纵向研究中的缺失数据方法:综述。 (英语) Zbl 1203.62193号

摘要:不完整数据在生物医学和其他类型的研究中非常常见,尤其是在纵向研究中。在过去的三十年里,在这一领域做了大量的工作。一方面,这导致了对缺失数据概念、问题和方法的丰富分类,另一方面,也导致了各种数据分析工具的出现。分类法的元素包括:缺失的数据模式、机制和建模框架;推理范式;敏感性分析框架。这些都有详细描述。介绍了各种混凝土建模装置。为了使事情具体化,我们考虑了两个案例研究。第一项研究关注乳腺癌患者的生活质量,而第二项研究检查了马斯卡廷儿童肥胖研究的数据。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
62J99型 线性推断、回归
62年5月 线性回归;混合模型
65C60个 统计中的计算问题(MSC2010)
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Beckman RJ、Nachtsheim CJ、Cook RD(1987)《混合模型方差分析诊断》。技术计量学29:413–426·Zbl 0632.62068号 ·doi:10.2307/1269452
[2] Best NG、Spiegelhalter DJ、Thomas A、Brayne CEG(1996),现实复杂模型的贝叶斯分析。J R Stat Soc Ser A期刊159:323–342·doi:10.2307/2983178
[3] Beunckens C,Molenberghs G,Verbeke G,Mallinckrodt C(2008)不完全纵向高斯数据的潜在类混合模型。生物统计学64(1):96–105·Zbl 1274.62721号 ·文件编号:10.1111/j.1541-0420.2007.00837.x
[4] Breslow NE,Clayton DG(1993)广义线性混合模型中的近似推断。美国统计协会杂志88:9–25·Zbl 0775.62195号 ·doi:10.2307/2290687
[5] Brown ER,Ibrahim JG(2003a)纵向和生存数据的贝叶斯半参数联合层次模型。生物统计学59:221–228·Zbl 1210.62022号 ·doi:10.111/1541-0420.00028
[6] Brown ER,Ibrahim JG(2003b)联合治愈率和纵向模型的贝叶斯方法及其在癌症疫苗试验中的应用。生物统计学59:686–693·Zbl 1210.62145号 ·doi:10.1111/1541-0420.0079
[7] Brown ER、Ibrahim JG、DeGruttola V(2005)多个纵向生物标志物和存活率的灵活b样条模型。生物识别61:64-73·Zbl 1077.62102号 ·doi:10.1111/j.0006-341X.2005.030929.x
[8] Carpenter J,Pocock S,Lamm CJ(2002)《应对临床试验中的缺失数据:应用于哮喘试验的基于模型的方法》。统计医学21:1043–1066·doi:10.1002/sim.1065
[9] Chen M-H,Ibrahim JG(2002)具有缺失协变量的治愈率模型的最大似然方法。生物统计学57:43–52·Zbl 1209.62022号 ·doi:10.1111/j.0006-341X.2001.0043.x
[10] Chen M-H,Ibrahim JG,Lipsitz SR(2002)治愈率模型中缺失协变量的贝叶斯方法。终身数据分析8:117–146·Zbl 1037.62014年 ·doi:10.1023/A:1014835522957
[11] Chen M-H,Ibrahim JG,Shao Q-M(2004a)协变量随机缺失回归模型的后验分布性质和最大似然估计的存在性。美国统计协会杂志99:421–438·Zbl 1117.62308号 ·doi:10.1198/016214500000368
[12] Chen M-H,Ibrahim JG,Sinha D(2004b)具有治愈分数的纵向和生存数据的新联合模型。多变量分析杂志91:18–34·Zbl 1051.62098号 ·doi:10.1016/j.jmva.2004.04.005
[13] Chen M-H,Ibrahim JG,Shao Q-M(2006)Cox回归模型的后验适当性和计算及其对缺失协变量的应用。生物特征93:791–807·Zbl 1436.62476号 ·doi:10.1093/biomet/93.4.791
[14] Chen M-H,Ibrahim JG,Shao Q-M(2009)Cox回归模型的可识别性及其对缺失协变量的应用。J多变量分析(出版中)
[15] Chen Q,Ibrahim JG(2006)回归模型中缺少协变量和响应数据。生物统计学62:177–184·Zbl 1091.62056号 ·文件编号:10.1111/j.1541-0420.2005.00438.x
[16] Chen Q,Zeng D,Ibrahim JG(2007)随机缺失协变量回归模型的最大似然估计。美国统计协会杂志102:1309–1317·Zbl 1332.62112号 ·doi:10.1198/0162145000001058
[17] Chen Q,Ibrahim JG,Chen M-H,Senchaudhuri P(2008)缺失响应和协变量回归模型的理论和推断。多变量分析杂志99:1302–1331·Zbl 1141.62010年 ·doi:10.1016/j.jmva.2007.08.009
[18] Chi Y,Ibrahim JG(2006)多变量纵向和生存数据的联合模型。生物统计学62:432–445·Zbl 1097.62122号 ·doi:10.1111/j.1541-0420.2005.00448.x
[19] Chi Y,Ibrahim JG(2007)一类新的纵向和生存数据联合模型,包含零和零区治愈分数:一项国际乳腺癌研究小组试验的案例研究。新加坡统计局17:445–462
[20] Cook RD(1986)《地方影响评估》。J R Stat Soc Ser B期刊48:133–169·Zbl 0608.62041号
[21] Cowles MK,Carlin BP,Connett JE(1996)纵向序贯临床试验依从性数据的Bayesian tobit建模,不容忽视。美国统计协会杂志91:86–98·Zbl 0870.62083号 ·doi:10.2307/2291385
[22] Creemers A、Hens N、Aerts M、Molenberghs G、Verbeke G、Kenward MG(2009)共享参数模型和随机缺失(提交出版)
[23] Daniels MJ,Hogan JW(2008)纵向研究中的缺失数据。查普曼和霍尔,伦敦
[24] DeGruttola V,Tu XM(1994)CD4淋巴细胞计数进展及其与生存时间的关系建模。生物统计学50:1003–1014·Zbl 0825.62792号 ·doi:10.2307/2533439
[25] Dempster AP、Laird NM、Rubin DB(1977)通过EM算法从不完整数据中获得最大似然(带讨论)。J R Stat Soc系列B 39:1–38·Zbl 0364.62022号
[26] Diggle P,Kenward MG(1994),纵向数据分析中的信息缺失(含讨论)。应用统计43:49–93·Zbl 0825.62010号 ·doi:10.2307/2986113
[27] Diggle PJ,Heagerty P,Liang K-Y,Zeger SL(2002)纵向数据分析。牛津大学出版社,伦敦
[28] Ekholm A,Skinner C(1998)使用模式混合模型重新分析了马斯卡廷儿童肥胖数据。应用统计47:251–263
[29] Faucett CL,Thomas DC(1996)《同时建模经审查的生存数据和重复测量的协变量:吉布斯抽样方法》。统计医学15:1663–1685·doi:10.1002/(SICI)1097-0258(19960815)15:15<1663::AID-SIM294>3.0.CO;2-1
[30] Fitzmaurice GM,Laird NM(2000)处理纵向研究中不可忽视辍学的广义线性混合模型。生物统计学1:141–156·Zbl 0959.62104号 ·doi:10.1093/biostatistics/1.2.141
[31] Fitzmaurice GM、Lipsitz SR、Molenberghs G、Ibrahim JG(2001年),估计带有脱落的纵向二进制响应的关联参数的偏差。生物计量学57:15–21·Zbl 1209.62219号 ·文件编号:10.1111/j.0006-341X.2001.0015.x
[32] Fitzmaurice GM、Laird NM、Ware JH(2004)应用纵向分析。纽约威利
[33] Fitzmaurice GM、Lipsitz SR、Ibrahim JG、Gelber R、Lipshultz S(2006)《纵向二元数据回归模型估计与结果相关的随访》。生物统计学7:469–485·Zbl 1170.62378号 ·doi:10.1093/biostatistics/kxj019
[34] Fitzmaurice GM、Davidian M、Verbeke G、Molenberghs M(2008)纵向数据分析。查普曼和霍尔,伦敦·Zbl 1144.62087号
[35] Follman D,Wu M(1995)信息缺失数据的随机效应近似广义线性模型。生物统计学51:151–168·Zbl 0825.62607号 ·doi:10.2307/2533322
[36] Garcia RI,Ibrahim JG,Zhu H(2009)缺失数据回归模型的变量选择。Stat Sin(印刷中)
[37] Gilks WR,Wild P(1992)吉布斯采样的自适应拒绝采样。应用统计41:337–348·Zbl 0825.62407号 ·doi:10.2307/2347565
[38] Henderson R、Diggle P、Dobson A(2000)纵向测量和事件时间数据的联合建模。生物统计学1:465–480·Zbl 1089.62519号 ·doi:10.1093/biostatistics/1.4.465
[39] Herring AH,Ibrahim JG(2001)Cox比例风险模型中缺失协变量的基于似然的方法。美国统计协会杂志96:292–302·Zbl 1014.62112号 ·doi:10.1198/016214501750332866
[40] Herring AH,Ibrahim JG(2002)具有不可忽视缺失协变量的随机效应治愈率模型的最大似然估计。生物统计学3:387–405·Zbl 1135.62392号 ·doi:10.1093/biostatistics/3.3.387
[41] Herring AH,Ibrahim JG,Lipsitz SR(2002),缺失协变量的脆弱模型。生物统计学58:98–109·兹比尔1209.62221 ·doi:10.1111/j.0006-341X.2002.0098.x
[42] Herring AH,Ibrahim JG,Lipsitz SR(2004),生存分析中不可忽视的缺失协变量数据:一项国际乳腺癌研究小组试验的案例研究。应用统计53:293–310·Zbl 1111.62344号
[43] Hogan JW,Laird NM(1997)重复测量和事件时间联合分布的混合模型。《医学统计》16:239–257·doi:10.1002/(SICI)1097-0258(19970215)16:3<239::AID-SIM483>3.0.CO;2倍
[44] Hogan JW,Laird NM(1998年)利用纵向协变量的随机效应从截尾生存数据中提高效率。统计方法医学研究7:28–48·doi:10.1191/096228098669097270
[45] Huang L,Chen M-H,Ibrahim JG(2005)具有非忽略缺失协变量的广义线性模型的贝叶斯分析。生物统计学61:767–780·Zbl 1083.62028号 ·文件编号:10.1111/j.1541-0420.2005.00338.x
[46] Ibrahim JG(1990)广义线性模型中的不完整数据。美国统计协会杂志85:765–769·doi:10.2307/2290013
[47] Ibrahim JG,Lipsitz SR,Chen M-H(1999a)当缺失数据机制不可忽略时,广义线性模型中的缺失协变量。J R Stat Soc Ser B期刊61:173–190·Zbl 0917.62060号 ·doi:10.1111/1467-9868.00170
[48] Ibrahim JG,Chen MH,Lipsitz SR(1999b)参数回归模型中缺失协变量的蒙特卡罗EM。生物统计学55:591–596·Zbl 1059.62662号 ·doi:10.1111/j.0006-341X.1999.00591.x
[49] Ibrahim JG,Chen M-H,Lipsitz SR(2001)当缺失数据机制不可忽略时广义线性混合模型中的缺失响应。生物特征88:551–564·Zbl 0984.62047号 ·doi:10.1093/biomet/88.2.551
[50] Ibrahim JG,Chen M-H,Lipsitz SR(2002)随机缺失协变量广义线性模型的贝叶斯方法。加拿大统计局30:55–78·Zbl 0999.62021号 ·doi:10.2307/3315865
[51] Ibrahim JG,Chen M-H,Sinha D(2004),癌症疫苗试验申请人纵向和生存数据联合建模的贝叶斯方法。统计Sin 14:863–883·Zbl 1073.62100号
[52] Ibrahim JG,Chen M-H,Lipsitz SR,Herring AH(2005)广义线性模型中的缺失数据方法:比较综述。美国统计协会期刊100:332–346·Zbl 1117.62360号 ·doi:10.1198/0162145000001844
[53] Ibrahim JG,Chen M-H,Kim S(2008a)具有缺失协变量的Cox回归模型的贝叶斯变量选择。寿命数据分析14:496–520·Zbl 1302.62149号 ·doi:10.1007/s10985-008-9101-5
[54] Ibrahim JG,Zhu H,Tang N(2008b)使用EM算法解决缺失数据问题的模型选择标准。美国统计协会期刊103:1648–1658·Zbl 1286.62082号 ·doi:10.19198/0162114508000001057
[55] Jennrich RI,Schluchter MD(1986),具有结构协方差矩阵的非平衡重复测量模型。生物计量学42:805–820·Zbl 0625.62052号 ·数字对象标识代码:10.2307/2530695
[56] Laird NM,Ware JH(1982)纵向数据的随机效应模型。生物统计学38:963–974·Zbl 0512.62107号 ·doi:10.2307/2529876
[57] Lavalley MP,DeGruttola V(1996)纵向CD4计数的经验Bayes估计模型。统计医学15:2289–2305·doi:10.1002/(SICI)1097-0258(19961115)15:21<2289::AID-SIM449>3.0.CO;2-I型
[58] Lesaffre E,Verbeke G(1998)线性混合模型中的局部影响。生物统计学54:570–582·Zbl 1058.62623号 ·doi:10.2307/3109764
[59] Liang K-Y,Zeger SL(1986)使用广义线性模型进行纵向数据分析。生物特征73:13–22·Zbl 0595.62110号 ·doi:10.1093/biomet/73.1.13
[60] Lipsitz SR,Ibrahim JG,Fitzmaurice GM(1999a)不完全纵向二元反应与不完全类别协变量的可能性方法。生物统计学55:214–223·Zbl 1059.62596号 ·doi:10.1111/j.0006-341X.1999.0214.x
[61] Lipsitz SR,Ibrahim JG,Zhao LP(1999b)缺失协变量数据的新加权估计方程,其性质类似于最大似然。美国统计协会杂志94:1147–1160·Zbl 1072.62532号 ·doi:10.2307/2669931
[62] Lipsitz SR、Ibrahim JG和Molenberghs G(2000)在分析不完全响应的纵向数据时使用Box–Cox变换。应用统计49:287–296·Zbl 0944.62106号
[63] Lipsitz SR、Parzen M、Molenberghs G、Ibrahim JG(2001)加权估计方程偏差测试。生物统计学2:295–307·Zbl 1154.62353号 ·doi:10.1093/生物统计学/2.3.295
[64] Lipsitz SR、Fitzmaurice GM、Ibrahim JG、Gelber R、Lipshultz S(2002)《纵向研究中的参数估计与结果相关的随访》。生物统计学58:621–630·Zbl 1210.62181号 ·doi:10.1111/j.0006-341X.2002.00621.x
[65] Little RJA(1993)多元不完全数据的模式混合模型。美国统计协会杂志88:125-134·Zbl 0775.62134号 ·doi:10.2307/2290705
[66] Little RJA(1994):正态不完全数据的一类模式混合模型。生物特征81:471–483·兹伯利0816.62023 ·doi:10.1093/biomet/81.3.471
[67] Little RJA(1995)对重复测量研究中的退出机制进行建模。美国统计协会杂志90:1113–1121·Zbl 0841.62099号 ·doi:10.2307/2291350
[68] Little RJA,Wang Y(1996)带协变量的多元不完全数据的模式混合模型。生物统计学52:98–111·Zbl 0875.62273号 ·doi:10.2307/2533148
[69] Little RJA,Rubin DB(2002),缺失数据的统计分析。纽约威利
[70] Louis T(1982)使用EM算法时发现观测信息矩阵。J R Stat Soc Ser B期刊44:226–233·Zbl 0488.62018号
[71] Meilijson I(1989)对EM算法的快速改进。J R Stat Soc Ser B期刊51:127–138·Zbl 0674.65118号
[72] Molenberghs G,Verbeke G(2005)离散纵向数据模型。施普林格,纽约·Zbl 1093.62002号
[73] Molenberghs G,Kenward MG(2007),临床研究中的缺失数据。纽约威利
[74] Molenberghs G,Kenward MG,Lesaffre E(1997)非随机辍学的纵向有序数据分析。生物特征84:33–4·Zbl 0883.62120号 ·doi:10.1093/biomet/84.1.33
[75] Pawitan Y,Self S(1993),艾滋病疾病标记过程建模。美国统计协会杂志88:719–726·Zbl 0800.62728号 ·doi:10.2307/2290756
[76] Prentice RL(1989)《临床试验中的替代终点:定义和操作标准》,《Stat Med》8:431–440·doi:10.1002/sim.4780080407
[77] Renard D、Geys H、Molenberghs G、Burzykowski T、Buyse M(2002)《离散结果的多个随机临床试验中替代终点的验证》。生物杂志44:921–935·Zbl 1112.62336号 ·doi:10.1002/bimj.200290004
[78] Rizopoulos D,Verbeke G,Molenberghs G(2008)随机效应错误指定下的共享参数模型。生物特征94:63–74·兹比尔1437.62592 ·doi:10.1093/biomet/asm087
[79] Robins JM,Rotnitzky A,Zhao LP(1995)缺失数据下重复结果的半参数回归模型分析。美国统计协会杂志90(429):106–121·Zbl 0818.62042号 ·doi:10.2307/2291134
[80] Rotnitzky A,Robins JM,Scharfstein DO(1998),重复结果与不可忽视无反应的半参数回归。美国统计协会杂志93:1321–1339·Zbl 1064.62520号 ·doi:10.2307/2670049
[81] Rubin DB(1976)推断和缺失数据。生物特征63(3):581–592·Zbl 0344.62034号 ·doi:10.1093/biomet/63.3.581
[82] Rubin DB(1987)《调查中无应答的多重插补》。概率和数理统计中的威利级数:应用概率和统计学。纽约威利
[83] Scharfstein DO,Rotnitzky A,Robins JM(1999)使用半参数无响应模型调整不可忽视的辍学。美国统计协会杂志94:1096–1120·Zbl 1072.62644号 ·doi:10.2307/2669923
[84] Schluchter MD(1992)信息审查纵向数据分析方法。统计医学11:1861–1870·doi:10.1002/sim.4780111408
[85] Shi X,Zhu H,Ibrahim JG(2009)具有缺失协变量的广义线性模型的局部影响。生物计量学(出版中)·Zbl 1180.62103号
[86] Stubbendick AL,Ibrahim JG(2003)随机效应模型中不可忽略响应和协变量的最大似然方法。生物统计学59:1140–1150·Zbl 1274.62174号 ·doi:10.1111/j.0006-341X.2003.00131.x
[87] Stubbendick AL,Ibrahim JG(2006)基于似然法的推断,离散纵向数据模型中存在不可忽视的缺失响应和协变量。统计Sin 16:1143–1167·兹比尔1111.62021
[88] Taylor JMG、Cumberland WG、Sy JP(1994)纵向艾滋病数据分析的随机模型。美国统计协会杂志89:727–736·Zbl 0806.92011号 ·doi:10.2307/2290898
[89] Thijs H、Molenberghs G、Michiels B、Verbeke G、Curran D(2002年)《模式匹配模型的策略》。生物统计学3:245-265·Zbl 1133.62371号 ·doi:10.1093/biostatistics/3.2.245
[90] Troxel AB、Harrington DP、Lipsitz SR(1998年a)具有不可忽视的非单调缺失值的纵向数据分析。应用统计47:425–438·兹比尔0905.62113
[91] Troxel AB,Lipsitz SR,Harrington DP(1998b)分析具有不可忽视非单调缺失数据的纵向测量的边际模型。生物特征85:661–672·Zbl 0918.62088号 ·doi:10.1093/biomet/85.3.661
[92] Tsiatis AA、DeGruttola V、Wulfsohn MS(1995),用误差测量的纵向数据建立生存关系模型。艾滋病患者生存和CD4计数的应用。美国统计协会杂志90:27–37·Zbl 0818.62102号 ·doi:10.2307/2291126
[93] Verbeke G,Molenberghs G(2000)纵向数据的线性混合模型。施普林格,纽约·Zbl 0956.62055号
[94] Wedderburn RWM(1974)准似然方法、广义线性模型和高斯-牛顿方法。生物特征61:439–447·Zbl 0292.62050号
[95] Wei GC,Tanner MA(1990)EM算法和穷人数据增强算法的蒙特卡罗实现。美国统计协会杂志85:699–704·doi:10.2307/2290005
[96] Wolfinger R,O’Connell M(1993)广义线性模型:伪似然方法。J统计计算模拟48:233–243·Zbl 0833.62067号 ·网址:10.1080/00949659308811554
[97] Woolson RF,Clarke WR(1984)分类不完整纵向数据分析。J R Stat Soc Ser A期刊147:87–99·doi:10.2307/2981739
[98] Wu MC,Bailey KR(1988)分析死亡和撤回导致的信息权审查的变化。统计医学7:337–346·doi:10.1002/sim.4780070134
[99] Wu MC,Carroll RJ(1988)通过对审查过程建模,估计和比较信息权审查中的变化。生物统计学44:175–188·Zbl 0707.62210号 ·doi:10.2307/2531905
[100] Wu MC,Bailey KR(1989)《信息权审查中变化的估计和比较:条件线性模型》。生物识别45:939–955·Zbl 0715.62123号 ·doi:10.2307/2531694
[101] Xu J,Zeger SL(2001)《由重复测量和事件时间组成的纵向数据的联合分析》。应用统计50:375–387·兹比尔1112.62312
[102] Zeger SL,Liang K-Y(1986)离散和连续结果的纵向数据分析。生物统计学42:121–130·doi:10.2307/2531248
[103] Zhu H-T,Lee S-Y(2001)不完全数据模型的局部影响。J R Stat Soc系列B 63:111–126·Zbl 0976.62071号 ·doi:10.1111/1467-9868.00279
[104] Zhu H,Ibrahim JG,Shi X(2009)具有缺失协变量的广义线性模型的诊断措施。扫描J统计(印刷中)·Zbl 1224.62017年
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。