×

多级数据的缺失数据技术:模型错误指定的含义。 (英语) Zbl 1511.62032号

摘要:在对多层次数据建模时,准确表示簇内观测值的相互依赖性非常重要。忽略数据聚类可能会导致参数估计错误。然而,将缺失数据技术(MDT)应用于不完整的多级数据时,模型错误指定对参数估计的影响程度尚不明确。我们比较了三种具有不完整层次数据的MDT的性能。当因变量的值以10%、30%和50%的比率随机缺失时,我们通过在具有两级横截面数据的正态模型(MI/NM)假设下使用多重插补来考虑插补模型错误指定对参数估计质量的影响。假设线性混合模型(MI/LMM)和相同不完全数据集的最大似然估计,使用五个标准将MI/NM估计值与MI估计值进行比较。对于10%的缺失数据(MD),技术在固定效应估计中的表现类似,但方差分量与MI/NM有偏差。模型错误指定的影响在较高的MD发生率下恶化,数据的层次结构显著低于有偏方差分量估计。MI/LMM和最大似然法提供了一般准确无偏的参数估计值,但MD率的增加对性能产生了负面影响。

MSC公司:

62D10号 缺少数据
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Allison,P.D.2003年。结构方程建模缺少数据技术。J.Abnorm公司。心理学。, 11: 545-557.
[2] Allison,P.D.《多元正态模型下分类变量的多重插补》。美国社会学协会会议。蒙特利尔,QC。可在获取http://www.allacademic.com/meta/p102543_index.html
[3] Collins,L.M.、Schafer,J.L.和Kam,C.,2001年。现代缺失数据程序中包容性和限制性策略的比较。精神病。方法, 6: 330-351. ·doi:10.1037/1082-989X.6.4.330
[4] Dempster,A.P.、Laird,N.M.和Rubin,D.B.1977年。通过EM算法从不完整数据中获得最大似然。J.R.统计。Soc.序列号。B统计师。Methodol公司。, 39: 1-38. ·Zbl 0364.62022号 ·doi:10.1111/j.2517-6161.1977.tb01600.x
[5] Enders,C.K.,2001年。可用于缺失数据的最大似然算法入门。结构。埃克。模型。, 8: 128-141.
[6] Enders,C.K.,2006年。“分析缺少数据的结构方程模型”。结构方程建模:第二门课程,编辑:Hancock,G.R.和Mueller,R.O.313-342。康涅狄格州格林威治:信息时代出版。
[7] Goldstein,H.2003年。多级统计模型伦敦:霍德·阿诺德·Zbl 1014.62126号
[8] Graham,J.W.,2003年。将缺失的数据相关变量添加到基于FIML的结构方程模型中。结构。埃克。模型, 10: 80-100.
[9] Graham,J.W.,Olchowski,A.E.和Gilreath,T.D.,2007年。实际需要多少插补?多重归责理论的一些实际澄清。上一页。科学, 8: 206-213. ·doi:10.1007/s11121-007-0070-9
[10] Harel,O.2007年。多重插补和两阶段多重插补下的缺失信息推断。统计师。Methodol公司。, 4: 75-89. ·Zbl 1248.62018号 ·doi:10.1016/j.stamet.2006.03.002
[11] Harel,O.和Zhou,X.2007年。多重插补——对理论、实施和软件进行审查。《统计医学》。, 26: 3057-3077. ·doi:10.1002/sim.2787
[12] Hershberger,S.L.和Fisher,D.G.,2003年。关于确定缺失数据插补数的说明。结构。埃克。模型。, 10: 648-650.
[13] Hox,J.2002年。多级分析:技术与应用新泽西州马华:劳伦斯·埃尔鲍姆联合公司·Zbl 1226.62001年 ·数字对象标识代码:10.4324/9781410604118
[14] G.W.雅各布斯。温米奇,软件位于http://www.multi-imputation.com
[15] Little,R.J.A.和Rubin,D.B.1989年。缺失值的社会科学数据分析。社会学。方法研究。, 18: 292-326. ·doi:10.1177/0049124189018002004年
[16] Little,R.J.A.和Rubin,D.B.,2002年。缺失数据的统计分析,2,Hoboken,NJ:约翰·威利父子公司·Zbl 1011.62004号 ·doi:10.1002/9781119013563
[17] Muthén,L.K.和Muthén,B.O。Mplus用户指南, 5, 1998-2007. 加利福尼亚州洛杉矶:穆森&穆森。
[18] Peugh,J.L.和Enders,C.K.,2004年。教育研究中的缺失数据:报告实践回顾和改进建议。Rev.教育。物件。, 74: 525-556. ·电话:10.3102/00346543074004525
[19] R: 统计计算语言与环境R统计计算基金会,奥地利维也纳,2006年;软件可用位置网址:http://www.R-project.org
[20] Rasbash,J.、Charlton,C.、Browne,W.J.、Healy,M.和Cameron,B。MLwiN公司,软件位于http://www.cmm.bristol.ac.uk/index.shtml
[21] Raudenbush,S.W.和Bryk,A.S.,2002年。层次线性模型:应用和数据分析方法,加利福尼亚州千橡园:Sage Publications,Inc·Zbl 1001.62004号
[22] Roberts,J.K.和McLeod,P.,2008年。“多级模型的软件选项”。教育数据的多级建模编辑:O'Connell,A.A.和Betsy McCoach,D.427-467。北卡罗来纳州夏洛特:信息时代出版公司。
[23] Rubin,D.B.1976年。推断和缺失数据。生物特征, 63: 581-592. ·Zbl 0344.62034号 ·doi:10.1093/biomet/63.3.581
[24] 鲁宾,D.B.1987年。调查中无应答的多重插补纽约:J.Wiley and Sons·2007年6月10日 ·数字对象标识代码:10.1002/9780470316696
[25] 鲁宾,D.B.,1996年。18年以上的多重插补。《美国统计杂志》。Assoc公司, 91: 473-489. ·Zbl 0869.62014年
[26] Schafer,J.L.1997年。不完全多元数据分析纽约:查普曼和霍尔出版社·Zbl 0997.62510号 ·doi:10.1201/9781439821862
[27] Schafer,J.L.1997年。“多元线性混合模型下缺失协变量的插补”。宾夕法尼亚州大学公园:宾夕法尼亚州立大学统计系。技术代表97-04
[28] Schafer,J.L.,2001年。“PAN多重插补”。变化分析的新方法,编辑:Collins,L.M.和Sayer,A.G.357-377。华盛顿特区:美国心理协会。 ·doi:10.1037/10409-012
[29] Schafer,J.L.2003年。当插补和分析模型不同时,多元问题中的多重插补。统计数字尼尔尔, 57: 19-35. ·doi:10.1111/1467-9574.00218
[30] Schafer,J.L.“NORM(正态模型下不完全多元数据的多重插补,第2版)”。软件可用位置http://www.stat.psu.edu/jls/misoftwa.html
[31] Schafer,J.L.和Graham,J.W.,2002年。缺少数据:我们对最新技术的看法。精神病。方法, 7: 147-177. ·doi:10.1037/1082-989X.7.2.147
[32] Schafer,J.L.和Olsen,M.K.,1998年。多元缺失数据问题的多重插补:数据分析师的观点。多元行为。物件。, 33: 545-571.
[33] Schafer,J.L.和Yucel,R.M.,2002年。具有缺失值的多元线性混合效应模型的计算策略。J.计算。图表。斯达。,11:437-457。
[34] Sinharay,S.、Stern,H.S.和Russell,D.,2001年。使用多重插补分析缺失数据。精神病。方法, 6: 317-329. ·doi:10.1037/1082-989X.6.4.317
[35] Snijders,T.A.B.和Bosker,R.J.1999年。多级分析:基本和高级多级建模简介,伦敦:SAGE出版物·Zbl 0953.62127号
[36] S-PLUS版本8,Tibco Software,Inc.,加利福尼亚州帕洛阿尔托,2007年;软件可用位置网址:http://www.tibco.com
[37] Swaminathan,H.和Rogers,H.J.,2008年。“分层线性模型的估算程序”。教育数据的多级建模,编辑:O'Connell,A.A.和Betsy McCoach,D.469-519。北卡罗来纳州夏洛特:信息时代出版公司。
[38] Tanner,M.A.和Wong,W.H.1987。通过数据增强计算后验分布。《美国统计杂志》。协会。, 82: 528-540. ·兹比尔0619.62029
[39] Tourangeau,K.、Nord,C.、Lé,T.、Pollack,J.M.和Atkins-Burnett,S.,2006年。幼儿期纵向研究,1998-99年幼儿园班(ECLS-K),ECLS-K五级数据文件和电子码本组合用户手册,华盛顿特区:国家教育统计中心。(NCES 2006-032)
[40] Yucel,R.M.和Demirtas,H.,2010年。非正态随机效应对多重插补推断的影响。模拟评估。计算。统计数据分析。, 54: 790-801. ·Zbl 1464.62191号 ·doi:10.1016/j.csda.2009.01.016
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。