×

在主成分分析中使用广义Procrustes分析进行多重插补。 (英语) 兹比尔1360.62307

摘要:多重插补是处理缺失数据的最受推荐的程序之一。然而,迄今为止,很少有人注意将主成分分析结果与多重插补数据集相结合的方法。为此,本文提出了广义Procrustes分析法,其质心解可作为构件荷载的最终估计。基于输入数据集载荷的凸壳可用于表示由于缺失数据而产生的不确定性。在两个仿真研究中,对广义Procrustes方法的性能进行了评估,并与其他方法进行了比较。更具体地说,研究了当组件的顺序变化和组件负载的符号反转发生时,例如在接近相等的本征值的情况下,或者具有几乎与指示项一样多的反指示项的数据的情况下,这些方法是如何表现的。仿真结果表明,其他提出的方法可能会遇到严重问题,或者由于缺少数据而无法充分评估准确性。然而,当上述情况不发生时,所有方法都将为PCA载荷提供足够的估计。

MSC公司:

62H25个 因子分析和主成分;对应分析
第62页,共15页 统计学在心理学中的应用
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] ACOCK,A.和MARTIN,J.D.(1974),“计量不足的争论:有序数据是否应被视为区间?”,《社会学与社会研究》,第58期,第427-433页。
[2] ALISIC,E.、VAN DER SCHOOT,T.A.W、VAN GINKEL,J.R.和KLEBER,R.J.(2008年),“超越儿童创伤后应激障碍:创伤后应激反应、创伤后生长和生活质量”,《临床精神病学杂志》,69,1455-1461·文件编号:10.4088/JCP.v69n0913
[3] ANDERSON,T.W.(1963),“主成分分析的渐近理论”,《数理统计年鉴》,第34期,第122-148页·Zbl 0202.49504号 ·doi:10.1214/aoms/1177704248
[4] ARCHER,C.O.和JENNRICH,R.I.(1973),“旋转因子载荷的标准误差”,《心理测量学》,38,581-592·Zbl 0281.62059号 ·doi:10.1007/BF02291496
[5] BAKER,B.O.、HARDYCK,C.D.和PETRINOVICH,L.F.(1966),“弱测量与强统计:对S.S.Stevens关于统计的主张的经验批判”,教育与心理测量,26,291-309·doi:10.1177/001316446602600204
[6] BENZéCRI,J.P.(1973),《唐纳分析》。1.《出租车》。《通信分析》,巴黎:Dunod·Zbl 0297.62038号
[7] BERNAARDS,C.A.、BELIN,T.R.和SCHAFER,J.L.(2007),“不完全二进制数据插补的多元正态近似的稳健性”,《医学统计学》,26,1368-1382·数字对象标识代码:10.1002/sim.2619
[8] BERNAARDS,C.A.和SIJTSMA,K.(1999),“受可忽略项目无反应影响的多维多体项目反应数据的因子分析”,多变量行为研究,34277-313·doi:10.1207/S15327906MBR3403_1
[9] BERNAARDS,C.A.和SIJTSMA,K.(2000),“当问卷数据中的项目无反应不可忽视时,插补和EM方法对因子分析的影响”,多变量行为研究,35,321-364·doi:10.1207/S15327906MBR3503_03
[10] BOLLEN,K.A.和BARB,K.H.(1981),“皮尔逊的R和粗略分类措施”,《美国社会学评论》,46,232-239·doi:10.2307/2094981
[11] CHATTERJEE,S.(1984),“因子分析中的方差估计:Bootstrap的应用”,英国数学与统计心理学杂志,37,252-262·doi:10.1111/j.2044-8317.1984.tb00803.x
[12] COHEN,J.(1988),《行为科学的统计权力分析》(第2版),新泽西州希尔斯代尔:Lawrence Erlbaum Associates·Zbl 0747.62110号
[13] COMMANDEUR,J.J.F.(1991),《匹配配置》,荷兰莱顿:DSWO出版社。
[14] COMREY,A.L.和LEE,H.B.(1992),因子分析第一课程(第二版),新泽西州希尔斯代尔:劳伦斯·埃尔鲍姆协会。
[15] COSTA,P.T.和MCCRAE,R.R.(1985),《近地天体人格调查表手册》,佛罗里达州敖德萨:心理评估资源公司。
[16] D’AUBIGNY,G.(2004),“多重插补的Une Méthode D’Imputation Multiple,en ACP”,论文介绍了《第三十六届统计学杂志》。2004年5月,法国蒙彼利埃·Zbl 1144.62332号
[17] DOERING,T.R.和RAYMOND,H.(1979年),“测量与统计:序贯性争论与地理”,第11期,第237-243页。
[18] GIRSHICK,M.A.(1939),“行列式方程根的抽样理论”,《数理统计年鉴》,第10期,203-224页·JFM 65.0572.02号 ·doi:10.1214/aoms/1177732180
[19] 戈尔,JC;Hodson,FR(编辑);Kendall,DG(编辑);Tautu,P.(编辑),《比较同一数据的不同多元分析的统计方法》,138-149(1971),爱丁堡·兹比尔0302.62027
[20] GOWER,J.C.(1975),“广义Procrustes分析”,《心理测量学》,40,33-51·Zbl 0305.62038号 ·doi:10.1007/BF02291478
[21] 格雷厄姆,JW;肖弗,JL;Hoyle,R.(编辑),《小样本多变量数据的多重插补性能》,1-29(1999),加州千橡树
[22] GREEN,B.F.(1952),“因子分析中斜结构的正交逼近”,《心理测量学》,第17期,第429-440页·Zbl 0049.37601号 ·doi:10.1007/BF02288918
[23] 绿色,PJ;BARNETT,V.(编辑),《剥离双变量数据》,3-19(1981),纽约
[24] GRUNG,B.和MANNE,R.(1998),“主成分分析中的缺失值”,化学计量学和智能实验室系统,42,125-139·doi:10.1016/S0169-7439(98)00031-8
[25] HO,P.、SILVA M.C.M.和HOGG T.A.(2001),“木材、不锈钢和玻璃港口成熟早期的颜色和酚类成分变化”,《食品和农业科学杂志》,第81期,第1269-1280页·doi:10.1002/jsfa.938
[26] 霍克,E。;Ainslie,R.(编辑),《向日托的过渡:母婴分离焦虑对婴儿适应的影响》(1984年),纽约
[27] JOLLIFFE,I.T.(2002),主成分分析(第二版),纽约:施普林格出版社·Zbl 1011.62064号
[28] JOSSE,J.、PAGÈS,J.和HUSSON,F.(2011),“主成分分析中的多重插补”,数据分析和分类进展,5,231-246·Zbl 1274.62409号 ·doi:10.1007/s11634-011-0086-7
[29] JOSSE,J.、HUSSON,F.和PAGÈS,J.(2009),“Manquantes en Analyse en Composantes Principales手势分析”,法国社会统计杂志,150,28-51·兹比尔1311.62091
[30] KIERS,H.A.L.(1997),“使用普通最小二乘算法的加权最小二乘拟合”,《心理测量学》,62,251-266·Zbl 0873.62058号 ·doi:10.1007/BF02295279
[31] KNAPP公司。T.R.(1990),“将顺序量表视为区间量表:解决争议的尝试”,《护理研究》,39,121-123·doi:10.1097/00006199-199003000-00019
[32] KROONENBERG,P.M.(1983),《三模式主成分分析》,荷兰莱顿:DSWO出版社,2013年1月,摘自http://three-mode.leidenuniv.nl/ ·Zbl 0513.62059号
[33] KROONENBERG,P.M.(2008),《应用多路数据分析》,新泽西州霍博肯:威利·Zbl 1160.62002号 ·数字对象标识代码:10.1002/9780470238004
[34] LABOVITZ,S.(1967),“关于计量和统计的一些观察”,《社会力量》,46,151-160·doi:10.2307/2574595
[35] LINGOES,J.C.和BORG,I.(1978),“使用日益复杂的转换对个体差异标度的直接方法”,心理测量学,43,491-519·Zbl 0395.62077号 ·doi:10.1007/BF02293810
[36] LINTING,M.、MEULMAN,J.J.、GROENEN,P.J.F.和VAN DER KOOIJ,A.J.(2007),“非线性主成分分析的稳定性:使用平衡自举的实证研究”,心理学方法,第12卷,第359-379页·doi:10.1037/1082-989X.12.3.359
[37] LITTLE,R.J.A.(1988年),“大型调查中的任务数据调整”,《商业与经济统计杂志》,第6287-296页。
[38] LITTLE,R.J.A.和RUBIN,D.B.(2002),《缺失数据的统计分析》(第二版),纽约:Wiley·Zbl 1011.62004号
[39] MARKUS,M.T.(1994),非线性多元分析中的Bootstrap置信域,莱顿:DSWO出版社·Zbl 0879.62051号
[40] MASI,A.T.、ALDAG,J.C.和CHATTERTON,R.T.(2006),“性激素与类风湿关节炎的风险以及发育或环境影响”,《纽约科学院年鉴》,1069,223-235·doi:10.1196/annals.1351.020
[41] MEULMAN,J.(1982),《不完全数据的同质性分析》,莱顿:DSWO出版社。
[42] MILAN,L.和WHITTAKER,J.(1995),“参数自举法在包含奇异值分解的模型中的应用”,应用统计学,44,31-49·Zbl 0821.62030号 ·doi:10.2307/2986193
[43] NANDAKUMAR,R.、YU,F.、LI,H.H.和STOUT,W.F.(1998年),“评估多体数据的单一维度”,应用心理测量,22,99-115·doi:10.1177/01466216980222001
[44] NICHD EARLY CHILDCARE RESEARCH NETWORK(1996),“婴儿保育的特点:积极保育的因素”,《幼儿研究季刊》,第11269-306页·doi:10.1016/S0885-2006(96)90009-5
[45] OGASAWARA,H.(2000),“非标准化和标准化变量主成分载荷的标准误差”,英国数学与统计心理学杂志,53,155-174·doi:10.1348/000711000159277
[46] OGASAWARA,H.(2002),“构件荷载估算标准误差的简明公式”,《心理测量学》,67,289-297·兹比尔1297.62238 ·doi:10.1007/BF02294847
[47] PIANTA,R.C.(1992),《儿童与父母关系量表》,夏洛茨维尔:弗吉尼亚大学。
[48] RADLOFF,L.S.(1977),“CES-D量表:普通人群研究中的自述抑郁量表”,应用心理测量,1385-401·doi:10.1177/014662167700100306
[49] RAVENS-SIEBERR,U.、AUQUIER,P.、ERHART,M.、GOSCH,A.、RAJMIL,L.、BREL,J.、POWER,M.,DUER,W.、CLOETTA,B.、CZEMY,L.,MAZUR,J.,CZIMBALMOS,A.、TOUNTAS,Y.、HAGQUIST,C.、KILROE,J和EUROPEAN KIDSCREEN GROUP(2007),“儿童和青少年的KIDSCREEN-27:来自13个欧洲国家跨文化调查的心理测量结果”,《生活质量研究》,第16期,1347-1356页·doi:10.1007/s11136-007-9240-2
[50] ROUSSEUW,P.J.、RUTS,I.和TUKEY,J.W.(1999),“Bagplot:一个双变量箱线图”,《美国统计学家》,53382-387。
[51] RUBIN,D.B.(1976),“推断和缺失数据”,《生物特征》,63,581-592·Zbl 0344.62034号 ·doi:10.1093/biomet/63.3.581
[52] RUBIN,D.B.(1986),“使用调整权重和多重插补的文件串联进行统计匹配”,《商业与经济统计杂志》4,87-94。
[53] RUBIN,D.B.(1987),《调查中无应答的多重插补》,纽约:Wiley·2007年6月10日 ·数字对象标识代码:10.1002/9780470316696
[54] SCHAFER,J.L.(1997),《不完全多元数据分析》,伦敦:查普曼和霍尔出版社·Zbl 0997.62510号 ·doi:10.1201/9781439821862
[55] SCHAFER,J.L.(1998),NORM:适用于Windows 95/98/NT的2.02版本,2013年1月访问,来自http://www.stat.psu.edu/jls/misoftwa.html
[56] S-PLUS 7 for WINDOWS[计算机软件],(2007),西雅图,华盛顿州:Insightful Corporation。
[57] SPSS INC.(2011),用于Windows[计算机软件]的SPSS 19.0,芝加哥:SPSS。
[58] SU,Y.S.,GELMAN,A.,HILL,J.,和YAJIMA,M.(2011),“R中诊断的多重插补(mi):将窗口打开到黑盒子中”,《统计软件杂志》,45,1-31。
[59] TAKANE,Y.和OSHIMA-TAKANE,Y.(2003),“处理主成分分析中缺失数据的两种方法之间的关系”,行为测量学,30,145-154·Zbl 1055.62070号 ·数字对象标识代码:10.233/bhmk.30.145
[60] TEN BERGE,J.M.F.(1977),“两个或多个矩阵的正交Procrustes旋转”,《心理测量学》,42,267-275·Zbl 0362.92020号 ·doi:10.1007/BF02294053
[61] TIMMERMAN,M.E.、KIERS,H.A.L.和SMILDE,A.K.(2007),“主成分载荷的置信区间估计:Bootstrap和渐近结果之间的比较”,英国数学与统计心理学杂志,60,295-314·doi:10.1348/000711006X109636
[62] TUCKER,L.R.(1951),“综合因子分析研究的方法”,人事研究科第984号报告,华盛顿特区:陆军部。
[63] VAN BUUREN,S.(2010),“不指定尺度结构的项目推断”,方法论:欧洲行为与社会科学研究方法杂志,6,31-36。
[64] VAN BUUREN,S.、BRAND,J.P.L.、GROOTHUIS-OUDHOORN,C.G.M.和RUBIN,D.B.(2006),“多元插补中的完全条件规范”,《统计计算与模拟杂志》,761049-1064·Zbl 1144.62332号 ·网址:10.1080/10629360600810434
[65] VAN GINKEL,J.R.(2010),“低质量问卷数据中多重插补的调查”,多变量行为研究,45,574-598·doi:10.1080/00273171.2010.483373
[66] VAN GINKEL,J.R.和KIERS,H.A.L.(2011),“在缺少数据的情况下构建主成分负荷的自举置信区间:多重插补方法”,英国数学与统计心理学杂志,64,498-515·Zbl 1403.62109号 ·doi:10.1111/j.2044-8317.2010.02006.x
[67] VAN GINKEL J.R.和KROONENBERG,P.M.(2009),“使用广义Procrustes分析合并多重插补中主成分分析的结果”,在2009年7月于剑桥举行的第16届心理测量学会国际会议上的演讲。
[68] VAN GINKEL,J.R.、VAN DER ARK,L.A.、SIJTSMA,K.和VERMUNT,J.K.(2007),“双向插补:估计测试和问卷中缺失分数的贝叶斯方法和精确近似”,计算统计与数据分析,51,4013-4027·Zbl 1161.62445号 ·doi:10.1016/j.csda.2006.12.022
[69] WEISSTEIN,E.W.,《苍鹭公式》,MathWorld-A Wolfram Web Resource,2013年1月,访问自http://mathworld.wolfram.com/HeronsFormula.html<RefTarget地址=“http://mathworld.wolfram.com/HeronsFormula.html“TargetType=”URL“/>
[70] WENTZELL,P.D.、ANDREWS,D.T.、HAMILTON,D.C.、FABER,K.和KOWALSKI,B.R.(1997),“最大似然主成分分析”,《化学计量学杂志》,第11期,第339-366页·doi:10.1002/(SICI)1099-128X(199707)11:4<339::AID-CEM476>3.0.CO;2升
[71] 袁玉川(2011),“利用SAS软件进行多重插补”,《统计软件杂志》,第45期,第1-25页。
[72] ZUCCOLOTTO,P.(2008),“主成分分析中缺失值处理的符号数据方法”,Statistica Applicazioni,6153-180。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。