×

函数和纵向数据分析的主成分方法的特性。 (英语) Zbl 1113.62073号

总结:使用主成分方法分析功能数据适用于各种不同的设置。在“函数数据分析”的研究中,通常假设随机函数的样本是在连续统中准确观察到的,并且没有噪声。虽然这是功能数据分析的传统设置,但在纵向数据分析的背景下,随机功能通常代表患者或受试者,他们只在少数随机分布的点上进行观察,测量误差不容忽视。然而,在这两种情况下,以及在它们之间的大量设置中,基本上可以使用相同的方法。
抽样计划对绩效有何影响?我们回答这个问题。我们证明,如果有一个函数或主题的样本,那么特征值的估计是一个半参数问题,具有根一致的估计,即使每个函数只有几个观测值,并且每个观测值都被噪声所阻碍。然而,当观测值稀疏时,特征函数的估计成为一个非参数问题。在这种情况下,最佳收敛速度是与更熟悉的函数有关的收敛速度-估计设置。我们还描述了与随机点相反,在规则间隔点采样的效果。
特别是,它表明随机抽样通常具有优势。然而,即使在噪声数据的情况下,也存在一个阈值采样率(取决于处理的函数数),高于该阈值采样率时(随机或定期)对估计器性能的影响可以忽略不计,无论是估计特征函数还是特征向量。

MSC公司:

62H25个 因子分析和主成分;对应分析
62G08号 非参数回归和分位数回归
6220国集团 非参数推理的渐近性质
2009年6月26日 非马尔可夫过程:估计
62页第10页 统计学在生物学和医学中的应用;元分析

软件:

fda(右)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Besse,P.和Ramsay,J.O.(1986年)。主成分-采样函数分析。《心理测量学》51 285–311·Zbl 0623.62048号 ·doi:10.1007/BF02293986
[2] Boente,G.和Fraiman,R.(2000年)。基于内核的功能主组件。统计师。普罗巴伯。莱特。48 335–345. ·Zbl 0997.62024号 ·doi:10.1016/S0167-7152(00)00014-6
[3] Bosq,D.(1991)。连续时间过程的建模、非参数估计和预测。非参数函数估计及相关主题(G.Roussas,ed.)509-529。多德雷赫特,克鲁沃·Zbl 0737.62032号
[4] Bosq,D.(2000年)。函数空间中的线性过程。理论与应用。统计中的课堂笔记。149 . 纽约州施普林格·Zbl 0962.60004号 ·doi:10.1007/978-1-4612-1154-9
[5] Brumback,B.A.和Rice,J.A.(1998年)。用于分析嵌套和交叉曲线样本的平滑样条模型(带讨论)。J.Amer。统计师。协会93 961–994。JSTOR公司:·兹比尔1064.62515 ·doi:10.2307/2669837
[6] Capra,W.B.和Müller,H.G.(1997年)。响应曲线的加速时间模型。J.Amer。统计师。协会92 72–83。JSTOR公司:·Zbl 0890.62025号 ·doi:10.2307/2291451
[7] Cardot,H.(2000)。采样噪声函数平滑主成分分析的非参数估计。J.非参数。统计师。12 503–538. ·Zbl 0951.62030号 ·doi:10.1080/10485250008832820
[8] Cardot,H.、Ferraty,F.和Sarda,P.(2000)。Etude渐近d'un估计样条混合模型函数。C.R.学院。科学。巴黎。I数学。330 501–504. ·Zbl 0944.62040号 ·doi:10.1016/S0764-4442(00)00207-X
[9] Cardot,H.、Ferraty,F.和Sarda,P.(2003)。函数线性模型的样条估计量。统计师。Sinica 13 571–591·Zbl 1050.62041号
[10] Castro,P.、Lawton,W.和Sylvestre,E.(1986年)。具有连续样本曲线的过程的主要变化模式。技术计量28 329–337·Zbl 0615.62074号 ·doi:10.2307/1268982
[11] Dauxois,J.、Pousse,A.和Romain,Y.(1982年)。向量随机函数主成分分析的渐近理论:在统计推断中的一些应用。《多元分析杂志》。12 136–154. ·Zbl 0539.62064号 ·doi:10.1016/0047-259X(82)90088-4
[12] Diggle,P.、Heagerty,P.,Liang,K.-Y.和Zeger,S.(2002)。《纵向数据分析》,牛津大学出版社第二版·Zbl 1031.62002号
[13] Fan,J.和Peng,H.(2004)。具有发散参数数的非凹陷惩罚似然。安。统计师。32 928–961. ·Zbl 1092.62031号 ·doi:10.1214/009053604000000256
[14] Girard,S.(2000)。一种基于流形近似的非线性主成分分析。计算。统计师。15 145–167. ·Zbl 0976.62056号 ·doi:10.1007/s00180000025
[15] Hall,P.和Hosseini-Nasab,M.(2006)。关于函数主成分分析的性质。J.R.统计社会服务。B统计方法。68 109–126. ·Zbl 1141.62048号 ·数字对象标识代码:10.1111/j.1467-9868.2005305.x
[16] Indritz,J.(1963年)。分析方法。纽约麦克米伦·Zbl 0129.26901号
[17] James,G.M.、Hastie,T.J.和Sugar,C.A.(2000年)。稀疏功能数据的主成分模型。生物特征87 587–602。JSTOR公司:·Zbl 0962.62056号 ·doi:10.1093/biomet/87.3587
[18] Johnstone,I.M.(2001年)。关于主成分分析中最大特征值的分布。安。统计师。29 295–327. ·Zbl 1016.62078号 ·doi:10.1214/aos/1009210544
[19] Jones,M.C.和Rice,J.(1992年)。显示大型相似曲线集合的重要特征。阿默尔。统计师。46 140–145.
[20] Jones,R.H.(1993)。具有序列相关性的纵向数据:一种状态空间方法。查普曼和霍尔,伦敦·Zbl 0851.62059号
[21] Kneip,A.和Utikal,K.J.(2001年)。使用函数主成分分析推断密度族(含讨论)。J.Amer。统计师。协会96 519–542。JSTOR公司:·Zbl 1019.62060号 ·doi:10.1198/016214501753168235
[22] Lin,X.和Carroll,R.J.(2000)。当预测器测量无误差或有误差时,聚类数据的非参数函数估计。J.Amer。统计师。协会95 520–534。JSTOR公司:·兹比尔0995.62043 ·doi:10.2307/2669396
[23] Mas,A.和Menneteau,L.(2003)。摄动方法应用于随机算子的渐近研究。在高维概率中。III(J.Hoffmann-Jörgensen,M.B.Marcus和J.A.Wellner编辑)127-134。巴塞尔Birkhäuser·Zbl 1053.60002号
[24] Müller,H.-G.(2005)。纵向数据的功能建模和分类(讨论)。扫描。J.统计学家。32 223–246. ·Zbl 1089.62072号 ·数字对象标识代码:10.1111/j.1467-9469.2005.00429.x
[25] Pezzulli,S.和Silverman,B.W.(1993)。函数数据平滑主成分分析的一些性质。计算。统计师。8 1–16. ·Zbl 0775.62146号
[26] Ramsay,J.O.和Ramsey,J.B.(2002年)。非耐用商品生产月度指数动态的功能数据分析。《计量经济学杂志》107 327–344·Zbl 1051.62118号 ·doi:10.1016/S0304-4076(01)00127-0
[27] Ramsay,J.O.和Silverman,B.W.(2002)。应用功能数据分析:方法和案例研究。纽约州施普林格·Zbl 1011.62002号 ·doi:10.1007/b98886
[28] Ramsay,J.O.和Silverman,B.W.(2005)。功能数据分析,第二版,Springer,纽约·Zbl 1079.62006号
[29] 拉奥·C·R(1958)。用于比较增长曲线的一些统计模型。生物统计学14 1–17·Zbl 0079.35704号 ·doi:10.2307/2527726
[30] Rice,J.A.(1986年)。部分花键模型的收敛速度。统计师。普罗巴伯。莱特。4 203–208. ·Zbl 0628.62077号 ·doi:10.1016/0167-7152(86)90067-2
[31] Rice,J.A.(2004)。功能和纵向数据分析:平滑的前景。统计师。中国14 631–647·Zbl 1073.62033号
[32] Rice,J.A.和Silverman,B.W.(1991)。当数据为曲线时,非参数估计平均值和协方差结构。J.罗伊。统计师。Soc.序列号。B 53 233–243。JSTOR公司:·Zbl 0800.62214号
[33] Rice,J.A.和Wu,C.O.(2001)。非均匀采样噪声曲线的非参数混合效应模型。生物统计学57 253–259。JSTOR公司:·Zbl 1209.62061号 ·doi:10.1111/j.0006-341X.2001.00253.x
[34] Shi,M.、Weiss,R.E.和Taylor,J.M.G.(1996)。使用灵活的随机曲线分析获得性免疫缺陷综合征的儿科CD4计数。申请。统计师。45 151–163. ·Zbl 0875.62574号 ·doi:10.2307/2986151
[35] Staniswalis,J.G.和Lee,J.J.(1998)。纵向数据的非参数回归分析。J.Amer。统计师。协会93 1403–1418。JSTOR公司:·Zbl 1064.62522号 ·doi:10.2307/2670055
[36] Stone,C.J.(1980)。非参数估计的最优收敛速度。安。统计师。8 1348–1360. ·Zbl 0451.62033号 ·doi:10.1214/aos/1176345206
[37] Yao,F.、Müller,H.-G.、Clifford,A.J.、Dueker,S.R.、Follett,J.、Lin,Y.、Buchholz,B.A.和Vogel,J.S.(2003)。功能主成分得分的收缩估计,应用于血浆叶酸的群体动力学。生物统计学59 676–685·Zbl 1210.62076号 ·数字标识代码:10.1111/1541-0420.00078
[38] Yao,F.、Müller,H.-G.和Wang,J.-L.(2005)。稀疏纵向数据的功能数据分析。J.Amer。统计师。协会100 577–590·Zbl 1117.62451号 ·doi:10.1198/0162145000001745
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。