开放式访问
2006年6月 函数和纵向数据分析的主成分方法的特性
霍尔,汉斯·乔治·穆勒,珍妮·林·王
安。统计师。 34(3): 1493-1517 (2006年6月)。 内政部:10.1214/0090536000000272

摘要

使用主成分方法分析功能数据适用于各种不同的设置。在“函数数据分析”的研究中,通常假设随机函数的样本是在连续统中准确观察到的,并且没有噪声。虽然这是功能数据分析的传统设置,但在纵向数据分析的背景下,随机功能通常代表患者或受试者,他们只在少数随机分布的点上进行观察,测量误差不容忽视。然而,在这两种情况下,以及在它们之间的大量设置中,基本上可以使用相同的方法。抽样计划如何影响绩效?在本文中,我们回答了这个问题。我们表明,如果有n个函数或主题,则特征值的估计是一个半参数问题,具有根-n个一致的估计,即使每个函数只有几个观测值,而且每个观测值都受到噪声的干扰。然而,当观测值稀疏时,特征函数的估计成为一个非参数问题。在这种情况下,最优收敛速度是那些与更熟悉的函数估计设置有关的收敛速度。我们还描述了与随机点相反,在规则间隔点采样的效果。特别是,它表明随机抽样通常具有优势。然而,即使在噪声数据的情况下,也存在一个阈值采样率(取决于处理的函数数),高于该阈值采样率时(随机或定期)对估计器性能的影响可以忽略不计,无论是估计特征函数还是特征向量。

引用

下载引文

彼得·霍尔(Peter Hall)。 汉斯·乔治·穆勒。 珍妮·林·王。 “用于功能和纵向数据分析的主成分方法的特性。” 安。统计师。 34 (3) 1493 - 1517, 2006年6月。 https://doi.org/10.1214/009053606000000272

问询处

发布日期:2006年6月
欧几里得项目首次提供:2006年7月10日

zbMATH公司:1113.62073
数学科学网:MR2278365号
数字对象标识符:10.1214/0090536000000272

受试者:
主要用户:62G08号,62H25个
次要:2009年6月26日

关键词:生物医学研究,维数灾难,本征函数,特征值,特征向量,Karhunen–Loève扩建,局部多项式方法,非参数的,算子理论,最佳收敛速度,主成分分析,收敛速度,半参数,平滑的,稀疏数据,光谱分解

版权所有©2006数学统计研究所

第34卷•第3期•2006年6月
返回页首