摘要
使用主成分方法分析功能数据适用于各种不同的设置。在“函数数据分析”的研究中,通常假设随机函数的样本是在连续统中准确观察到的,并且没有噪声。虽然这是功能数据分析的传统设置,但在纵向数据分析的背景下,随机功能通常代表患者或受试者,他们只在少数随机分布的点上进行观察,测量误差不容忽视。然而,在这两种情况下,以及在它们之间的大量设置中,基本上可以使用相同的方法。抽样计划如何影响绩效?在本文中,我们回答了这个问题。我们表明,如果有n个函数或主题,则特征值的估计是一个半参数问题,具有根-n个一致的估计,即使每个函数只有几个观测值,而且每个观测值都受到噪声的干扰。然而,当观测值稀疏时,特征函数的估计成为一个非参数问题。在这种情况下,最优收敛速度是那些与更熟悉的函数估计设置有关的收敛速度。我们还描述了与随机点相反,在规则间隔点采样的效果。特别是,它表明随机抽样通常具有优势。然而,即使在噪声数据的情况下,也存在一个阈值采样率(取决于处理的函数数),高于该阈值采样率时(随机或定期)对估计器性能的影响可以忽略不计,无论是估计特征函数还是特征向量。
问询处
发布日期:2006年6月
欧几里得项目首次提供:2006年7月10日
数字对象标识符:10.1214/0090536000000272
受试者:
主要用户:62G08号,62H25个
次要:2009年6月26日
关键词:生物医学研究,维数灾难,本征函数,特征值,特征向量,Karhunen–Loève扩建,局部多项式方法,非参数的,算子理论,最佳收敛速度,主成分分析,收敛速度,半参数,平滑的,稀疏数据,光谱分解
版权所有©2006数学统计研究所