Properties of principal component methods for functional and longitudinal data analysis

Peter Hall; Hans-Georg Müller; Jane-Ling Wang

doi:10.1214/009053606000000272

2006年6月函数和纵向数据分析的主成分方法的特性

霍尔,汉斯·乔治·穆勒,珍妮·林·王

安。统计师。 34（3）： 1493-1517 （2006年6月）。内政部：10.1214/0090536000000272

摘要

使用主成分方法分析功能数据适用于各种不同的设置。在“函数数据分析”的研究中，通常假设随机函数的样本是在连续统中准确观察到的，并且没有噪声。虽然这是功能数据分析的传统设置，但在纵向数据分析的背景下，随机功能通常代表患者或受试者，他们只在少数随机分布的点上进行观察，测量误差不容忽视。然而，在这两种情况下，以及在它们之间的大量设置中，基本上可以使用相同的方法。抽样计划如何影响绩效？在本文中，我们回答了这个问题。我们表明，如果有n个函数或主题，则特征值的估计是一个半参数问题，具有根-n个一致的估计，即使每个函数只有几个观测值，而且每个观测值都受到噪声的干扰。然而，当观测值稀疏时，特征函数的估计成为一个非参数问题。在这种情况下，最优收敛速度是那些与更熟悉的函数估计设置有关的收敛速度。我们还描述了与随机点相反，在规则间隔点采样的效果。特别是，它表明随机抽样通常具有优势。然而，即使在噪声数据的情况下，也存在一个阈值采样率（取决于处理的函数数），高于该阈值采样率时（随机或定期）对估计器性能的影响可以忽略不计，无论是估计特征函数还是特征向量。