总结
函数加性模型为涉及函数预测因子的回归提供了一个灵活而简单的框架。在加法结构而不是线性结构中使用数据驱动的基自然地扩展了经典的泛函线性模型。然而,选择非线性附加成分的关键问题研究较少。在这项工作中,我们提出了一个新的正则化框架,用于再生核Hilbert空间中的结构估计。所提出的方法利用了功能主要组件的优势,极大地促进了实现和理论分析。选择和估计是通过使用惩罚的惩罚最小二乘法实现的,该惩罚鼓励加法分量的稀疏结构。研究了收敛速度等理论性质。通过仿真研究和实际数据应用,验证了该方法的实证性能。
1.简介
现代科学技术所收集的大量复杂数据由于其高维、海量和复杂的结构,给传统的统计方法带来了巨大的挑战。功能数据分析是一个很有前途的领域,它使用随机函数作为模型单元,用于对分布在时间、空间和波长等连续区域的数据进行建模;见拉姆齐和西尔弗曼(2005)进行全面介绍。此类数据可被视为潜在或观察到的随机过程的实现,在许多领域中都常见,例如纵向研究、微阵列实验和大脑图像。
涉及功能对象的回归模型在功能数据分析文献中发挥着重要作用。最广泛使用的是函数线性模型,其中标量响应Y(Y)根据功能预测回归X通过线性算子
(1)
哪里X(t吨)通常假设是定义在紧域上的光滑平方可积随机函数、和β(t吨)是回归参数函数,也假设该函数是光滑的平方可积函数。拟合模型(1)的一种常用方法是通过基展开,即将函数预测器表示为基的线性组合:,其中μ(t吨) =E类{X(t吨)}. 然后将模型(1)转换为系数的线性形式:,其中和有关函数线性回归的更多参考,请参阅Cardot等. (1999,2003)、范和张(2000)James提出了广义函数线性模型的扩展(2002)、米勒和斯塔特米勒(2005)和李等. (2010)。基础集可以是预先确定的(例如傅里叶基、小波或B类-样条曲线)或数据驱动。后者的一个方便选择是X,在这种情况下,随机系数称为功能主成分(FPC)得分。FPC分数的平均值为零,方差等于相应的本征值。的同构表示X称为Karhunen–Loève展开,相关方法通常称为功能主成分分析(FPCA)(Rice和Silverman,1991; 姚明等。,2005; 霍尔等。,2006; 霍尔和侯赛尼·纳萨布,2006; 姚明,2007)。由于本征值的快速衰减,与其他基相比,正交本征基提供了更简约和有效的表示。此外,FPC得分是互不相关的,这可以大大简化模型拟合和理论分析。在本文中,我们主要关注函数回归的FPC表示;然而,该建议也适用于其他预先指定的基地。
虽然线性关系被广泛使用,但对于一般应用来说,它可能是有限制的。米勒和姚明放松了这种线性假设(2008)谁提出了函数加性模型(FAM)。FAM提供了一个灵活但实用的框架,该框架适应非线性关联,同时避免了高维非参数回归问题中遇到的维数灾难(Hastie和Tibshirani,1990)。在标量响应的情况下,线性结构被非线性功能组件的总和所取代,即。
(2)
哪里是未知的平滑函数。缪勒和姚明(2008),FAM通过估算进行拟合使用FPCA(姚等。,2005)和估算采用局部多项式平滑。
明显正则化方程(2)是必要的。缪勒和姚明(2008)正则化是通过将特征序列截断为第一个特征序列来实现的K(K)主要组件,其中K(K)被选来解释预测因子总变异的大部分X尽管它很简单,但这种朴素的截断过程在许多复杂的问题中可能是不够的。首先,FPC对响应的影响不一定与仅由预测过程的自方差算子指定的大小一致。例如,一些高阶FPC对回归的贡献可能远远大于领先的FPC。哈迪和凌讨论过这个问题(1998)在主成分回归上下文中,后来在高维数据的实际示例中观察到(Bair等。,2006)和功能数据(Zhu等。,2007)。其次,尽管少数领先的FPC可能能够捕获X由于特征值迅速衰减,人们通常需要包含更多的成分以获得更好的回归性能,特别是为了达到姚和米勒所观察到的预测目的(2010)。然而,保留超过所需的FPC会带来过拟合的风险,这是因为包含了对回归贡献不大但会引入噪声的组件。因此,一个可取的策略是从足够多的候选人中找出“重要”的组成部分,而将那些“不重要”的部分缩小到0。
基于这些考虑,我们寻求一个全新的正则化和估计框架来识别FAM的稀疏结构。在过去十年中,由于快速出现的高维数据,鼓励稀疏结构的模型选择受到了广泛关注。在线性回归的背景下,开创性的作品包括套索(Tibshirani,1996)、自适应套索(Zou,2006),平滑剪裁的绝对偏差估计量(Fan和Li,2001)以及其中的参考文献。Lin和Zhang考虑了传统的加法模型(2006),梅尔等. (2009)和拉维库马尔等. (2009); Wood研究了广义可加模型的扩展(2006)还有玛拉和伍德(2011)。与这些工作相比,函数回归中的稀疏估计研究较少。据我们所知,大多数现有的工作都是针对具有稀疏惩罚的函数线性模型(James等。,2009; 朱等。,2010)或-类型惩罚(戈德史密斯等。,2011)。关于加性结构的相关研究在文献中很少。在本文中,我们考虑在再生核希尔伯特空间(RKHS)的框架下,选择和估计FAM中鼓励稀疏结构的可加分量。与标准的加性模型不同,FPC分数在FAM中没有直接观察到。它们需要首先从功能协变量中进行估计,然后插入到可加模型中。估计分数是随机变量,这给理论探索带来了重大挑战。有必要适当考虑不可观察的FPC分数对结果估计值的影响。此外,功能曲线X也没有完全观察到。我们通常会收集重复且间隔不规则的采样点,这些采样点会受到测量误差的影响。数据中的测量误差增加了模型实现和推断的额外困难。本文解决了所有这些问题。我们提出了一种两步估计方法来实现FAM中所需的稀疏结构估计。为了规范化,我们采用了COSSO(林和张,2006)由于其对RKHS中的函数的直接收缩效应而受到惩罚。在实际应用方面,利用FPCA的现有算法,该方法易于实现。
论文的其余部分组织如下。在第%节中2,我们给出了所提出的方法和算法,以及由此得到的估计器的理论性质。与现有方法比较的模拟结果包含在第节中三我们将建议的方法应用于第节中的Tecator数据4研究了蛋白质含量对吸收光谱的回归。结论见第节5,而估算程序和技术证明的详细信息则推迟到附录中。
本文中分析的数据和用于分析的程序可以从
https://academy.oup.com/jrsssb/issue网站/
2.结构化函数加性模型回归
让Y(Y)是与功能预测器相关联的标量响应X(t吨),,并让是对的独立同分布(IID)实现{Y(Y),X(·)}. 轨迹在可能不规则的网格上间歇性地观察到.表示离散化矢量形式,由。我们还假设轨迹受到IID测量误差的影响,即。具有和.遵循姚的FPCA等. (2005)和姚明(2007),表示为FPC得分顺序,与特征值相关具有.
2.1. 拟议方法
如第节所述1FPCA理论使随机函数对其FPC分数进行同构变换,为函数线性回归的模型拟合和理论发展带来了极大的便利。为了建立非线性和非参数回归的框架,我们考虑回归标量响应直接在FPC分数序列上属于为了便于模型正则化,我们希望将预测变量(即FPC分数)限制为取实线的封闭有界子集中的值,例如[0,1],而不损失通用性。这很容易通过单调函数Ψ:→[0,1]对FPC分数进行转换来实现事实上,Ψ的选择相当灵活。可以使用广泛的累积分布函数(CDF);参见第节中的假设22.2对于正则性条件。此外,可以选择Ψ,以便转换后的变量具有类似或相同的变化。这可以通过允许Ψ(·)依赖于特征值来实现,其中用作缩放变量。为了简单起见,下面我们使用合适的CDF(例如正常),表示为,来自平均值和方差为零的位置-尺度系列很明显,如果s是正态分布的,正态CDF导致[0,1]上的变换变量均匀分布。
表示的转换变量通过,即。,并表示,我们提出了一个加法模型,如下所示:
(3)
哪里均数和方差为零的独立误差、和是一个平滑函数。对于每个k个,让成为我[0,1]上的四阶Sobolev-Hilbert空间,定义为
可以证明这一点RKHS是否符合标准
参见Wahba(1990)林和张(2006)了解更多详细信息。请注意具有正交分解然后是加法函数对应于它是子空间的直接和,即。具有,对于所有人k个。很容易检查,对于任何,我们有在本文中,我们采用我=2,但结果可以直接推广到其他情况。区分Sobolev规范和-正常情况下,我们为前者和对于后者。
如第节所述1,需要在模型(3)上施加某种类型的正则化条件以选择重要组件。高维线性回归中常见的一个重要假设是底层真实模型的稀疏结构。这种假设在功能数据分析的背景下也很关键,这使我们能够开发出比保留领先FPC的启发式截断更系统的策略。虽然被广泛采用,但保留领先的FPC是一种仅由预测值的协方差算子指导的策略X,因此它没有考虑到响应Y(Y)为了更灵活,我们假设有助于响应的重要功能加性成分的数量是有限的,但不一定局限于前导项。特别是,我们表示重要组件的索引集,并假设,其中|·|表示集合的基数。换句话说,有一个足够大的秒这样的话,这意味着只要k个>秒因此,FAM相当于
(4)
值得注意的是,初始截断秒仅仅控制要考虑的加性成分的总数,这与姚建议的启发式截断不同等. (2005)还有米勒和姚明(2008)基于模型选择标准,如交叉验证、Akaike信息标准AIC或解释的变异分数。实际上,我们建议选择秒大到几乎100%的总变化都可以解释。在大多数经验案例中,这通常会导致超过10个FPC。
在这种假设下,回归函数位于截断子空间属于,其中ζ是的截断版本,即。依赖于秒如果没有出现混淆,则进行抑制。正则化未知光滑函数在非参数方面,我们使用了为RKHS中的函数估计定义的COSSO正则化,并进行了估计通过查找最大限度地减少
(5)
哪里是的正交投影如果到上面.在这里是唯一需要调整的平滑参数,而常用的平滑样条方法涉及多个平滑参数。惩罚J型(如果)是凸泛函,是中的伪范数COSSO和套索之间一个有趣的联系是,当,表达式(5)中的惩罚减少为,这将成为自适应套索惩罚(Zou,2006).
与标准的加性回归模型不同,转换后的FPC得分在表达式(5)中作为预测变量无法观察到。因此,在评估和结构选择之前,我们需要先评估FPC分数如果下面给出了一个简单的两步算法。
我们指的是附录A详细了解密集或稀疏观测的预测轨迹。我们将所提出的方法称为函数可加模型的成分选择和估计(CSEFAM)。
2.2. 理论性质
我们关注CSEFAM在以下情况下所得估计的一致性在本小节中,收敛速度是通过使用经验范数来评估的。特别地,我们引入了经验范数和熵如下所示。让; 经验规范克定义为.误差项的经验内积ɛ和克定义为类似地如果和克在里面是.
回归函数的假设如果变换Ψ(·,·)如下所示1和2,而函数预报器上常用的正则性条件密度设计和平滑程序推迟到条件1–3 in附录B.
假设1
对于任何,有独立的具有,这样,概率为1,
假设2
变换函数Ψ(ξ,λ)在处可微分ξ和λ,并满足这一点和对于一些常量C类和γ(γ< 0).
假设1是一个正则化条件,用于控制如果相对于其-规范。对于假设2,如果选择Ψ(·,·)作为平均值和方差为零的正态CDF,可以很容易地验证λ,然后C类=1和(当λ⩾1)或(当0时<λ< 1). 也可以选择学生的CDFt吨-或其他方差分布λ.
为了表示的简洁,技术引理和证明被推迟到附录B注意,通过类比Lin和Zhang的定理1,可以保证准则(5)的极小值的存在(2006),通过考虑输入的设计条件,其中秒是初始截断参数。
定理1
考虑回归模型(4),其中FPC得分是基于密集观测轨迹,以及是相应的特征值。让是目标函数(6)的最小值,并让是函数(6)中的调谐参数。假设1和2条件1-3保持不变。如果和
(7)
然后和.如果和
(8)
然后和.
值得一提的是,技术难点来自未观察到的变量,并致力于解决估算数量的影响利用自方差算子谱分解的分析工具得到的估计量X.定理三表明,如果对所有个体观察到的重复测量足够密集,并且是有界的,则得到的估计量由表达式(6)得到的具有收敛速度,与以下情况下的速率相同直接观察到。
3.仿真研究
为了证明所提出的CSEFAM方法的性能,我们在不同的设置下进行了仿真研究。在节中3.1和3.2,我们分别研究了CSEFAM对密集和稀疏函数数据的性能,假设底层的真实模型包含“重要”和“不重要”的加性成分。我们将CSEFAM方法与FAM类型方法和多元自适应回归样条(MARS)方法进行了比较。FAM类型的方法以三种不同的方式实现,其中两种是“oracle”方法,和,都假设对底层模型结构有充分的了解。特别是方法是金标准,其中并且使用了真正的非零添加成分。这个方法是另一种类型的oracle,其中通过FPCA进行估计,但使用了真正的非零加性成分。在节中3.3,我们研究了当底层真模型实际上是非解析模型时CSEFAM的性能,并将结果与饱和FAM和截断FAM进行了比较。对于每种设置,我们进行了100次蒙特卡罗模拟,并给出了所比较方法的模型选择和预测结果。
3.1. 密集的功能数据
我们使用20个特征函数生成1000个IID轨迹,其中n个=200随机分配给训练集,其余800组成测试集。功能预测因子,t吨∈[0,10],在具有100个等距点的网格上测量,具有独立的测量误差,.的特征值由生成具有一=45.25和b条= 0.64. 真正的FPC得分生成自和本征基取[0,10]上的前20个傅里叶基函数。平均曲线设置为.我们使用正规CDF来获得变换后的变量:,k个= 1,…, 20. 的值然后由生成,其中和。我们假设仅取决于三个非零加法分量:第一、第二和第四,即。,.给你,,,和对于这给出了信噪比(SNR)2.2,其中SNR定义为、和考虑到这一点.
我们将所提出的CSEFAM算法应用于训练数据,遵循第节中描述的FPCA和COSSO步骤2.1和附录A为了进行说明,我们选择了一个蒙特卡罗模拟,并在图中显示组件选择和估计结果。1。在FPCA中,初始截断为秒=18,占总变化的近100%,并进入COSSO步骤。然后通过调整正则化参数来实现组件选择在具有广义交叉验证的表达式(9)中,以及M(M)在表达式(10)中使用贝叶斯信息准则(BIC),如图1(a) 和1(b),而经验-的规范(计算单位:在不同的M(M))如图所示。1(c) ●●●●。在图中1(d) –1(f),对,k个显示=1、2、4,并且根据需要缩小为0。
模型选择和预测结果显示在表的顶部面板中1我们以不同于米勒和姚明的方式实施FAM程序(2008)。而不是使用局部多项式平滑来估计每个另外,我们对转换后的FPC分数进行了更一般的加性拟合,即广义加性模型,该模型允许反求,并提供了一个第页-每个添加剂组分的值。这样做的唯一原因是,广义可加模型算法显示出更大的数值稳定性,特别是当可加分量的数量较大时和FAM由于FPCA步骤中引入的估计误差,FAM与FAM相比,预计会牺牲一定的估计精度和预测能力.FAM模型是基于FPC估计分数和领先分数的饱和模型秒CSEFAM中使用的术语。FAM中未执行模型选择. The秒-数值从17到19不等,考虑到了几乎100%的总变化MARS方法基于Hastie等. (2001).
数据. | 模型. | 以下型号尺寸的计数:. | 以下组件的选择频率:. | 聚乙烯. |
---|
1. | 2. | 三. | 4. | 5. | 6. | 7. | 8. | . | . | . | . | . | . | . | . |
---|
密集设计 | CSEFAM公司 | 0 | 5 | 61 | 29 | 5 | 0 | 0 | 0 | 100 | 94 | 22 | 100 | 7 | 三 | 0 | 1 | 1.30 (0.13) |
| FAM公司 | 0 | 0 | 10 | 32 | 21 | 21 | 8 | 4 | 100 | 98 | 51 | 100 | 32 | 14 | 12 | 8 | 1.50 (0.17) |
| 火星 | — | — | — | — | — | — | — | — | 100 | 99 | 60 | 100 | 41 | 23 | 25 | 18 | 1.46 (0.16) |
| | 0 | 1 | 99 | — | — | — | — | — | 100 | 99 | — | 100 | — | — | — | — | 1.28 (0.12) |
| | 0 | 0 | 100 | — | — | — | — | — | 100 | 100 | — | 100 | — | — | — | — | 1.07 (0.06) |
稀疏设计 | CSEFAM公司 | 0 | 22 | 61 | 13 | 4 | 0 | 0 | 0 | 100 | 78 | 10 | 82 | 12 | 9 | 7 | 1 | 2.07 (0.16) |
| | 0 | 0 | 14 | 30 | 25 | 20 | 9 | 2 | 100 | 98 | 41 | 96 | 35 | 17 | 9 | 12 | 2.17 (0.16) |
| 火星 | — | — | — | — | — | — | — | — | 100 | 98 | 58 | 98 | 56 | 30 | 20 | 23 | 2.11 (0.14) |
| | 0 | 4 | 96 | — | — | — | — | — | 100 | 98 | — | 98 | — | — | — | — | 2.01 (0.14) |
| | 0 | 0 | 100 | — | — | — | — | — | 100 | 100 | — | 100 | — | — | — | — | 1.05 (0.05) |
数据. | 模型. | 以下型号尺寸的计数:. | 以下组件的选择频率:. | 聚乙烯. |
---|
1. | 2. | 三. | 4. | 5. | 6. | 7. | 8. | . | . | . | . | . | . | . | . |
---|
密集设计 | CSEFAM公司 | 0 | 5 | 61 | 29 | 5 | 0 | 0 | 0 | 100 | 94 | 22 | 100 | 7 | 三 | 0 | 1 | 1.30 (0.13) |
| FAM公司 | 0 | 0 | 10 | 32 | 21 | 21 | 8 | 4 | 100 | 98 | 51 | 100 | 32 | 14 | 12 | 8 | 1.50 (0.17) |
| 火星 | — | — | — | — | — | — | — | — | 100 | 99 | 60 | 100 | 41 | 23 | 25 | 18 | 1.46 (0.16) |
| | 0 | 1 | 99 | — | — | — | — | — | 100 | 99 | — | 100 | — | — | — | — | 1.28(0.12) |
| | 0 | 0 | 100 | — | — | — | — | — | 100 | 100 | — | 100 | — | — | — | — | 1.07(0.06) |
稀疏设计 | CSEFAM公司 | 0 | 22 | 61 | 13 | 4 | 0 | 0 | 0 | 100 | 78 | 10 | 82 | 12 | 9 | 7 | 1 | 2.07 (0.16) |
| | 0 | 0 | 14 | 30 | 25 | 20 | 9 | 2 | 100 | 98 | 41 | 96 | 35 | 17 | 9 | 12 | 2.17 (0.16) |
| 火星 | — | — | — | — | — | — | — | — | 100 | 98 | 58 | 98 | 56 | 30 | 20 | 23 | 2.11 (0.14) |
| | 0 | 4 | 96 | — | — | — | — | — | 100 | 98 | — | 98 | — | — | — | — | 2.01 (0.14) |
| | 0 | 0 | 100 | — | — | — | — | — | 100 | 100 | — | 100 | — | — | — | — | 1.05 (0.05) |
数据. | 模型. | 以下型号尺寸的计数:. | 以下组件的选择频率:. | 聚乙烯. |
---|
1. | 2. | 三. | 4. | 5. | 6. | 7. | 8. | . | . | . | . | . | . | . | . |
---|
密集设计 | CSEFAM公司 | 0 | 5 | 61 | 29 | 5 | 0 | 0 | 0 | 100 | 94 | 22 | 100 | 7 | 三 | 0 | 1 | 1.30 (0.13) |
| FAM公司 | 0 | 0 | 10 | 32 | 21 | 21 | 8 | 4 | 100 | 98 | 51 | 100 | 32 | 14 | 12 | 8 | 1.50 (0.17) |
| 火星 | — | — | — | — | — | — | — | — | 100 | 99 | 60 | 100 | 41 | 23 | 25 | 18 | 1.46 (0.16) |
| | 0 | 1 | 99 | — | — | — | — | — | 100 | 99 | — | 100 | — | — | — | — | 1.28 (0.12) |
| | 0 | 0 | 100 | — | — | — | — | — | 100 | 100 | — | 100 | — | — | — | — | 1.07 (0.06) |
稀疏设计 | CSEFAM公司 | 0 | 22 | 61 | 13 | 4 | 0 | 0 | 0 | 100 | 78 | 10 | 82 | 12 | 9 | 7 | 1 | 2.07 (0.16) |
| | 0 | 0 | 14 | 30 | 25 | 20 | 9 | 2 | 100 | 98 | 41 | 96 | 35 | 17 | 9 | 12 | 2.17 (0.16) |
| 火星 | — | — | — | — | — | — | — | — | 100 | 98 | 58 | 98 | 56 | 30 | 20 | 23 | 2.11 (0.14) |
| | 0 | 4 | 96 | — | — | — | — | — | 100 | 98 | — | 98 | — | — | — | — | 2.01 (0.14) |
| | 0 | 0 | 100 | — | — | — | — | — | 100 | 100 | — | 100 | — | — | — | — | 1.05(0.05) |
数据. | 模型. | 以下型号尺寸的计数:. | 以下部件的选择频率:. | 聚乙烯. |
---|
1. | 2. | 三. | 4. | 5. | 6. | 7. | 8. | . | . | . | . | . | . | . | . |
---|
密集设计 | CSEFAM公司 | 0 | 5 | 61 | 29 | 5 | 0 | 0 | 0 | 100 | 94 | 22 | 100 | 7 | 三 | 0 | 1 | 1.30 (0.13) |
| FAM公司 | 0 | 0 | 10 | 32 | 21 | 21 | 8 | 4 | 100 | 98 | 51 | 100 | 32 | 14 | 12 | 8 | 1.50 (0.17) |
| 火星 | — | — | — | — | — | — | — | — | 100 | 99 | 60 | 100 | 41 | 23 | 25 | 18 | 1.46 (0.16) |
| | 0 | 1 | 99 | — | — | — | — | — | 100 | 99 | — | 100 | — | — | — | — | 1.28 (0.12) |
| | 0 | 0 | 100 | — | — | — | — | — | 100 | 100 | — | 100 | — | — | — | — | 1.07 (0.06) |
稀疏设计 | CSEFAM公司 | 0 | 22 | 61 | 13 | 4 | 0 | 0 | 0 | 100 | 78 | 10 | 82 | 12 | 9 | 7 | 1 | 2.07 (0.16) |
| | 0 | 0 | 14 | 30 | 25 | 20 | 9 | 2 | 100 | 98 | 41 | 96 | 35 | 17 | 9 | 12 | 2.17 (0.16) |
| 火星 | — | — | — | — | — | — | — | — | 100 | 98 | 58 | 98 | 56 | 30 | 20 | 23 | 2.11 (0.14) |
| | 0 | 4 | 96 | — | — | — | — | — | 100 | 98 | — | 98 | — | — | — | — | 2.01 (0.14) |
| | 0 | 0 | 100 | — | — | — | — | — | 100 | 100 | — | 100 | — | — | — | — | 1.05 (0.05) |
值得注意的是,基于解释的变化的主观截断X对于回归来说是次优的(为了简洁起见,没有报告结果)。因此,在表中1,我们报告(在“以下型号尺寸的计数”列下)CSEFAM中选定数量的非零加性成分的计数,以及FAM、FAM中显著非零加法成分的计数和FAM。为了便于显示,仅报告最大为8的型号的计数。表中的“以下组件的选择频率”列1记录前八个组分中每个添加剂组分估计为非零的次数。对于MARS方法,如果j个th分量在一个或多个基函数中被选中,我们将其计为1,否则为0。关于预测误差(PE),我们使用来自训练集的总体估计(例如均值、协方差和特征基)来获得训练集和测试集的FPC得分;然后我们应用从训练集中估计以获得在测试集中。PE的计算公式为。从表的顶部面板1,我们看到,在密集设计下,CSEFAM选择正确的模型(模型大小等于3)的时间占61%,而FAM方法总是过度选择(α=0.05用于保留显著的添加剂成分)。CSEFAM的PE是三种非oracle模型中最小的。与oracle方法相比,CSEFAM的预测能力不如FAM(轻微)和FAM,这可以被视为双方估算ζ并选择添加剂成分。
为了评估估计的准确性,前八个加法分量和整体函数的平均积分平方误差(AISE)如果显示在表的顶部面板中2,其中ISE定义为
从表2,我们看到CSEFAM为真正的零分量提供了相当小的AISE(,j个=3,5,6,7,8)比FAM方法。对于非零分量,CSEFAM、FAM和FAM具有可比较的AISE值。
数据. | 模型. | 以下功能的AISE:. |
---|
. | . | . | . | . | . | . | . | 如果. |
---|
稠密 | CSEFAM公司 | 0.038 | 0.117 | 0.022 | 0.038 | 0.005 | 0.001 | 0 | 0.001 | 0.226 |
设计 | FAM公司 | 0.030 | 0.095 | 0.050 | 0.047 | 0.031 | 0.018 | 0.016 | 0.015 | 0.476 |
| FAM公司 | 0.027 | 0.090 | — | 0.042 | — | — | — | — | 0.158 |
| FAM公司 | 0.007 | 0.028 | — | 0.019 | — | — | — | — | 0.054 |
稀疏 | CSEFAM公司 | 0.033 | 0.22 | 0.036 | 0.298 | 0.055 | 0.040 | 0.045 | 0.001 | 0.720 |
设计 | 家庭 | 0.016 | 0.118 | 0.032 | 0.159 | 0.102 | 0.121 | 0.399 | 2.64 | |
| FAM公司 | 0.026 | 0.129 | — | 0.220 | — | — | — | — | 0.376 |
| FAM公司 | 0.007 | 0.016 | — | 0.013 | — | — | — | — | 0.036 |
数据. | 模型. | 以下功能的AISE:. |
---|
. | . | . | . | . | . | . | . | 如果. |
---|
稠密 | CSEFAM公司 | 0.038 | 0.117 | 0.022 | 0.038 | 0.005 | 0.001 | 0 | 0.001 | 0.226 |
设计 | FAM公司 | 0.030 | 0.095 | 0.050 | 0.047 | 0.031 | 0.018 | 0.016 | 0.015 | 0.476 |
| FAM公司 | 0.027 | 0.090 | — | 0.042 | — | — | — | — | 0.158 |
| FAM公司 | 0.007 | 0.028 | — | 0.019 | — | — | — | — | 0.054 |
稀疏 | CSEFAM公司 | 0.033 | 0.22 | 0.036 | 0.298 | 0.055 | 0.040 | 0.045 | 0.001 | 0.720 |
设计 | FAM公司 | 0.016 | 0.118 | 0.032 | 0.159 | 0.102 | 0.121 | 0.399 | 2.64 | |
| FAM公司 | 0.026 | 0.129 | — | 0.220 | — | — | — | — | 0.376 |
| FAM公司 | 0.007 | 0.016 | — | 0.013 | — | — | — | — | 0.036 |
数据. | 模型. | 以下功能的AISE:. |
---|
. | . | . | . | . | . | . | . | 如果. |
---|
稠密 | CSEFAM公司 | 0.038 | 0.117 | 0.022 | 0.038 | 0.005 | 0.001 | 0 | 0.001 | 0.226 |
设计 | FAM公司 | 0.030 | 0.095 | 0.050 | 0.047 | 0.031 | 0.018 | 0.016 | 0.015 | 0.476 |
| FAM公司 | 0.027 | 0.090 | — | 0.042 | — | — | — | — | 0.158 |
| FAM公司 | 0.007 | 0.028 | — | 0.019 | — | — | — | — | 0.054 |
稀疏 | CSEFAM公司 | 0.033 | 0.22 | 0.036 | 0.298 | 0.055 | 0.040 | 0.045 | 0.001 | 0.720 |
设计 | FAM公司 | 0.016 | 0.118 | 0.032 | 0.159 | 0.102 | 0.121 | 0.399 | 2.64 | |
| FAM公司 | 0.026 | 0.129 | — | 0.220 | — | — | — | — | 0.376 |
| FAM公司 | 0.007 | 0.016 | — | 0.013 | — | — | — | — | 0.036 |
数据. | 模型. | 以下功能的AISE:. |
---|
. | . | . | . | . | . | . | . | 如果. |
---|
稠密 | CSEFAM公司 | 0.038 | 0.117 | 0.022 | 0.038 | 0.005 | 0.001 | 0 | 0.001 | 0.226 |
设计 | FAM公司 | 0.030 | 0.095 | 0.050 | 0.047 | 0.031 | 0.018 | 0.016 | 0.015 | 0.476 |
| FAM公司 | 0.027 | 0.090 | — | 0.042 | — | — | — | — | 0.158 |
| FAM公司 | 0.007 | 0.028 | — | 0.019 | — | — | — | — | 0.054 |
稀疏 | CSEFAM公司 | 0.033 | 0.22 | 0.036 | 0.298 | 0.055 | 0.040 | 0.045 | 0.001 | 0.720 |
设计 | FAM公司 | 0.016 | 0.118 | 0.032 | 0.159 | 0.102 | 0.121 | 0.399 | 2.64 | |
| FAM公司 | 0.026 | 0.129 | — | 0.220 | — | — | — | — | 0.376 |
| FAM公司 | 0.007 | 0.016 | — | 0.013 | — | — | — | — | 0.036 |
3.2. 稀疏功能数据
为了与稠密情况进行比较,我们还进行了模拟,以检查CSEFAM对于稀疏函数数据的性能。我们生成了1200条IID轨迹,其中300条在训练集中,900条在测试集中。在每条轨迹中,有5-10个重复观测值均匀分布在[0,10]中,以相等的概率从5到10选择点数。其他设置与密集设计中的设置相同。模型选择、预测和估算结果的总结见表的底部面板1和表2。我们观察到类似于密集设计案例中的模式。此外,表2建议,对于稀疏设计,FAM估计对于高阶组件(例如。k个>7). 由于外围估计的影响,AISE快速增长。这并不奇怪,因为在稀疏设计下,由于数据的稀疏性和适度的样本量,高阶特征函数和FPC分数很难准确估计,从而导致不准确-饱和模型FAM时的估计使用。在这种情况下,我们可以看到,由于COSSO惩罚具有自动降低“不重要”组件权重的效果,因此所建议的CSEFAM仍然表现得相当稳定。这为拟议的CSEFAM方法提供了进一步支持。
3.3. 非解析底层加法组件
为了显示当真实的可加成分实际上是非解析的时模型的性能,我们对密集设计的两个设置(研究I和研究II)进行了额外的模拟,并将CSEFAM与两个版本的FAM进行了比较:饱和模型FAM如第节所定义3.1和截断模型FAM选择截断保留99%的总变化。在研究I中,真实模型包含三个“较大”的附加成分,格式与第节相同3.1除了被常数重新缩放。其余是“较小”的加性成分,每个都是从中随机选择的具有相同的概率,并通过从[1/17,1/14]中均匀选择的较小常数重新缩放。生成的数据的信噪比较低(更具挑战性),约为0.60,其中8.7%来自“较小”分量。结果列在表的顶部面板中三,这表明CSEFAM倾向于选择比FAM更小的型号我们还观察到FAM的模型大小倾向于小于CSEFAM,因为采用99%阈值的更多截断。值得注意的是,CSEFAM实际上产生的PE和AISE远远小于FAM方法,CSEFAM的结果与FAM的结果具有可比性在研究II中,我们用较小的组件替换三个较大的组件;因此,所有加性成分的贡献都大致相等。我们从中统一选择缩放常数因此总信噪比平均为0.30。表底部面板中列出的结果三建议CSEFAM现在倾向于选择更多组件(即产生非解析配合),并且再次产生比FAM更小的PE和AISE和FAM方法。总的来说,该模拟表明,即使底层真实模型是非解析的,所提出的CSEFAM仍然是一个合理的选项。值得一提的是,CSEFAM的增益在低信噪比的挑战性环境中更为明显。
类型. | 模型. | 以下型号尺寸的计数:. | 以下组件的选择频率:. | 聚乙烯. | f的AISE. |
---|
1. | 2. | 三. | 4. | 5. | 6. | 7. | 8. | . | . | . | . | . | . | . | . |
---|
我 | CSEFAM公司 | 0 | 三 | 20 | 34 | 26 | 9 | 6 | 2 | 100 | 88 | 12 | 100 | 17 | 12 | 10 | 10 | 1.19 (0.08) | 0.17 |
FAM公司 | 0 | 4 | 16 | 18 | 29 | 17 | 7 | 8 | 100 | 92 | 16 | 99 | 20 | 17 | 19 | 16 | 1.33 (0.12) | 0.33 |
FAM公司 | 0 | 4 | 39 | 35 | 15 | 6 | 0 | 1 | 100 | 91 | 15 | 100 | 19 | 15 | 9 | 9 | 1.22 (0.08) | 0.18 |
二 | CSEFAM公司 | 1 | 2 | 4 | 12 | 13 | 20 | 26 | 13 | 46 | 42 | 33 | 42 | 36 | 42 | 38 | 44 | 1.25(0.07) | 0.12 |
FAM公司 | 1 | 6 | 8 | 25 | 14 | 13 | 13 | 10 | 42 | 45 | 29 | 37 | 29 | 38 | 36 | 36 | 1.38 (0.11) | 0.42 |
家庭 | 13 | 30 | 22 | 20 | 6 | 6 | 2 | 0 | 34 | 35 | 20 | 31 | 25 | 38 | 34 | 30 | 1.32 (0.08) | 0.20 |
类型. | 模型. | 以下型号尺寸的计数:. | 以下组件的选择频率:. | 聚乙烯. | f的AISE. |
---|
1. | 2. | 三. | 4. | 5. | 6. | 7. | 8. | . | . | . | . | . | . | . | . |
---|
我 | CSEFAM公司 | 0 | 三 | 20 | 34 | 26 | 9 | 6 | 2 | 100 | 88 | 12 | 100 | 17 | 12 | 10 | 10 | 1.19 (0.08) | 0.17 |
FAM公司 | 0 | 4 | 16 | 18 | 29 | 17 | 7 | 8 | 100 | 92 | 16 | 99 | 20 | 17 | 19 | 16 | 1.33 (0.12) | 0.33 |
FAM公司 | 0 | 4 | 39 | 35 | 15 | 6 | 0 | 1 | 100 | 91 | 15 | 100 | 19 | 15 | 9 | 9 | 1.22 (0.08) | 0.18 |
二 | CSEFAM公司 | 1 | 2 | 4 | 12 | 13 | 20 | 26 | 13 | 46 | 42 | 33 | 42 | 36 | 42 | 38 | 44 | 1.25 (0.07) | 0.12 |
FAM公司 | 1 | 6 | 8 | 25 | 14 | 13 | 13 | 10 | 42 | 45 | 29 | 37 | 29 | 38 | 36 | 36 | 1.38 (0.11) | 0.42 |
FAM公司 | 13 | 30 | 22 | 20 | 6 | 6 | 2 | 0 | 34 | 35 | 20 | 31 | 25 | 38 | 34 | 30 | 1.32 (0.08) | 0.20 |
类型. | 模型. | 以下型号尺寸的计数:. | 以下组件的选择频率:. | 聚乙烯. | f的AISE. |
---|
1. | 2. | 三. | 4. | 5. | 6. | 7. | 8. | . | . | . | . | . | . | . | . |
---|
我 | CSEFAM公司 | 0 | 三 | 20 | 34 | 26 | 9 | 6 | 2 | 100 | 88 | 12 | 100 | 17 | 12 | 10 | 10 | 1.19 (0.08) | 0.17 |
FAM公司 | 0 | 4 | 16 | 18 | 29 | 17 | 7 | 8 | 100 | 92 | 16 | 99 | 20 | 17 | 19 | 16 | 1.33 (0.12) | 0.33 |
FAM公司 | 0 | 4 | 39 | 35 | 15 | 6 | 0 | 1 | 100 | 91 | 15 | 100 | 19 | 15 | 9 | 9 | 1.22 (0.08) | 0.18 |
二 | CSEFAM公司 | 1 | 2 | 4 | 12 | 13 | 20 | 26 | 13 | 46 | 42 | 33 | 42 | 36 | 42 | 38 | 44 | 1.25 (0.07) | 0.12 |
FAM公司 | 1 | 6 | 8 | 25 | 14 | 13 | 13 | 10 | 42 | 45 | 29 | 37 | 29 | 38 | 36 | 36 | 1.38 (0.11) | 0.42 |
家庭 | 13 | 30 | 22 | 20 | 6 | 6 | 2 | 0 | 34 | 35 | 20 | 31 | 25 | 38 | 34 | 30 | 1.32 (0.08) | 0.20 |
类型. | 模型. | 以下型号尺寸的计数:. | 以下部件的选择频率:. | 聚乙烯. | f的AISE. |
---|
1. | 2. | 三. | 4. | 5. | 6. | 7. | 8. | . | . | . | . | . | . | . | . |
---|
我 | CSEFAM公司 | 0 | 三 | 20 | 34 | 26 | 9 | 6 | 2 | 100 | 88 | 12 | 100 | 17 | 12 | 10 | 10 | 1.19 (0.08) | 0.17 |
FAM公司 | 0 | 4 | 16 | 18 | 29 | 17 | 7 | 8 | 100 | 92 | 16 | 99 | 20 | 17 | 19 | 16 | 1.33 (0.12) | 0.33 |
FAM公司 | 0 | 4 | 39 | 35 | 15 | 6 | 0 | 1 | 100 | 91 | 15 | 100 | 19 | 15 | 9 | 9 | 1.22 (0.08) | 0.18 |
二 | CSEFAM公司 | 1 | 2 | 4 | 12 | 13 | 20 | 26 | 13 | 46 | 42 | 33 | 42 | 36 | 42 | 38 | 44 | 1.25 (0.07) | 0.12 |
FAM公司 | 1 | 6 | 8 | 25 | 14 | 13 | 13 | 10 | 42 | 45 | 29 | 37 | 29 | 38 | 36 | 36 | 1.38 (0.11) | 0.42 |
FAM公司 | 13 | 30 | 22 | 20 | 6 | 6 | 2 | 0 | 34 | 35 | 20 | 31 | 25 | 38 | 34 | 30 | 1.32 (0.08) | 0.20 |
4.真实数据应用
通过对240多个肉类样品的近红外吸收光谱的蛋白质含量回归,我们验证了该方法的性能。数据集由Tecator公司收集,可在StatLib网站上公开获取(http://lib.stat.cmu.edu)。通过名为Tecator Infratec食品和饲料分析仪的光谱仪进行测量。在850 nm至1050 nm的波长范围内记录光谱曲线。对于每个肉类样品,数据包括100道吸收光谱(100个网格点)以及水分(水)、脂肪和蛋白质的含量。吸光度是光谱仪测量的透射率的负公共对数。这三种含量以百分比计量,由分析化学测定。最重要的是利用光谱轨迹预测蛋白质含量。240份肉类样本被随机分为训练集(185份样本)和测试集(55份样本)。我们的目的是利用训练数据预测测试集中的蛋白质含量。图。2说明了使用FPCA估计的光谱曲线和前五个特征函数。
我们最初保留了前20个FPC,其中考虑了几乎100%的总变化。然后将所提出的CSEFAM应用于组件选择和估计。COSSO步骤中调谐参数的确定受以下方面的广义交叉验证标准的指导,它提供,并通过十倍交叉验证M(M),它提供M(M)= 10.0. 估计的附加成分如图所示。三从中我们可以看到CSEFAM从20个组件中选择了12个,,其他分量估计为0。为了评估所提方法的性能,我们在表中报告了测试集的PE4,其中PE的计算方法与第节相同三。我们还报告了准-对于测试集,定义为
为了显示初始截断的影响,我们还使用较小的值秒,秒在CSEFAM中=10,得出次优结果。这表明我们应该使用足够大的秒首先。FAM由前五个、10个和20个FPC执行。一个有趣的现象是,尽管高阶FPC(超过10)解释了功能预测值的极小变化(小于1%),但它们对预测的贡献却惊人地巨大。MARS方法和偏最小二乘法(这是化学计量学中常用的方法;参见Xu等. (2007)以及其中的参考)。另一个比较是与经典函数线性模型的比较,该模型将估计的主要FPC用作预测因子,其中使用启发式AIC来选择前七个分量。
. | 以下方法的结果:. |
---|
CSEFAM公司. | FAM公司. | MARS PC20. | 偏最小二乘法,PLD20. | 函数线性模型AIC7. |
---|
秒= 10. | 秒= 20. | PC5公司. | PC10公司. | PC20型. |
---|
聚乙烯 | 2.22 | 0.72 | 3.98 | 2.13 | 0.84 | 0.77 | 1.02 | 1.50 |
| 0.82 | 0.94 | 0.68 | 0.83 | 0.93 | 0.93 | 0.92 | 0.88 |
. | 以下方法的结果:. |
---|
CSEFAM公司. | 家庭. | MARS PC20. | 偏最小二乘法,PLD20. | 函数线性模型,AIC7. |
---|
秒= 10. | 秒= 20. | PC5公司. | 第10页. | PC20型. |
---|
聚乙烯 | 2.22 | 0.72 | 3.98 | 2.13 | 0.84 | 0.77 | 1.02 | 1.50 |
| 0.82 | 0.94 | 0.68 | 0.83 | 0.93 | 0.93 | 0.92 | 0.88 |
. | 以下方法的结果:. |
---|
CSEFAM公司. | FAM公司. | MARS PC20. | 偏最小二乘法,PLD20. | 函数线性模型AIC7. |
---|
秒= 10. | 秒= 20. | PC5公司. | PC10公司. | PC20型. |
---|
聚乙烯 | 2.22 | 0.72 | 3.98 | 2.13 | 0.84 | 0.77 | 1.02 | 1.50 |
| 0.82 | 0.94 | 0.68 | 0.83 | 0.93 | 0.93 | 0.92 | 0.88 |
. | 以下方法的结果:. |
---|
CSEFAM公司. | FAM公司. | MARS PC20. | 偏最小二乘法,PLD20. | 函数线性模型AIC7. |
---|
秒= 10. | 秒= 20. | PC5公司. | PC10公司. | PC20型. |
---|
聚乙烯 | 2.22 | 0.72 | 3.98 | 2.13 | 0.84 | 0.77 | 1.02 | 1.50 |
| 0.82 | 0.94 | 0.68 | 0.83 | 0.93 | 0.93 | 0.92 | 0.88 |
从表4,我们看到,当初始截断设置为10时,所提出的CSEFAM与FAM相比并不是明显有利的。随着FPC数量增加到20个,所提出的方法提供了更小的PE和更高的PE比所有其他方法都好。一个合理的解释是,对于这些数据,前10个FPC中的大多数(第九个除外)对响应的贡献为非零(如图所示)。三); 因此,惩罚这些成分无助于改善预测。然而,随着FPC分数的增加,更多的冗余项开始发挥作用,因此惩罚方法CSEFAM获得了更多的预测能力。我们对训练集和测试集的不同随机分割重复了此分析,并且结论几乎保持不变。
图3
估计附加成分图:(a); (b); (c); (d); (e); (f); (g); (h); (i); (j); (k); (l); (米); (n); (o); (p); (q); (r); (s); (t)
5.讨论
我们提出了一种用于函数数据回归的结构估计方法,其中标量响应在函数预测器上回归。该模型是在FAM框架下构建的,其中加性成分是标度FPC分数的函数。在RKHS环境下,使用COSSO惩罚,通过惩罚最小二乘法选择和估计可加成分。提出的方法考虑到响应和预测因子之间更一般的非参数关系,因此是函数线性回归的重要扩展。通过采用加法结构,避免了无限维预测过程引起的维数灾难。该方法提供了一种选择预测过程重要特征并同时将不重要特征收缩为0的方法。这种选择场景不仅考虑了预测过程的解释变化,还考虑了其对响应的贡献。理论结果表明,在密集设计下,由于FPC得分不可观测,部件选择和估计的非参数率将主导差异。
提出的一个问题是稀疏性在FAM框架中是否必要。一般来说,稀疏性假设有助于平衡方差和偏差之间的平衡,这可能会提高模型性能。当部分预测器对回归的贡献可以忽略不计时,这一点尤其有用。即使基础模型实际上是非稀疏的,并且我们只关心估计和预测,所提出的CSEFAM仍然是一个合理的选择,如第节中的模拟所示三我们还指出,当所有非零可加分量均为线性时,COSSO惩罚降为自适应套索惩罚。另一个模拟(为了简洁起见,没有报道)表明,所提出的方法产生的估计和预测结果与自适应套索的结果相当。此外,COSSO处罚要求秒<n个,这与初始截断的要求不冲突秒选择的尺寸足够大,可以包含所有重要功能。实际上,占预测变量近100%的FPC数量通常远小于样本量n个由于特征值的快速衰减。最后,仿真和实际算例都表明,模型性能对秒只要选择足够大。
在计算方面,我们的算法同时利用了FPCA和COSSO。在装有Intel(R)Core(TM)i5-2400中央处理器单元、3.10-GHz处理器和8 GB随机访问内存的桌面上,第节中的每个Monte Carlo示例3.1实际数据分析需要30秒,而实际数据分析大约需要10秒。就维数而言,容量和速度取决于所使用的特定FPCA算法。我们使用了主成分分析的条件期望算法PACE,它可以处理相当大的数据(http://anson.ucdavis.edu/~ntyang/PACE/)。对于5000维或更高维的密集函数数据,建议使用预先装箱来加速计算。也可以使用面向超大维度的FPCA算法(所有科目的时间网格相同);例如,齐普诺尼科夫等. (2011)考虑的功能磁共振成像数据的维数为通过将原始数据矩阵划分为块,并使用块操作进行奇异值分解。
尽管我们在本工作中重点关注了基于FPC的分析,但CSEFAM框架通常适用于其他基结构,例如样条和小波,其中加性分量是预测过程相应基系数的函数。它也可能适用于除COSSO以外的非参数惩罚,例如Meier中提出的稀疏平滑惩罚等. (2009)。建议的方法可以进一步扩展,以适应分类响应,其中可以选择适当的链接函数来将平均响应与加性结构相关联。另一种可能的扩展是使用多个功能预测因子进行回归,其中可以进行组件选择以选择功能预测因子。在这种情况下,需要以分组方式选择与每个功能预测器关联的可加性成分。
致谢
这项工作是通过美国统计与应用数学科学研究所的“对象数据分析”项目进行的。方耀的研究部分得到了加拿大自然科学与工程研究委员会的个人发现拨款和发现加速器补充资金的支持。张浩海伦(Hao Helen Zhang)获得了美国国立卫生研究院(US National Institutes of Health)资助R01 CA-085848和美国国家科学基金会(National Science Foundation)资助DMS-0645293。
参考文献
附录A估算程序
估计,我们假设在网格上观测到函数预测值的测量误差为我们对观测密集或稀疏的功能数据采用了两种不同的程序。
- (a)
获取在密集设计中.如果对于每个受试者,我们在足够密集的网格上进行观察,然后对数据应用局部线性平滑单独进行,这将提供平滑近似。平均值和协方差函数由以下公式获得和分别是。通过求解方程估计特征值和特征函数对于和,受制于和对于米≠k个,k个,米= 1,…,秒FPC得分由以下公式得出。最终CDF转换产生. - (b)
获取在稀疏设计中.我们通过Yao提出的PACE算法采用主成分分析等. (2005),其中平均估计值通过使用基于所有个体的合并数据的局部线性平滑器获得。特别地,具有K(K)(·)核函数和b条带宽。对于协方差估计,表示然后让是具有带宽的二元核函数小时一个最小化可以估计噪声方差通过取曲面估计对角线之间的差值以及从原始方差获得的局部多项式估计在稠密情况下,获得特征值或特征函数。要估计FPC得分,请表示,PACE估计值如下所示,这导致,k个= 1,…,秒.在这里,、和(j个,我)第个元素具有如果j个=我和否则,以及''是估计参数的通用表示法。
我们下一步估计通过最小化表达式(6),遵循以估计值为条件的COSSO程序。需要注意的是,目标函数(6)等价于
从属于(林和张,2006),它支持两步迭代算法。具体来说,首先发现和b条∈通过最小化
(9)
带有固定的,其中,是平滑参数,是n个×1 1s矢量,和是的再生内核,即。此优化就是一个平滑样条问题。然后我们修复c(c)和b条,然后查找θ通过最小化
(10)
哪里和问是一个n个×秒矩阵,带有k个第th列为。此步骤与使用M(M)作为调谐参数。关于收敛性如果然后由给出.
关于调谐参数的选择,除了足够大的初始截断秒,最相关的是和M(M)在COSSO步骤中,而FPCA平滑步骤中的带宽是通过传统的交叉验证或其广义近似来选择的。有关更多详细信息,请参阅Fan和Gijbels(1996)对于密集型病例和姚明等. (2005)对于稀疏情况。我们建议选择通过使用广义交叉验证,即。具有.供选择M(M),我们采用贝叶斯信息准则BIC,即。其中df是问题(10)中的自由度,而另一种方法是交叉验证,这需要更多的计算。
附录B技术假设和证明
我们首先列出了函数预测过程中常用的正则性条件X用于密集设计。回想一下支架上的网格是函数预测器观察到。在不失一般性的情况下,让.表示,和对一些人来说d日>0。表示用于单独平滑我第个轨迹为.
条件1
假设二阶导数持续打开概率为1且概率为1k个= 0, 2. 同时假设,其中是观测轨迹的IID测量误差.
条件2
假设存在米≡米(n个)→∞,这样作为n个→ ∞. 表示,假设.
条件3
假设有一个序列b条=b条(n个),因此对一些人来说C类⩾c(c)>此外,b条→ 0和米→ ∞ 作为n个→ ∞ 费率如下,例如。和。还假设内核函数K(K)(·)是紧支撑的,Lipschitz是连续的。
表示与协方差函数关联的运算符G公司(秒,t吨)由G公司,并定义.表示的平滑轨迹使用带带宽的局部线性平滑通过和稠密设计中估计的特征值、特征函数和FPC得分和分别是。由于特征值的衰减起着重要作用,定义和对于k个⩾2.
引理1
在条件1-3下,我们有
(11)
(12)
(13)
哪里O(运行)(·)和在1⩽以上均匀我⩽n个.
注意测量误差独立于流程,从而可以将概率空间因子化并且分别表征单独的平滑和横截面平均。然后是方程式(11)可以通过使用带有局部多项式平滑的标准技术来显示(这是为了简洁,没有详细说明);见大厅等. (2006)有关此类型参数的更多详细信息。因此,方程式(12)和(13)紧接着给出了Bosq引理4.3中的经典摄动结果(2000)。从引理1可以看出,当每个满足条件3的对象的测量足够密集时,由于个体平滑对估计的总体数量(例如平均值、协方差、特征值和特征函数)的影响可以忽略不计。
下面的引理描述了基本变量和估计转换变量之间的差异以及结果估计导数的有界性.
引理2
根据第节假设22条件1-3,我们有
(14)
(15)
此外,如果假设1成立,则是对…的估计通过最小化表达式(6)获得。然后有一个常数ρ>0,这样
(16)
均匀地超过1⩽k个⩽秒和1⩽我⩽n个.
B.1。引理2的证明
从引理7假设2,我们有
缩写到,到和至“~”。自,很容易看出,显示任何固定的结果(15)秒,请注意
然后
表示此公式中的加法项——,我们有
作为
对于应用Cauchy–Schwarz不等式,
同样,我们有和,利用事实和这证明了结果(15)。
我们现在转向不平等(16)。对于任何,我们有
哪里R(右)(·,·)是空间的再生核和是相应的内积。因此,
自J型(如果)是凸泛函和伪范数,我们有
(17)
我们首先声称如果‖ ⩽J型(如果),因为.如果b条=0,不等式(17)表示‖如果‖ ⩽J型(如果)。如果b条≠0,我们可以写为了最小化表达式(5),它等价于替换J型(如果)带有,不等式(17)意味着因此,我们有‖如果‖ ⩽J型(如果)一般来说。其次,由于,我们可以写根据Berlinet和Thomas-agnan中的定理5(2004),其中是子空间的再生核。对于作为二阶Sobolev-Hilbert空间,我们有,带有,和.因此连续且可微我们可以找到常数和这样的话
对于k个= 1,…,秒.人们可以找到一个统一的界限c(c)具有然而最小化表达式(6)等价于最小化在约束条件下对一些人来说。因此,让; 我们有
□
在陈述引理3之前,我们定义了关于公制。对于每个ω>0,可以找到函数集合在里面这样,对于每个,有一个j个=j个(克) ∈ {1, 2,…,N个}令人满意的.让是的最小值N个这种球的半径覆盖ω和中心存在。然后被称为ω-的熵.
引理3
假设,其中是二阶Sobolev空间。表示ω-的熵通过。那么
(18)
为所有人ω>0,n个⩾1,对于某些常数A类>0.此外,对于与有限方差无关,
(19)
不等式(18)由Lin和Zhang的引理A.1隐含(2006)。作为满足亚高斯误差假设,与范德格尔的论点相同(2000)(第168页)导致结果(19)。我们现在准备给出主要定理的证明。
B.2节。定理1的证明
我们首先将函数集中在Lin和Zhang定理2的证明中(2006)因此结果(18)和(19)成立。写入,因此,然后写入这样的话和。因为目标函数可以写为
我们必须要那个减少以及将其余的最小化。因此我们有,暗示着.表示
(20)
我们可以替换具有在方程式中(20)。在证明的其余部分中,我们取消了和为了方便起见。自,我们有,这意味着
这个不等式的简化给出了
(21)
让.由于两者和在中,泰勒级数展开克(·)给出,对于所有人,其中.那么我们有
我们将其插入不等式(21)的右侧,从而得出上界
(22)
应用引理3,我们可以将表达式(22)中的第一项绑定如下:
对于不等式(21)的左侧,应用泰勒级数展开,,到第一学期
哪里
替换不等式(21)两侧的项,我们得到
去掉正项并重新排列术语,
(23)
哪里
和.
对于通过Cauchy–Schwarz不等式和引理2,我们得到了,其中
即。从引理2的假设1和结果(16)来看,存在独立的随机变量具有这样的话。还要注意几乎可以肯定的是,强大的大数定律。因此,对于一些常量c(c),
对于其余条款,、和
我们现在可以将不等式(23)简化如下:
如果,我们有
(24)
否则,
(25)
将通过单独解决这些问题来完成证明。对于不等式(24),有两种可能性。
- (a)
如果,不等式(24)意味着、和因此,(26)
即。 - (b)
如果,然后,不等式(24)意味着这将导致(27)
注意,结果(26)和(27)在条件(7)下是等价的。
对于不等式(25),如果,我们有; 否则第一个不等式意味着
对于第二个不等式,如果,我们有,暗示着
(29)
如果和,然后
(30)
什么时候?,给定条件(7)和从表达式(29),(26)和(27)是相同的,并且支配着表达式(28)和(30)。因此我们有和.何时,则不等式(24)意味着表达式(26),而不等式(25)意味着公式(28)和(30)。不存在不平等(24)的可能性(b);也没有得到表达式(29)中的结果。在条件(8)下,表达式(26)的结果与表达式(28)和(30)的结果相同。因此和.
©2013皇家统计学会