总结

基于回归的预测中的成分选择问题由来已久。必须做出重要选择的主要情况是函数数据分析,以及解释变量是相对高维向量的问题。事实上,主成分分析已经成为函数线性回归方法的基础。在这种情况下,分量的数量也可以解释为一个平滑参数,因此该观点与标准线性回归的观点略有不同。然而,支持和反对传统组件选择方法的论据与这两种设置都相关,最近受到了很大的关注。我们给出了一个适用于各种环境的理论论证,证明了传统方法的合理性。虽然我们的结果是极小极大型的,但本质上它不是渐近的;它适用于每个样本大小。基于从该分析中获得的洞察力,我们为用于预测的组件数量的交叉验证选择提供了理论和数值依据。特别地,我们表明,在包括函数数据分析的设置中,交叉验证导致平均和平方误差的渐近最小化。

1.简介

1.1. 一般多元问题中的主成分

假设我们观察到独立且相同分布的数据对(X(X)1,Y(Y)1),…,(X(X)n个,Y(Y)n个),生成为(X(X),Y(Y))根据模型

Y(Y)=α+β,X(X)+ε.
(1.1)

在这里Y(Y),αɛ是标量,X(X)β是空间中的向量或函数F类,,表示上的内积F类和实验误差ɛ平均值为零,方差有限,与解释变量无关X(X)。对于给定值x个属于X(X),我们希望估计Y(Y)考虑到这一点X(X)=x个:

μ(x个)=E类(Y(Y)X(X)=x个)=α+β,x个.
(1.2)

在以下背景下k个-变量线性回归,其中β= (β(1),…,β(k个))T型X(X)= (X(X)(1),…,X(X)(k个))T型都是向量,模型中的内积(1.1)由向量乘法给出:〈β,X(X)〉 =βT型X(X)。在功能数据分析中,其中βX(X)这两个函数都是在一个区域上定义的吗R(右)例如,内积表示一个积分:

β,X(X)=R(右)β(t吨)X(X)(t吨)d日t吨.
(1.3)

估算的传统方法μ(x个)基于估计值ϕ^1,ϕ^2,各自的正交特征向量φ1,φ2,…出现在协方差函数的正则分解中,K(K)(,t吨)=覆盖{X(X)(),X(X)(t吨)},第页,共页X(X)。(在本公式及以下公式中t吨在里面X(X)(t吨)指的是X(X)如果X(X)是一个向量,对于X(X)如果X(X)是一个函数。)数量ϕ^1,ϕ^2,通常根据其重要性的经验度量排序,通过要求相应的特征值估值器θ^j个按递减顺序:

θ^1θ^2
(1.4)

在非常高的维度设置中,只有前几个特征向量ϕ^j个用于预测。因此,按顺序订购(1.4),并使用交叉验证等技术来选择频率截止值,从而产生了一种降维方法。正是这种背景推动了我们的工作。

这些参数支持主成分方法来选择和排序回归变量,在这种情况下,它们至少可以追溯到Kendall的工作(1957),第75页。最近,在功能数据分析中,这些参数通常被用于服务。有关此类相对较新的贡献,请参见Bosq(2000)、卡多特(2000)、卡多特等。(2000,2003)、吉拉德(2000)、詹姆斯等。(2000)、Kneip和Utikal(2001)Boente和Fraiman(2000),他等。(2003)、Yamanishi和Tanaka(2005),霍尔等。(2006)、姚明和李(2006)、卡多特(2007)蔡和霍尔(2006)霍尔和侯赛尼·纳萨布(2006)。

1.2. 关于如何选择组件的不同观点

按顺序规定的方式排序(1.4)是一个合理的首选,但由于它完全基于数据,因此存在疑问X(X)特别是,它没有考虑x个在函数中μ(x个). 当然,方法至少应该考虑x个; 例如,它应该x个在对特征向量排序时考虑ϕ^j个用于估算μ(x个). 也可以进行估算μ(x个)通过使用不同于ϕ^1,ϕ^2,对两者都很适应x个以及X(X)第条。

当然,前一段中提出的问题有历史记录。考克斯(1968),第272页,认为x个应予以考虑,并注意

“[传统方法]的一个困难似乎是,没有逻辑上的理由说明因变量不应与最不重要的主成分紧密联系”。

考克斯接着考虑了另一种方法,即“简单的组合,而不是主成分,可以用作回归变量”。莫斯特勒和塔基(1977)第397页,认为这种方法可能不必要地悲观,因为它采取了一种不合理的观点,即自然纵容使主要成分相反:

“一个知道我们的x个和我们为他们制定的计划让我们的选择看起来很可怕。但我们不相信大自然是这样运作的——正如爱因斯坦(用德语)所说,大自然几乎是“摇摇欲坠,但并非彻头彻尾的卑鄙”因此,我们提供了一种经常有帮助的技术……”

Mosteller和Tukey继续讨论了主成分方法,并认可了由序列决定的成分排名(1.4)在某种程度上,“将大组件与小组件分离可能是有效的”。然而,他们也默认了考克斯的(1968)替代方法(不提及论文),除其他外,建议统计学家可以

“选择几个最大主成分的新线性组合,使其更容易理解”。

肯德尔的(1957)相对简单的方法今天仍然很流行。例如,请参阅前面引用的关于功能数据分析中主成分方法的参考。这种方法长期以来一直有支持者,包括斯普雷尔(1963)和曲棍球(1976). 库克对其中一些问题和其他问题进行了更详细的讨论(2007)讨论者Christensen(2007),李(2007)还有李和纳赫茨海姆(2007)库克的(2007)。

1.3。量化

上述问题仍然存在争议,尤其是在很大程度上没有理论量化。第2节在本文中,我们讨论了这一问题,表明了基于标准特征值的组件排序,at表达式(1.4),在极大极小意义上是最优的。特别是,如果我们拥有的关于模型的唯一信息是斜率的范数,β,不超过某个值,并且如果我们的预测是基于正交序列ϕ^1,ϕ^2,然后,在每一步中,根据我们关于β,通过使用排序ϕ^j个s根据顺序(1.4)参见中的定理1第2.2条。

重要的是,这不是一个渐近结果;它支持的每个值n个以及每套X(X)1,…,X(X)n个解释变量。结果与考克斯提出的问题并不矛盾(1968),但这确实使他的言论具有正确的观点。它表明,在预测相当困难的情况下,特别是在平均预测误差尽可能大或近似大的情况下(鉴于我们对β),考克斯评论中提出的问题并不重要。然而,如果我们有其他信息,我们可能会做出改进。下面将给出一个示例第2.2节,在功能数据分析的背景下。

我们还研究了基于二者选择一个完全通用的正交序列的问题x个以及解释变量,并表明在这种情况下的解决方案再次简化为传统方法。特别是,虽然可以选择一般正交序列中的分量来消除偏置展开中的几乎任意项,但该操作实际上相当于选择常规序列的相应分量ϕ^1,ϕ^2,事实上,用这个序列表示的单项展开可以与多项展开一样执行;参见中的定理2第2.3条。这些结果也是非渐近的;它们适用于每个样本大小和每个序列X(X)j个第条。

尤其受到定理1和2的启发,它们指出了选择组件的特定方法的优点,第3节开发了用于选择频率截止值的交叉验证方法的特性。在这里,我们给出了平均和平方误差的简单公式,并表明,在广泛的设置中,交叉验证从经验上优化了这一性能度量。这些结果非常普遍,例如在功能数据分析的情况下。我们还报告了数值研究的结果。

估计器的极大极小最优性问题出现在各种统计推断问题中,包括回归以及频率和贝叶斯设置。看,例如,詹姆斯和斯坦(1961),博克(1975),伯杰(1976),丸山(1998)Ben-Haim和Eldar(2007). 然而,这些贡献的背景与本文件不同。我们不需要对误差的分布进行任何假设,除了它具有有限方差和零均值。我们的minimax结果是由这样一个事实驱动的:由于问题的有效无穷维性质,所有偏差都可能来自于进行估计的有限维空间之外的量。相比之下,在传统的极小极大结果中,正态分布误差的假设至关重要,它决定了偏差的水平,并且参数空间是低维的。

本文中分析的数据和用于分析的程序可以从

http://www.blackwellpublishing.com/rss

2.方法

2.1、。前期工作

假设数据(X(X)1,Y(Y)1),…,(X(X)n个,Y(Y)n个),独立且同分布为(X(X),Y(Y)),由模型at表达式生成(1.1).协方差K(K)属于X(X)估计依据为

K(K)^(,t吨)=1n个=1n个X(X)()X(X)¯()X(X)(t吨)X(X)¯(t吨),

哪里X(X)¯=n个1ΣX(X).现在,K(K)采用传统的频谱分解:

K(K)(,t吨)=j个=1θj个ϕj个()ϕj个(t吨),
(2.1)

其中φj个s构成一个完整的正交基。(可以理解,公式中的无穷级数如下方程式(2.1),(2.2)(4.3)如果数据是有限的X(X)是向量,而不是函数。)特别是,〈φj个,φk个〉 =δjk公司Kronecker三角洲和φj个s是特征向量,具有各自的特征值θj个,关于带核的线性变换K(K).数量φj个在太空中F类,于年引入第1节如果问题是向量回归问题,那么常规向量也是,如果问题是函数线性回归问题,则常规向量也是函数。我们使用符号K(K)为了表示变换和协方差函数,特别是在函数数据设置中,我们定义了函数K(K)ψ通过

(K(K)ψ)()=R(右)K(K)(,t吨)ψ(t吨)日期,

用哪个符号K(K)φj个=θj个φj个.

特征向量ϕ^j个、和特征值θ^j个,隐式定义为方程式(2.1)对于K(K)^:

K(K)^(,t吨)=j个=1θ^j个ϕ^j个()ϕ^j个(t吨),
(2.2)

其中项是有序的,使得特征值估计器θ^j个形成递减序列;参见序列(1.4).的积极确定性K(K)^意味着每个特征值估计量都是非负的,尽管只有第一个n个都是绝对肯定的。因此,本征函数θ^j个对于j个n个+1可以任意定义,受以下约束:ϕ^1,ϕ^2,是一个非正规序列。

接下来,我们定义了μ(x个),后者的定义为方程式(1.2).让ψ1,ψ2,…表示的正交基F类和,给定χF类,放置χ(j个)=〈χ,ψj个〉. 的最小二乘估计β= Σj个 β(j个)ψj个,基于有限傅里叶近似∑j个第页 b条j个ψj个,通过选择获得b条1,…,b条第页最小化序列

=1n个Y(Y)Y(Y)¯j个=1第页b条j个X(X)X(X)¯(j个)2.

特别是最小二乘法选择b条^1,,b条^第页第页,共页b条1,,b条第页属于b条1,…,b条第页取决于

j个=1第页b条^j个σ^j个k个=c(c)^k个,1k个第页,
(2.3)

哪里

σ^j个k个=1n个=1n个X(X)X(X)¯(j个)X(X)X(X)¯(k个),c(c)^k个=1n个=1n个Y(Y)Y(Y)¯X(X)X(X)¯(k个).
(2.4)

结果估计值μ(x个)是

μ^(x个)=Y(Y)¯+β^,x个X(X)¯=Y(Y)¯+j个=1第页b条^j个(x个X(X)¯)(j个),
(2.5)

哪里β^=Σj个第页b条^j个ψj个,所以β^j个=b条^j个用于1⩽j个第页β^j个=0对于j个第页+1.

2.2. 基于序列重新排序的估计ϕ^1,ϕ^2,

X(X)=X(X)1,,X(X)n个表示解释变量集,设1⩽第页n个并采取ψ1,…,ψ第页成为以下内容的子序列ϕ^1,,ϕ^n个.(数量ψ第页+1,ψ第页+2,…可以任意定义ψ1,ψ2,…形成一个完整的正交基。)特别地,ψj个=ϕ^第页j个比如说,1⩽j个第页,其中第页1,…,第页第页是集合{1,…,的不同成员,…,n个}. 通过定义(条件)均方误差

MSE公司=E类{μ^(x个)μ(x个)}2X(X).
(2.6)

我们将很快导出以下极大极小性质。

定理1。如果我们只有关于β这是标准吗β‖=〈β,β1/2,等于给定常数C类(或者,也可以是‖β‖⩽C类),然后选择第页1,…,第页第页为每个值生成C类第页,当该量取最大值(MSE)时的最小均方误差最大(例如)斜坡等级允许β令人满意‖β‖ =C类(或分别‖β‖⩽C类),是第页j个=j个对于每个j个。这与排序特征向量的选择相同ϕ^j个通过坚持降低特征值的等级,如at表达式(1.4).

如果我们有关于β在定理1允许的基础上,我们可以通过重新排序基来减少均方误差。例如,假设问题是函数数据的线性回归R(右),在内部产品中方程式(1.3),是间隔=[1,1]我们都知道β是上的偶数函数。然后我们可以忽略任何基函数ϕ^j个这是奇数函数,因为它们对准确预测的贡献为零。等效地,当我们对函数进行排序时ϕ^j个,我们应该排在最后ϕ^j个s是奇数函数。

当然,在实践中我们不会知道β是完全均匀的,而且没有ϕ^j个s将非常奇怪。然而,上述理想化示例所提供的见解在实践中可能会有所帮助。例如,假设x个(t吨)等于车队在一周内行驶的英里数t吨年度最佳,以及Y(Y)是车队在一年中使用的燃油总量。我们期望β受到季节效应的显著影响,例如由于公路条件对燃油消耗的影响,我们预计这些影响将在年中左右左右对称分布。因此,如果对1年的周期进行重新定心和重新标度,使其从-1开始,到1结束,那么β很可能接近上的偶数函数。在这种情况下,预测可能会从订购组件中受益ϕ^1,ϕ^2,因此,那些接近奇数函数的函数索引相对较晚。

2.3. 基于替代基础的估算

at类型的一般预测值的条件偏差方程式(2.5)基于一般正交级数ψ1,ψ2,…,可以表示为数量的系列β,ϕ^j个(例如,请参见,方程式(4.6)(见下文)这个属性也适用于基于简单的单项展开式的预测b条1ψ1哪里b条1是标量,并且ψ1是单位长度的向量(或函数数据情况下的函数),是估计器构造模式的结果。在一个术语的情况下,

μ^(x个)=Y(Y)¯+b条^1(x个X(X)¯)(1),
(2.7)

哪里b条^1μ^(x个)通过以下方式构建第页表达式中=1(2.3)(2.5)分别是。

人们可能会认为,通过明智地选择ψ1,更一般地是通过仔细选择向量或函数ψj个在基于多项展开的估计量的情况下,相对于第2.2节,不需要有关的信息β然而,情况并非如此,如下结果所示。

定理2。如果我们构造一个多项估计器β^=Σj个第页b条^j个ψj个,其中ψ1,ψ2,…由以下条件决定β,ϕ^j个从偏差中消除j个=第页1,…,第页第页比如,在哪里第页1<…<第页第页n个,则基于向量或函数得到的估计量与传统正交序列估计量相同ϕ^j个对于j个=第页1,…,第页第页并在中引入第2.2条。即使只包含一个项,也可能实现这一目的,即对于方程式(2.7).限制第页j个n个对于每个j个在这里被强制执行而没有失去普遍性,因为,如果β未知,除非x个X(X)¯,ϕ^j个=0,,无法选择ψ1,ψ2,…,只使用中的信息X(X)x个,以消除β,ϕ^j个偏差扩展,当j个n个+1.

3.频率截止的交叉验证选择

3.1. 模型和方法

生成数据集的过程的模型Z轴=X(X)1,Y(Y)1,,X(X)n个,Y(Y)n个那是在表达(1.1),内积由方程式(1.3)。我们采用中的一般解释第1节,其中变量X(X)可以是向量或函数。如果正交序列ϕ^j个、和特征值θ^j个,截至方程式(2.2)然后我们可以写出平均值μ(x个),于方程式(1.2),作为

μ(x个)=α+j个=1β[j个]x个[j个]=Y(Y)¯+j个=1β[j个](x个X(X)¯)[j个]ε¯,

其中,对于z(z)=x个,x个X(X)¯β,我们定义z(z)[j个]=R(右)z(z)ϕ^j个.我们的估价师μ^(x个)=μ^(x个第页)由提供方程式(2.5)在每个ψj个=ϕ^j个:

μ^(x个)=Y(Y)¯+j个=1第页b条^j个(x个X(X)¯)[j个]=Y(Y)¯+j个=1第页θ^j个1c(c)^j个(x个X(X)¯)[j个],
(3.1)

我们使用过的方程式(4.1)并根据表达式定义(2.4)在这种情况下ψj个=ϕ^j个,

c(c)^j个=1n个=1n个Y(Y)Y(Y)¯X(X)X(X)¯[j个].
(3.2)

可以开发各种交叉验证算法来进行选择第页在定义中方程式(3.1)一种是完全脱离的方法,包括计算版本μ^属于μ^从样品中Z轴\X(X),Y(Y)大小为n个−1,然后计算预测交叉验证标准,

个人简历(第页)=1n个=1n个Y(Y)μ^X(X)第页2.
(3.3)

在这个场合,我们的经验选择第页是CV的最小值(第页)可以解释为近似值,最多不依赖于第页,到的值第页其使条件均和平方误差最小化,

MSSE公司(第页)=1n个=1n个E类μX(X)μ^X(X)第页2X(X).
(3.4)

另一种计算更简单的方法是只使用leave-on-out方法进行计算c(c)^j个方程式(3.2)Y(Y)¯在里面方程式(3.1),但要离开ϕ^j个θ^j个保持不变。特别是,如果Y(Y)¯=n个1Σk个:k个Y(Y)k个是的离开版本Y(Y)¯但有除数n个,而不是n个−1,如果我们定义

c(c)^j个,=1n个k个:k个Y(Y)k个Y(Y)¯X(X)k个X(X)¯[j个]
(3.5)

和重新定义

μ^(x个)=Y(Y)¯+j个=1第页θ^j个1c(c)^j个,(x个X(X)¯)[j个],
(3.6)

然后我们可以继续第页成为CV的最小值(第页),于方程式(3.3),并将其解释为最小化MSSE的经验尝试(第页),于方程式(3.4)这种构造节省了大量计算费用,因为不再需要重新计算序列的新版本θ^j个ϕ^j个对于每个省略的对(X(X),Y(Y)). 特别是θ^j个在里面方程式(3.6)、和,共ϕ^j个在公式中X(X)k个X(X)¯[j个]=X(X)k个X(X)¯,ϕ^j个,不依赖.

这种替代方法有几个变体,包括那些在leave-on-out估计中除数(例如。Y(Y)¯c(c)^j个,)被认为是n个−1而不是n个,以及其中X(X)¯被替换为X(X)¯在里面方程式(3.5)(3.6)都给出了相似的数值结果,并且具有相同的一阶理论性质。

3.2. 理论性质

首先,我们给出了条件平均和平方误差的一个基本公式,MSSE(第页),定义于方程式(3.4)。我们讨论了第1节,其中解释变量X(X)是向量或函数值。

定义

Δ(x个)=E类{μ^(x个)X(X)}μ(x个),
(3.7)

表示的条件偏差u个^(x个)回忆一下‖x个2=〈x个,x个〉,并且数据对(X(X)1,Y(Y)1)(X(X)n个,Y(Y)n个)由模型在表达式中生成(1.1),其中错误ɛ具有零均值和有限方差σ2.

定理3。假设‖β‖<∞,对于产生手边样本的实现,K(K)^一致有界且非退化,‖X(X)‖<∞用于1⩽n个θ^j个>0用于1⩽j个第页.然后,

MSSE公司(第页)=1n个=1n个ΔX(X)2+(第页+1)σ2n个.
(3.8)

右侧的第一项方程式(3.8)等于平均和平方偏差,第二个等于MSSE的方差贡献(第页)。

接下来,我们给出一个结果,描述CV的精确度(第页),于方程式(3.3),近似于MSSE(第页),不依赖于第页因此,对最小化CV的过程并不重要(第页). 我们解释简历(第页)在leave-on-out算法的经济版本意义上μ^定义于方程(3.6)。我们再次假设数据是由模型生成的(1.1),我们附加了一个条件,对于一个足够大的常数C类>0中,

E类|ε|C类<E类X(X)C类<.
(3.9)

定理4。让0<η<1,并假设‖β‖<∞. 如果条件(3.9)等待C类=C类(η)足够大,概率为1,

个人简历(第页)=MSSE公司(第页)+条款不取决于第页+o(o){磁共振波谱(第页)},
(3.10)

在中一致第页使得

n个2η常数×第页j个=1第页θ^j个1常数×n个1η,
(3.11)

其中常数固定但任意大。

结果(3.10)确立了选择第页最小化CV(第页)产生平均和平方误差的渐近最小化,前提是我们选择第页根据一组假设值(3.11)保持,MSSE(第页)在值之间渐近最小化第页在那组中。假设的第一部分(3.11)透明温和;它只要求我们选择第页至少是多项式大的函数n个.表明假设的第二部分(3.11)也是合理的,它在实践中是令人满意的,并且理论上是最优的第页通常满足该条件,我们将使用条件的版本θ^j个被替换为θj个:

j个=1第页θj个1常数×n个1η.
(3.12)

使用霍尔和侯赛尼·纳萨布的结果可以证明这种变化是合理的(2006)关于一致收敛性θ^j个s到θj个第条。

在下一段中,我们证明了假设的合理性(3.12)如果傅里叶系数β[j个]θj个多项式快速降为零j个增加。在这种情况下第页作为函数的多项式快速增加n个.

使用Hall和Hosseini-Nasab的论点(2009),MSSE的平方偏差分量(第页),由右侧的第一个术语表示方程(3.8),可以证明满足

1n个=1n个ΔX(X)2~j个=第页+1β[j个]2θj个,

哪一个,如果β[j个]θj个二者均以多项式速率递减,依次渐近于常数倍(β[第页])2θ第页:

1n个=1n个ΔX(X)2~常数×β[第页]2θ第页.
(3.13)

透明地,右边的第二个术语方程式(3.8)渐近于常数倍n个−1第页作为n个第页发散。因此,如果第页选择MSSE最小化(第页)然后

β[第页]2θ第页~常数×n个1第页.
(3.14)

此外,由于θj个作为函数快速多项式减少j个然后是不等式的左边(3.12)渐近于常数倍第页θ第页1,因此,考虑到近似值(3.14),为的常数倍数n个(β[第页])2然而,由于第页在中快速增加多项式n个那么(β[第页])2~常数×n个η1对一些人来说η1>0等等第页θ第页1~常数×n个η1因此,不平等的第二部分(3.12)保持,如果ηη1.

3.3. 数值特性

我们在表达式中模拟了模型中的数据(1.1),使用α=0和积分给出的内积方程式(1.3)具有R(右)=[0,1].我们采取了β= Σj个0 βj个χj个,其中χ0,χ1,…是上的正余弦级数R(右)(尤其是,χj个(t吨)=21/2科斯(j个πt吨)的j个⩾1),以及βj个s是常数。为了使问题更具挑战性,我们解决了β0在每种情况下均为0,同样,我们省略了Karhunen–Loève展开式中的常数项X(X),我们定义为X(X)=Σj个1θj个1/2Z轴j个χj个哪里θj个1/2=10/(j个+5)Z轴j个s是具有零均值和单位方差的独立同分布随机变量。

我们采取了βj个将重新排列序列j个−2对于j个⩾1,如下所示。模型1表示以下情况βj个=j个−2对于每个j个⩾1.获取模型j个,用于j个=2,3,4,我们颠倒了第一个j个条款。这增加了预测者面临的挑战μ^但对我们将在表达式中引入的两个相互竞争的预测因子几乎没有影响(3.15)如下所示。我们采取了Z轴j个s为正常值N个(0,1)或具有中心标准指数分布。

除频率截止预测器外μ^方程式(2.5)我们考虑了另外两种可能性:一种是“加权”预测器,我们保留了所有分量,但降低了与相对较小的特征值估计相对应的分量的权重;另一种是“排序”形式,我们对分量进行排序,以反映其与Y(Y)具体来说,作为μ^(x个)方程式(2.5)我们用过

μ^重量(x个)=Y(Y)¯+j个=1b条^j个θ^j个第页(x个X(X)¯)(j个),μ^等级(x个)=Y(Y)¯+j个=1第页b条^k个^j个(x个X(X)¯)k个^j个.
(3.15)

要计算μ^等级(x个)我们计算了每个j个,一组对R(右)X(X)(t吨)ϕ^j个(t吨)d日t吨,Y(Y)对于1⩽n个; 然后我们导出了相关系数ρ^j个对于这些n个对;然后我们采取了k个^1,,k个^n个是1,…,的排列,…,n个这确保了ρ^k个^1ρ^k个^n个。的相应值β^对于表达式中的两个预测因子(3.15)β^=Σj个1κ1b条^j个θ^j个第页ϕ^j个β^=Σ1j个第页b条^k个^j个ϕ^k个^j个; 相应的调谐参数为第页一般正数,以及第页,一般正整数;并且,在下面报告的结果中,通过交叉验证选择了所有平滑参数。

表12给出三个预测因子的均方预测误差MSPE的蒙特卡罗近似,以及(括号中)近似的标准误差。表12分别处理正态分布和指数分布主成分的情况。每个主块的第一、第二和第三列中的结果表12是用于μ^,定义于方程式(2.5),以及μ^重量μ^等级at表达式(3.15)分别是。以下属性可以从表12以及其他数值结果,为了简单起见,我们不在这里列出。

表1

在主成分呈正态分布的情况下,使用平滑参数的交叉验证选择对MSPE进行蒙特卡罗近似

模型n的结果=25n的结果=50
μ^μ^重量μ^等级μ^μ^重量μ^等级
11.206 (0.094)24.588 (1.830)3.379 (0.251)0.715 (0.056)19.963 (1.320)3.595 (0.233)
21.624 (0.165)16.875 (1.242)3.154 (0.255)1.139 (0.112)15.853 (1.053)4.008 (0.305)
1.855 (0.154)14.254 (1.072)3.193 (0.200)1.250 (0.136)13.241 (0.881)3.885 (0.273)
42.088 (0.152)14.136 (1.213)2.808(0.178)1.509 (0.128)11.732 (0.813)4.060 (0.273)
n的结果=100n的结果=200
10.389 (0.040)15.771 (1.030)5.718 (0.366)0.203 (0.022)14.242 (0.917)9.320 (0.576)
20.369 (0.030)15.230(0.980)6.342(0.421)0.183 (0.022)12.468 (0.758)9.408 (0.596)
0.533 (0.055)12.495 (0.776)6.683 (0.440)0.229 (0.023)11.563 (0.763)8.832 (0.582)
40.753 (0.079)12.315 (0.782)5.410 (0.337)0.266 (0.026)11.926 (0.751)9.795 (0.618)
n的结果=400n的结果=800
10.085 (0.007)4.860 (0.326)2.623 (0.172)0.045 (0.003)1.685 (0.117)0.880 (0.055)
20.109(0.010)4.434 (0.285)3.061 (0.218)0.053 (0.005)1.476 (0.091)0.835 (0.049)
0.099 (0.007)4.208 (0.281)2.901 (0.195)0.050 (0.004)1.450 (0.099)0.841 (0.054)
40.112 (0.008)4.076(0.241)2.952(0.192)0.051 (0.004)1.491 (0.094)0.915 (0.062)
模型n的结果=25n的结果=50
μ^μ^重量μ^等级μ^μ^重量μ^等级
11.206 (0.094)24.588 (1.830)3.379 (0.251)0.715 (0.056)19.963 (1.320)3.595 (0.233)
21.624 (0.165)16.875 (1.242)3.154(0.255)1.139 (0.112)15.853 (1.053)4.008 (0.305)
1.855 (0.154)14.254 (1.072)3.193 (0.200)1.250 (0.136)13.241 (0.881)3.885 (0.273)
42.088 (0.152)14.136 (1.213)2.808 (0.178)1.509(0.128)11.732(0.813)4.060 (0.273)
n的结果=100n的结果=200
10.389 (0.040)15.771 (1.030)5.718 (0.366)0.203 (0.022)14.242 (0.917)9.320 (0.576)
20.369 (0.030)15.230 (0.980)6.342 (0.421)0.183 (0.022)12.468 (0.758)9.408 (0.596)
0.533 (0.055)12.495 (0.776)6.683 (0.440)0.229 (0.023)11.563 (0.763)8.832 (0.582)
40.753 (0.079)12.315 (0.782)5.410(0.337)0.266 (0.026)11.926 (0.751)9.795 (0.618)
n的结果=400n的结果=800
10.085 (0.007)4.860 (0.326)2.623 (0.172)0.045 (0.003)1.685 (0.117)0.880 (0.055)
20.109 (0.010)4.434(0.285)3.061(0.218)0.053 (0.005)1.476 (0.091)0.835 (0.049)
0.099 (0.007)4.208 (0.281)2.901 (0.195)0.050 (0.004)1.450 (0.099)0.841 (0.054)
40.112 (0.008)4.076 (0.241)2.952 (0.192)0.051 (0.004)1.491 (0.094)0.915 (0.062)

表中六个主要模块中每一个模块的三列给出了这种情况下的MSPE近似值μ^定义于方程式(2.5)和预测因素μ^重量μ^等级方程式(3.15)括号中的数字表示蒙特卡洛近似的标准误差。

表1

在主成分呈正态分布的情况下,使用平滑参数的交叉验证选择对MSPE进行蒙特卡罗近似

模型n的结果=25n的结果=50
μ^μ^重量μ^等级μ^μ^重量μ^等级
12006年1月20日(0.094)24.588 (1.830)3.379 (0.251)0.715 (0.056)19.963 (1.320)3.595 (0.233)
21.624 (0.165)16.875 (1.242)3.154 (0.255)1.139 (0.112)15.853 (1.053)4.008 (0.305)
1.855 (0.154)14.254 (1.072)3.193 (0.200)1.250 (0.136)13.241 (0.881)3.885 (0.273)
42.088 (0.152)14.136 (1.213)2.808 (0.178)1.509 (0.128)11.732 (0.813)4.060 (0.273)
n的结果=100n的结果=200
10.389 (0.040)15.771 (1.030)5.718 (0.366)0.203 (0.022)14.242 (0.917)9.320 (0.576)
20.369 (0.030)15.230 (0.980)6.342 (0.421)0.183 (0.022)12.468 (0.758)9.408(0.596)
0.533(0.055)12.495 (0.776)6.683 (0.440)0.229 (0.023)11.563 (0.763)8.832 (0.582)
40.753 (0.079)12.315 (0.782)5.410 (0.337)0.266 (0.026)11.926 (0.751)9.795 (0.618)
n的结果=400n的结果=800
10.085 (0.007)4.860 (0.326)2.623 (0.172)0.045 (0.003)1.685 (0.117)0.880 (0.055)
20.109 (0.010)4.434 (0.285)3.061 (0.218)0.053 (0.005)1.476(0.091)0.835 (0.049)
0.099 (0.007)4.208 (0.281)2.901 (0.195)0.050 (0.004)1.450 (0.099)0.841 (0.054)
40.112 (0.008)4.076 (0.241)2.952 (0.192)0.051 (0.004)1.491 (0.094)0.915(0.062)
模型n的结果=25n的结果=50
μ^μ^重量μ^等级μ^μ^重量μ^等级
11.206 (0.094)24.588 (1.830)3.379 (0.251)0.715 (0.056)19.963 (1.320)3.595 (0.233)
21.624 (0.165)16.875 (1.242)3.154 (0.255)1.139 (0.112)15.853 (1.053)4.008 (0.305)
1.855(0.154)14.254 (1.072)3.193 (0.200)1.250 (0.136)13.241 (0.881)3.885 (0.273)
42.088 (0.152)14.136 (1.213)2.808 (0.178)1.509 (0.128)11.732 (0.813)4.060 (0.273)
n的结果=100n的结果=200
10.389(0.040)15.771 (1.030)5.718 (0.366)0.203 (0.022)14.242 (0.917)9.320 (0.576)
20.369 (0.030)15.230 (0.980)6.342 (0.421)0.183 (0.022)12.468 (0.758)9.408 (0.596)
0.533 (0.055)12.495 (0.776)6.683 (0.440)0.229 (0.023)11.563 (0.763)8.832 (0.582)
40.753 (0.079)12.315 (0.782)5.410 (0.337)0.266 (0.026)11.926 (0.751)9.795 (0.618)
n的结果=400n的结果=800
10.085 (0.007)4.860 (0.326)2.623 (0.172)0.045 (0.003)1.685 (0.117)0.880 (0.055)
20.109 (0.010)4.434 (0.285)3.061 (0.218)0.053 (0.005)1.476 (0.091)0.835(0.049)
0.099(0.007)4.208 (0.281)2.901 (0.195)0.050 (0.004)1.450 (0.099)0.841 (0.054)
40.112 (0.008)4.076 (0.241)2.952 (0.192)0.051 (0.004)1.491 (0.094)0.915 (0.062)

表中六个主要模块中每一个模块的三列给出了这种情况下的MSPE近似值μ^定义于方程式(2.5)和预测因素μ^重量μ^等级方程式(3.15)括号中的数字表示蒙特卡洛近似值的标准误差。

表2

在指数分布主成分的情况下,使用平滑参数的交叉验证选择对MSPE进行蒙特卡罗近似

模型n的结果=25n的结果=50
μ^μ^重量μ^等级μ^μ^重量μ^等级
11.327 (0.123)23.013 (2.024)2.852 (0.223)0.800 (0.097)19.608 (1.251)4.157 (0.267)
21.655(0.171)19.863(1.669)2.859 (0.212)0.984 (0.107)18.253 (1.367)3.758 (0.246)
2.005 (0.165)16.315 (1.442)3.763 (0.389)1.606 (0.167)14.988 (1.164)4.114 (0.278)
42.223 (0.182)17.537 (1.516)3.759 (0.525)1.890 (0.176)11.542 (0.827)3.933 (0.315)
n的结果=100n的结果=200
10.381 (0.038)14.654 (1.087)6.261 (0.470)0.184 (0.021)12.856 (0.848)8.463(0.531)
20.470 (0.058)15.135 (1.286)6.003 (0.450)0.184 (0.016)13.115 (0.964)9.065 (0.687)
0.515 (0.052)13.790 (0.945)6.037 (0.385)0.208 (0.020)13.205 (0.819)9.175 (0.584)
41.078(0.158)12.577(1.167)6.727 (0.409)0.295 (0.040)11.773 (0.802)7.529 (0.483)
n的结果=400n的结果=800
10.077 (0.008)4.995 (0.352)2.991 (0.174)0.043 (0.004)1.608 (0.101)0.933 (0.074)
20.090 (0.008)4.662 (0.311)2.655 (0.175)0.046 (0.004)1.608 (0.104)0.933 (0.060)
0.102 (0.009)3.986 (0.291)3.049 (0.188)0.052 (0.005)1.492 (0.100)0.901(0.054)
40.103 (0.008)4.197 (0.267)3.257 (0.207)0.056 (0.006)1.498 (0.095)0.854 (0.056)
模型n的结果=25n的结果=50
μ^μ^重量μ^等级μ^μ^重量μ^等级
11.327 (0.123)23.013 (2.024)2.852 (0.223)0.800 (0.097)19.608 (1.251)4.157 (0.267)
21.655 (0.171)19.863 (1.669)2.859 (0.212)0.984 (0.107)18.253 (1.367)3.758 (0.246)
2.005 (0.165)16.315 (1.442)3.763 (0.389)1.606 (0.167)14.988 (1.164)4.114 (0.278)
42.223 (0.182)17.537 (1.516)3.759 (0.525)1.890 (0.176)11.542(0.827)3.933 (0.315)
n的结果=100n的结果=200
10.381 (0.038)14.654 (1.087)6.261 (0.470)0.184 (0.021)12.856 (0.848)8.463 (0.531)
20.470 (0.058)15.135 (1.286)6.003 (0.450)0.184(0.016)2015年13月13日(0.964)9.065 (0.687)
0.515 (0.052)13.790 (0.945)6.037 (0.385)0.208 (0.020)13.205 (0.819)9.175 (0.584)
41.078 (0.158)12.577 (1.167)6.727 (0.409)0.295 (0.040)11.773 (0.802)7.529 (0.483)
n的结果=400n的结果=800
10.077 (0.008)4.995 (0.352)2.991 (0.174)0.043 (0.004)1.608 (0.101)0.933 (0.074)
20.090 (0.008)4.662 (0.311)2.655(0.175)0.046 (0.004)1.608 (0.104)0.933 (0.060)
0.102 (0.009)3.986 (0.291)3.049 (0.188)0.052 (0.005)1.492 (0.100)0.901 (0.054)
40.103 (0.008)4.197 (0.267)3.257 (0.207)0.056(0.006)1.498(0.095)0.854 (0.056)

在其他方面,表条目与表1的情况相同。

表2

在指数分布主成分的情况下,使用平滑参数的交叉验证选择对MSPE进行蒙特卡罗近似

模型n的结果=25n的结果=50
μ^μ^重量μ^等级μ^μ^重量μ^等级
11.327 (0.123)23.013 (2.024)2.852 (0.223)0.800 (0.097)19.608 (1.251)4.157 (0.267)
21.655 (0.171)19.863 (1.669)2.859 (0.212)0.984 (0.107)18.253 (1.367)3.758(0.246)
2.005 (0.165)16.315 (1.442)3.763 (0.389)1.606 (0.167)14.988 (1.164)4.114 (0.278)
42.223 (0.182)17.537 (1.516)3.759 (0.525)1.890 (0.176)11.542 (0.827)3.933 (0.315)
n的结果=100n的结果=200
10.381 (0.038)14.654 (1.087)6.261 (0.470)0.184 (0.021)12.856 (0.848)8.463 (0.531)
20.470 (0.058)15.135 (1.286)6.003 (0.450)0.184 (0.016)13.115 (0.964)9.065 (0.687)
0.515 (0.052)13.790 (0.945)6.037 (0.385)0.208 (0.020)13.205 (0.819)9.175 (0.584)
41.078 (0.158)12.577 (1.167)6.727 (0.409)0.295 (0.040)11.773 (0.802)7.529(0.483)
n的结果=400n的结果=800
10.077 (0.008)4.995 (0.352)2.991 (0.174)0.043 (0.004)1.608 (0.101)0.933 (0.074)
20.090 (0.008)4.662 (0.311)2.655 (0.175)0.046 (0.004)1.608(0.104)0.933(0.060)
0.102 (0.009)3.986 (0.291)3.049 (0.188)0.052 (0.005)1.492 (0.100)0.901 (0.054)
40.103 (0.008)4.197 (0.267)3.257 (0.207)0.056 (0.006)1.498 (0.095)0.854 (0.056)
模型n的结果=25n的结果=50
μ^μ^重量μ^等级μ^μ^重量μ^等级
11.327 (0.123)23.013 (2.024)2.852(0.223)0.800 (0.097)19.608 (1.251)4.157 (0.267)
21.655 (0.171)19.863 (1.669)2.859 (0.212)0.984 (0.107)18.253 (1.367)3.758 (0.246)
2.005 (0.165)16.315 (1.442)3.763 (0.389)1.606(0.167)14.988(1.164)4.114 (0.278)
42.223 (0.182)17.537 (1.516)3.759 (0.525)1.890 (0.176)11.542 (0.827)3.933 (0.315)
n的结果=100n的结果=200
10.381 (0.038)14.654 (1.087)6.261 (0.470)0.184 (0.021)12.856 (0.848)8.463 (0.531)
20.470 (0.058)15.135 (1.286)6.003 (0.450)0.184 (0.016)13.115 (0.964)9.065 (0.687)
0.515 (0.052)13.790 (0.945)6.037(0.385)0.208 (0.020)13.205 (0.819)9.175 (0.584)
41.078 (0.158)12.577 (1.167)6.727 (0.409)0.295 (0.040)11.773 (0.802)7.529 (0.483)
n的结果=400n的结果=800
10.077 (0.008)4.995(0.352)2.991(0.174)0.043 (0.004)1.608 (0.101)0.933 (0.074)
20.090 (0.008)4.662 (0.311)2.655 (0.175)0.046 (0.004)1.608 (0.104)0.933 (0.060)
0.102 (0.009)3.986 (0.291)3.049 (0.188)0.052 (0.005)1.492 (0.100)0.901 (0.054)
40.103 (0.008)4.197 (0.267)3.257 (0.207)0.056 (0.006)1.498 (0.095)0.854 (0.056)

在其他方面,表条目与表1的情况相同。

  • (a)

    预测器μ^通常表现比这两者都好μ^重量μ^等级,至少对于这里讨论的模型,以及当使用交叉验证来选择平滑参数时。

  • (b)

    的性能μ^,在每个主块的第一列中给出,通常减小为β将更大的权重放在相对高频的主成分上,即作为模型指数j个增加。然而,这两种情况的趋势都不太明显μ^重量μ^等级显然反映了这样一个事实,即这些预测因子的构造往往会使频率正常化。

  • (c)

    在以下情况下μ^交叉验证选择第页,第页^比方说,当n个⩾50,因为它接近理论上的最佳值第页例如,更改第页第页^第页^+[第页^/2]始终(在表12,但仅限于n个⩾50)导致MSPE略有增加,并将其改为第页^[第页^/2]MSPE始终会有更显著的增长。

  • (d)

    在以下情况下μ^重量,增加平滑参数第页从其交叉验证估计第页^2第页^显著增加MSPE,并减少第页^第页^/2MSPE略有降低。

  • (e)

    在以下情况下μ^等级,减少了第页第页^第页^[第页^/2]通常会略微降低MSPE,而增加第页第页^+[第页^/2]通常会略微增加MSPE。

    (属性(c)–(e)意味着当我们使用μ^重量μ^等级,并在使用时很好地选择平滑参数μ^.)

  • (f)

    当使用以下最佳选项计算预测值时第页,μ^通常表现优于两者μ^重量μ^等级.

  • (g)

    对数值结果的检查表明μ^重量μ^等级是包含特征值估值器引入的附加噪声的结果θ^j个和相关估计ρ^j个,在构建预测因子时。这种困难在以下情况下尤为明显μ^等级什么时候n个⩽200.

  • (h)

    在高斯和非高斯情况下的结果之间几乎没有差异。

当样本量很小时,交叉验证曲线可能是有噪声的和非凸的,并且可能存在几个局部极小值。我们用来定义的全局最小值第页^第页^,不一定会产生最佳结果,并且以较低的值达到局部最小值第页第页可以产生较低的MSPE。这种困难让人想起在非参数密度估计和回归中使用交叉验证选择带宽时出现的问题,其中可能存在两个或多个局部极小值。在这些设置中,通常首选能够提供局部最小值的最大带宽(参见示例Hall和Marron(1991))。第页倾向于扮演带宽的倒数的角色,然后在函数线性预测问题中,选择第页这可能会使当地达到最低水平。事实上,这一规则往往被证明是适当的。

我们还将这三种方法应用于澳大利亚的降雨量和温度数据,这些数据可在http://www.worldweather.org这些数据是在206个气象站记录的。基于杠杆图的分析表明,格伦·因内斯站的数据对结果的影响极为不成比例,因此我们将该站从研究中删除,从而将样本量减少至205。我们拿走了X(X)(t吨),用于t吨=[0,1]和1⩽⩽205,为当天平均最低温度和平均最高温度的平均值t吨气象站×365,使用周期样条进行平滑后;我们采取了Y(Y)等于站点总降雨量的对数(给定日期的平均最低和平均最高温度是通过气象站运行的所有年份的平均值计算得出的。)然后我们计算得出μ^方程式(2.5)、和μ^重量μ^等级at表达式(3.15)。交叉验证给出了调整参数值第页=11μ^,第页=0.009 93μ^重量第页=7μ^等级.

估价师b条^j个结果非常相似表3.施工时μ^等级前12个特征向量的估计阶数为2,5,3,7,11,9,4,10,8,12,6,1,其中j个在该序列中,表示与j个第二大特征值将出现在那里。特别是,对应于最大特征值的特征向量排名第12位。在以下情况下μ^μ^重量的值b条^j个仅在小数点后第六位有所不同,因此在第表3。的平滑参数值μ^μ^等级表示为表3事实上,因为第页=11(在以下情况下)μ^,对应的行中有一个0j个=12(在以下列中)μ^; 而且,由于在构造时只包括排名前7位的特征向量μ^等级,0s出现在与其他五个值对应的列中,即。j个=1,6,8,10,12μ^等级.

表3

估计值β^j个对于μ^,μ^重量μ^等级

j个μ^μ^重量μ^等级
06.483006.483006.48320
10.000050.000050
20.017130.017130.01713
0.017690.017690.01769
4−0.02022−0.02022−0.02022
5−0.06422−0.06422−0.06422
6−0.00403−0.004030
7−0.10390−0.10390−0.10391
80.014190.014190
90.081520.081520.08152
100.038450.038450
110.147800.147800.14778
120−0.022360
j个μ^μ^重量μ^等级
06.483006.483006.48320
10.000050.000050
20.017130.017130.01713
0.017690.017690.01769
4−0.02022−0.02022−0.02022
5−0.06422−0.06422−0.06422
6−0.00403−0.004030
7−0.10390−0.10390−0.10391
80.014190.014190
90.081520.081520.08152
100.038450.038450
110.147800.147800.14778
120−0.022360

零值反映调谐参数的交叉验证估计;请参阅文本进行讨论。

表3

估计值β^j个对于μ^,μ^重量μ^等级

j个μ^μ^重量μ^等级
06.483006.483006.48320
10.000050.000050
20.017130.017130.01713
0.017690.017690.01769
4−0.02022−0.02022−0.02022
5−0.06422−0.06422−0.06422
6−0.00403−0.004030
7−0.10390−0.10390−0.10391
80.014190.014190
90.081520.081520.08152
100.038450.038450
110.147800.147800.14778
120−0.022360
j个μ^μ^重量μ^等级
06.483006.483006.48320
10.000050.000050
20.017130.017130.01713
0.017690.017690.01769
4−0.02022−0.02022−0.02022
5−0.06422−0.06422−0.06422
6−0.00403−0.004030
7−0.10390−0.10390−0.10391
80.014190.014190
90.081520.081520.08152
100.038450.038450
110.147800.147800.14778
120−0.022360

零值反映调谐参数的交叉验证估计;请参阅正文进行讨论。

在以下情况下μ^μ^等级系数的估计(x个X(X)¯)(j个)与的值相同b条^j个。对于μ^重量,自第页非常接近0,并且θ^j个第页因此s接近1,系数估计值与b条^j个s.因此,由于这些值b条^j个在里面表3非常接近,所以毫不奇怪μ^(x个),μ^重量(x个)μ^等级(x个)对于以下许多值也很接近x个。为了简洁起见,这里不提供图表。

4.技术论证

4.1. 定理1的证明

定理1之前的假设确保了特征值ω^j个θ^第页j个都是绝对肯定的σ^j个k个=ω^j个δj个k个因此,通过表达式(2.3),

b条^j个=ω^j个1c(c)^j个.
(4.1)

还要注意E类c(c)^j个X(X)=Σj个1β(j个)σ^j个k个=ω^j个β(j个),它从哪里通过方程式(2.5)那个

E类{μ^(x个)X(X)}=E类(Y(Y)¯X(X))+j个=1第页β(j个)(x个X(X)¯)(j个).

同样可以看出无功功率,无功功率{μ^(x个)X(X)}=σ2n个1(1+),其中σ2=变量(ɛ)和=Σj个第页ω^j个1(x个X(X)¯)(j个)2,还有那个

μ(x个)=E类(Y(Y)¯X(X))+β,x个X(X)¯=E类(Y(Y)¯X(X))+j个=1β(j个)(x个X(X)¯)(j个).

因此,

MSE公司=σ2n个11+j个=1第页ω^j个1(x个X(X)¯)(j个)2+j个=第页+1β(j个)(x个X(X)¯)(j个)2;
(4.2)

回想一下,MSE的定义是方程式(2.6).

柯西-施瓦兹不等式意味着

j个=第页+1β(j个)(x个X(X)¯)(j个)2j个=第页+1β(j个)2j个=第页+1(x个X(X)¯)(j个)2,
(4.3)

当且仅当,对于每个j个第页+1,β(j个)是的常数倍数(x个X(X)¯)(j个),常数不取决于j个尤其是在表达中保持平等(4.3)如果β=x个X(X)¯因此,由方程式(4.2),均方误差可以假设的最大值为

MSE公司=c(c)n个+j个=1(x个X(X)¯)(j个)2c(c)n个ω^j个1(j个第页)+C类2(j个>第页),
(4.4)

哪里c(c)n个=n个−1σ2。的右侧方程式(4.4)是唯一最小化的C类第页,通过选择特征值的基础ω^j个形成一个非递增序列,或者等价地第页j个=j个对于每个j个这建立了定理1。

值得一提的是,如果频率截止第页=第页(n个)被选择以足够慢的速度发散到∞方程(4.4)收敛为0n个→∞, 即MSE在所有选择中的最高地位β其中‖β‖⩽C类随着样本大小的增加,收敛到0。

4.2。定理2的证明

我们将处理单项展开的情况,因为这有助于确定在这种情况下关于消除偏差的断言的正确性,并且,就定理2所解决的其他问题而言,其他情况几乎相同。对于位于方程式(2.7),

偏差(x个)E类{μ^(x个)X(X)}μ(x个)=K(K)^ψ1,βK(K)^ψ1,ψ1ψ1,x个X(X)¯β,x个X(X)¯
(4.5)
=j个=1ψ1,x个X(X)¯K(K)^ψ1,ψ1θ^j个ψ1[j个](x个X(X)¯)[j个]β[j个],
(4.6)

哪里ψ1[j个]=ψ1,ϕ^j个,(x个X(X)¯)[j个]=x个X(X)¯,ϕ^j个β[j个]=β,ϕ^j个.

θ^j个=0对于j个n个+然后是来自β[n个+1],β[n个+2],…中的系列方程式(4.6)无法通过选择删除ψ1适当地。当且仅当(x个X(X)¯)[j个]等于0。相反,对于1⩽j个n个中的术语β[j个]通过选择ψ1使得

ψ1,x个X(X)¯K(K)^ψ1,ψ1θ^j个ψ1[j个](x个X(X)¯)[j个]=0,

即通过选择ψ1[j个]与…成比例θ^j个1(x个X(X)¯)[j个].自ψ1=Σj个1ψ1[j个]ϕj个然后,为了消除β[j个]确切地说j个=第页1,…,第页第页,其中第页1<…<第页第页n个,我们应该采取

ψ1=c(c)j个=1第页θ^第页j个1(x个X(X)¯)第页j个ϕ^第页j个,

其中常量c(c)应进行选择,以便‖ψ1‖=1. 然而,在方程式(2.7)然后与基于特征向量的传统最小二乘估计相同ψj个=ϕ^第页j个用于1⩽j个第页.

4.3. 定理4的大纲证明

首先我们导出CV的一个展开式(第页),定义于方程式(3.3)并基于定义对经济型leave-on-out算法进行了解释(3.6)属于μ^。请注意c(c)^j个,,于方程式(3.5),满足c(c)^j个,=d日^j个,+e(电子)^j个,哪里

d日^j个,=1n个k个:k个β,X(X)k个X(X)k个X(X)¯[j个],e(电子)^j个,=1n个k个:k个εk个X(X)k个X(X)¯[j个].

从这个属性,方程式(3.6)事实上

Y(Y)=α+β,X(X)+ε=Y(Y)¯+j个=1β[j个]X(X)X(X)¯[j个]+εε¯,

哪里X(X)¯=n个1Σk个:k个X(X)k个ε¯=n个1Σk个:k个εk个,我们可以推断

Y(Y)μ^X(X)=j个=1第页β[j个]θ^j个1d日^j个,X(X)X(X)¯[j个]+j个=第页+1β[j个]X(X)X(X)¯[j个]+εε¯j个=1第页θ^j个1e(电子)^j个,X(X)X(X)¯[j个]+j个=1β[j个]X(X)¯X(X)¯[j个]=一个+n个1B,

哪里

一个=εΔX(X)1n个=1n个εj个=1第页θ^j个1(X(X)X(X)¯[j个]X(X)X(X)¯[j个]+1},B=β,X(X)+εj个=1第页θ^j个1X(X)X(X)¯[j个]2+β,X(X)+ε.

另请注意

个人简历(第页)1n个=1n个一个22n个2=1n个一个B1n个=1n个B2,
(4.7)
14=1n个B2=1n个β2X(X)2+ε2j个=1第页θ^j个1X(X)X(X)¯[j个]22+=1n个ε2+β2=1n个X(X)2,=1n个ε2+=1n个X(X)2=O(运行)(n个)$$w个t吨小时第页第页o(o)b条b条t吨1
(4.8)
=1n个ε2+=1n个X(X)2=O(运行)(n个)具有可能性1

(自E类(ɛ2)+E类(‖X(X)2)<∞如果C类,状况良好(3.9),超过2),并且,自

1n个=1n个X(X)X(X)¯j个1X(X)X(X)¯j个2=θ^j个1δj个1j个2

然后

1β2+1=1n个β2X(X)2+ε2j个=1第页θ^j个1X(X)X(X)¯[j个]22最大1n个X(X)2+ε2X(X)X(X)¯2=1n个j个=1第页θ^j个1X(X)X(X)¯[j个]2j个=1第页θ^j个1=n个第页最大1n个X(X)2+ε2X(X)X(X)¯2j个=1第页θ^j个1.

结合不等式的估计(4.8)向下我们推断,概率为1,

=1n个B2=O(运行)n个第页最大1n个X(X)2+ε2X(X)X(X)¯2j个=1第页θ^j个1,
(4.9)

在中一致第页.

写入

=1n个一个2=S公司1+S公司2+S公司+S公司4+S公司5=1n个一个B=T型1+T型2+T型,
(4.10)

哪里

S公司1==1n个ε2,T型1==1n个εβ,X(X)+ε
(4.11)

不依赖第页,

S公司2==1n个ΔX(X)2,
(4.12)
S公司=σ2n个2=1n个=1n个j个=1第页θ^j个1X(X)X(X)¯[j个]X(X)X(X)¯[j个]+12=(第页+1)σ2,
(4.13)
S公司4=2σ2n个=1n个j个=1第页θ^j个1X(X)X(X)¯[j个]2+1=2(第页+1)σ2,
(4.14)
T型2=σ2=1n个j个=1第页θ^j个1X(X)X(X)¯[j个]2=n个第页σ2,
(4.15)

和剩下的S公司5T型由表达式隐式定义(4.10).通过细分S公司5T型进一步分为六个和七个术语,并根据其优点对每一个术语进行界定,可以表明W公司=W公司(第页) =n个−1S公司5W公司(第页) =n个−2T型,概率为1,

P(P)|W公司|>ξn个MSSE公司(第页)X(X)=O(运行)ξn个2第页最大1n个X(X)X(X)¯+εc(c)(第页)第页1/2+1n个j个=1第页θ^j个1第页,
(4.16)

在中一致第页,对于任何正常数序列ξn个.(指数c(c)(第页),位于的右侧方程式(4.16),取决于第页但不在n个第页.)因此,通过表达式的第一部分(4.10),和公式S公司1,S公司2,S公司,S公司4,T型1T型2方程式(4.11)(4.15),

1n个=1n个一个2=条款不取决于第页+MSSE公司(第页)2n个1(第页+1)σ2+W公司1
(4.17)
2n个2=1n个一个B=条款不取决于第页+2n个1第页σ2+W公司2
(4.18)

where结果(4.16)与保持W公司=W公司1W公司=W公司2.组合方程式(4.7),(4.9)(4.16)(4.18)我们推断

个人简历(第页)=MSSE公司(第页)+条款不取决于第页+W公司
(4.19)

where结果(4.16)与保持W公司=W公司.

请注意

有可能1套装P(P)比如说,整数第页适用于哪种情况(3.11)最多包含个O(运行)n个1η元素.
(4.20)

采取ξn个,结果是(4.16),等于n个η/4,然后选择第页⩾2/η.鉴于结果(3.11),(4.16)(4.20),

P(P)W公司(第页)>ξn个MSSE公司(第页)对一些人来说第页P(P)X(X)=O(运行)(#P(P))ξn个2第页最大1n个X(X)X(X)¯+εc(c)(第页)×啜饮第页P(P)第页1/2+1n个j个=1第页θ^j个1第页=O(运行)n个1ηξn个2第页最大1n个X(X)X(X)¯+εc(c)(第页)n个第页η=O(运行)n个η最大1n个X(X)X(X)¯+εc(c)(第页),
(4.21)

概率为1。自起,按条件(3.9),E类(‖X(X)‖+|ɛ|)C类<∞那么,如果C类>2c(c)(第页)/η,

P(P)最大1n个X(X)X(X)¯+εc(c)(第页)>n个η/2n个E类(X(X)+|ε|)C类n个ηC类/2c(c)(第页)=O(运行)n个1ξ,

哪里ξ>0.因此方程式(4.21)和Borel–Cantelli引理,

啜饮第页P(P)W公司(第页)磁共振波谱(第页)0

概率为1。这个结果和方程式(4.21)暗示结果(3.10).

工具书类

本哈伊姆
,
Z.公司。
艾达尔
,
Y.C.(纽约)。
(
2007
)
盲极大极小估计
.
IEEE传输。通知。理论
,
53
,
3145
3157
.

伯杰
,
J.O.公司。
(
1976
)
具有任意二次损失的多元正态均值的可容许极小极大估计
.
安。统计师。
,
4
,
223
226
.

博克
,
机械工程师。
(
1975
)
多元正态分布均值的极大极小估计
.
安。统计师。
,
,
209
218
.

本特
,
G.公司。
弗莱曼
,
R。
(
2000
)
基于核的函数主成分
.
统计师。普罗巴伯。莱特。
,
48
,
335
345
.

博斯克
,
D。
(
2000
)
函数空间中的线性过程:理论与应用
.
莱克特。注释统计。
,
149
.

,
T.T.公司。
霍尔
,
第页。
(
2006
)
函数线性回归中的预测
.
安。统计师。
,
34
,
2159
2179
.

卡多特
,
H。
(
2000
)
采样噪声函数平滑主成分分析的非参数估计
.
J.Nonparam(非参数)。统计人员。
,
12
,
503
538
.

卡多特
,
H。
(
2007
)
条件函数主成分分析
.
扫描。J.统计。
,
34
,
317
335
.

卡多特
,
H。
,
费拉蒂
,
F、。
萨尔达
,
第页。
(
2000
)
Etude渐近d'un估计样条混合pour le modèle linéaire函数
.
C.R.学院。科学。巴黎I
,
330
,
501
504
.

卡多特
,
H。
,
费拉蒂
,
F、。
萨尔达
,
第页。
(
2003
)
函数线性模型的样条估计
.
统计师。罪。
,
13
,
571
591
.

克里斯滕森
,
R。
(
2007
)
评论:费希尔讲座:回归中的降维
.
统计师。科学。
,
22
,
27
31
.

厨师
,
钢筋混凝土。
(
2007
)
Fisher讲座:回归中的降维
.
统计师。科学。
,
22
,
1
26
.

考克斯
,
D.右。
(
1968
)
关于回归分析某些方面的注意事项
.
J.R.统计。社会学硕士
,
131
,
265
279
.

吉拉德
,
美国。
(
2000
)
基于流形逼近的非线性PCA
.
计算。统计人员。
,
15
,
145
167
.

霍尔
,
第页。
侯赛尼·纳萨布
,
M。
(
2006
)
关于函数主成分分析的性质
.
J.R.统计。Soc.B公司
,
68
,
109
126
.

霍尔
,
第页。
侯赛尼·纳萨布
,
M。
(
2009
)
函数主成分分析中的高阶界理论
.
数学。程序。外倾角。菲洛斯。Soc公司。
,
146
,
225
256
.

霍尔
,
第页。
马龙
,
J.S.公司。
(
1991
)
交叉验证函数中的局部极小值
.
J.R.统计。Soc.B公司
,
53
,
245
252
; 修正,54(1992), 907.

霍尔
,
第页。
,
米勒
,
高-高。
,
J.-L.公司。
(
2006
)
用于函数和纵向数据分析的主成分方法的性质
.
安。统计师。
,
34
,
1493
1517
.

,
G.Z.公司。
,
米勒
,
高-高。
,
J.-L.公司。
(
2003
)
平方可积随机过程的泛函正则分析
.
J.Multiv.公司。分析。
,
85
,
54
77
.

曲棍球
,
共和国。
(
1976
)
线性回归中变量的分析与选择
.
生物计量学
,
32
,
1
49
.

詹姆斯
,
总经理。
,
哈斯蒂
,
T·J。
,
C.答。
(
2000
)
稀疏函数数据的主成分模型
.
生物特征
,
87
,
587
602
.

詹姆斯
,
西。
斯坦因
,
C、。
(
1961
)二次损失估算。
程序。伯克利第四交响乐团。数理统计与概率
(编辑)。
J。
内曼
),卷。
1
,第页。
311
319
.
伯克利
:
加利福尼亚大学出版社
.

肯德尔
,
M.G.公司。
(
1957
)
多元分析课程
.
伦敦
:
格里芬
.

膝盖
,
答:。
尤蒂卡尔
,
K·J。
(
2001
)
用函数主成分分析推断密度族
.
美国统计学杂志。助理。
,
96
,
519
532
.

,
B。
(
2007
)
评论:Fisher讲座:回归中的降维
.
统计师。科学。
,
22
,
32
35
.

,
L。
纳赫特海姆
,
C.J.公司。
(
2007
)
评论:费希尔讲座:回归中的降维
.
统计师。科学。
,
22
,
36
39
.

丸山
,
年。
(
1998
)
多元正态均值的一类统一的可容许极大极小估计
.
J.Multiv.公司。分析。
,
64
,
196
205
.

莫斯特勒
,
F、。
Tukey公司
,
J·W·。
(
1977
)
数据分析与回归:统计学第二课程
.
阅读
:
出版商
.

斯珀雷尔
,
D.J.博士。
(
1963
)
主成分的一些冶金应用
.
申请。统计人员。
,
12
,
180
188
.

山西
,
年。
田中
,
年。
(
2005
)
函数主成分分析中的灵敏度分析
.
计算。统计人员。
,
20
,
311
326
.

姚明
,
F、。
,
总成本管理。
(
2006
)
函数主成分分析的惩罚样条模型
.
J.R.统计。Soc.B公司
,
68
,
25
.

本文根据牛津大学出版社标准期刊出版模式的条款出版和发行(https://academic.oup.com/journals/pages/open_access/funder_policies/chorus/standard_publication_model)