总结

我们提出了一种用于二元平滑的快速惩罚样条方法。单变量P(P)-样条曲线平滑器沿两个坐标同时应用。新的平滑器有一个三明治形状,向裁判建议“三明治平滑器”的名称。三明治平滑器具有张量积结构,简化了渐近分析,并且可以快速计算。通过证明三明治平滑器渐近等价于具有乘积核的二元核回归估计量,我们导出了三明治平滑器的局部中心极限定理,并给出了渐近偏差和方差的简单表达式。据我们所知,这是任何类型的二元样条估计量的第一个中心极限定理。我们的仿真研究表明,即使使用快速广义线性阵列模型算法计算二元样条平滑器,三明治平滑器的计算速度也比其他二元样条平滑器快几个数量级,并且在平均积分平方误差方面与之相当。我们将三明治平滑器扩展到更高维的阵列数据,其中广义线性阵列模型算法提高了三明治平滑器的计算速度。三明治平滑器的一个重要应用是在函数数据分析中估计协方差函数。在这个应用中,我们的数值结果表明,三明治平滑器比局部线性回归快几个数量级。三明治公式的速度很重要,因为函数数据集变得相当大。

1.简介

本文介绍了一种用于二元平滑的快速惩罚样条方法。给出了二元样条光滑器的第一个局部中心极限定理。假设有一个回归函数μ(x个z)带有(x个z)[01]2。最初我们假设j个=μ(x个zj个)+εj个1n个11j个n个2,其中εj个s独立于E类(εj个)=0E类(εj个2)=σ2(x个zj个)和设计要点{(x个zj个)}1n个11j个n个2具有确定性;因此,数据点的总数为n个=n个1n个2数据位于矩形网格上。第节4我们将设计假设放宽到固定的设计点而不是规则网格和随机设计点。使用矩形网格上的数据,可以将其组织为n个1×n个2矩阵Y(Y)。我们建议在Y(Y)所以拟合值矩阵Y(Y)^满足

Y(Y)^=S公司1Y(Y)S公司2
(1)

哪里S公司1S公司2是更平滑的矩阵x个z分别是。所以,固定一个协变量,我们沿着另一个协变数平滑,反之亦然,尽管这两个平滑是同时的,正如方程所示(1).估价师(1)在形式上类似于协方差矩阵的三明治公式,它向裁判建议了“三明治平滑器”的名称。我们采用了这个术语。

三明治平滑器的张量积结构允许快速计算,特别是选择平滑参数的广义交叉验证(GCV)标准;参见第节2.2Dierckx公司(1982)提出了一种与估计器结构相同的平滑器(1),但我们的渐近分析和三明治平滑器的快速实现是新的。为了平滑二维直方图,Eilers和Goeman(2004)研究了一种简化的三明治平滑器,它具有特殊的平滑器矩阵,可以为非负数据提供非负平滑器。三明治平滑器的快速方法可以应用于他们的方法。

对于二元样条平滑,有两个著名的估计量:二元P(P)-样条曲线(Eilers和Marx,2003; 马克思和艾勒斯,2005)和薄板样条,例如薄板回归样条(Wood,2003). 为了方便起见,Eilers–Marx和Wood估计值将分别用E–M和TPRS表示。我们使用E–M,没有说明如何计算估计器。

惩罚样条曲线近年来越来越受欢迎,因为它们使用的节点更少,在更高的维度上比平滑样条曲线或薄板样条曲线需要更少的计算。参见Ruppert. (2003)或木材(2006)用于方法开发和应用。然而,缺陷样条的理论研究一直是一个挑战。最近才实现了对单变量惩罚样条函数的渐近研究(Hall和Opsomer,2005; Li和Ruppert,2008; 克莱斯肯斯.,2009; 考尔曼.,2009; .,2011). 相比之下,光滑样条的渐近收敛速度已经得到了很好的确定;见顾(2002)以获取全面的参考列表。

高维惩罚样条函数的理论研究更具挑战性。据我们所知,文献中不包含中心极限定理或渐近平均和协方差矩阵的显式表达式μ^(x个z)对于任何类型的二元样条估计。三明治平滑器具有简化渐近分析的张量积结构,我们证明了三明治平滑器与具有乘积核的核估计量渐近等价。利用这个结果,我们得到了三明治平滑器的中心极限定理以及渐近偏差和方差的简单表达式。

为了平滑阵列数据,Currie的广义线性阵列模型(GLAM). (2006)利用模型矩阵和数据的数组结构,给出了一种低存储、高速的算法。E-M估计器可以用GLAM算法实现(用E-M-GLAM表示)。三明治平滑器还可以扩展到任意维的数组数据,其中GLAM算法可以提高三明治平滑器的速度;参见第节7.由于章节中的快速方法2.2对于计算GCV标准,GLAM算法用于计算夹层时比用于计算E–M估计器时更快。在第5节表2中。2,我们看到,在广泛的样本大小和节数范围内,三明治平滑器比E–M–GLAM估计器快许多数量级。

本文的其余部分组织如下。在节中2,我们提供了关于三明治平滑器的详细信息。在节中通过证明三明治平滑器与具有乘积核的二元核估计量的渐近等价,我们建立了三明治平滑器的渐近理论。在节中4,我们考虑不规则间隔的数据。在节中5,我们报告了一项模拟研究。在节中6为了估计函数数据的协方差函数,我们比较了三明治平滑器和局部线性平滑器。我们发现三明治平滑器比局部线性平滑器快许多数量级,并且它们具有相似的平均积分平方误差(MISE)。在节中7,我们将三明治平滑地扩展到维数大于2的数组数据。

用于分析数据的程序可以从http://www.blackwellpublishing.com/rss

2.三明治更光滑

让vec是将矩阵的列堆叠成向量的操作。定义=vec(Y(Y))和血管内皮细胞(Y(Y)^)=^应用张量乘积的一个众所周知的恒等式(Seber(2007),第240页)发送给估计器(1)给予

^=(S公司2S公司1).
(2)

身份(2)证明了整体光滑矩阵是两个单变量光滑矩阵的张量积。由于平滑矩阵的分解,我们说我们的模型具有张量积结构。我们将使用P(P)-样条曲线(Eilers和Marx,1996)构造单变量平滑矩阵,即。

S公司=B(BT型B+λT型)1BT型=12
(3)

哪里B1B2是的模型矩阵x个z使用B-样条基(稍后定义),以及12是差分阶的差分矩阵12分别是。然后,可以使用张量积的恒等式(Seber(2007),第235-239页),

S公司2S公司1={B2(B2T型B2+λ22T型2)1B2T型}{B1(B1T型B1+λ11T型1)1B1T型}=(B2B1)(B2T型B2B1T型B1+λ1B2T型B21T型1+λ22T型2B1T型B1+λ1λ22T型21T型1)1(B2B1)T型.
(4)

第二等式中的逆矩阵(4)显示了我们的模型使用带有惩罚的张量积样条(稍后定义)

P(P)=λ1B2T型B21T型1+λ22T型2B1T型B1+λ1λ22T型21T型1
(5)

关于系数矩阵。二元张量积样条(Dierckx(1995),第2章)的定义

1κc(c)11c(c)2θκBκ1(x个)B2(z)

哪里Bκ1B2B-样条基函数x个z分别是,c(c)1c(c)2是一元样条函数的基函数数Θ=(θκ)1κc(c)11c(c)2是系数矩阵。我们使用B-度的样条曲线第页1第页2对于x个z分别和使用K(K)11K(K)21分别为等距内部节点。然后c(c)1=K(K)1+第页1c(c)2=K(K)2+第页2。因此,模型为

Y(Y)=B1θB2T型+ε
(6)

哪里B1={Bκ1(x个第页)}1第页n个11κc(c)1B2={B2(z)}1n个21c(c)2ε是一个n个1×n个2矩阵,带有(j个)第个条目εj个.让θ=vec(Θ). 然后估计θ通过最小化给出Y(Y)B1Θ^B2T型F类2+θ^T型P(P)θ^,其中规范是Frobenius规范P(P)在方程式中定义(5)因此,系数矩阵的估计Θ^满足Λ1Θ^Λ2=B1T型Y(Y)B2,其中,对于= 1,2,Λ=BT型B+λT型或者,同等地,θ^满足

(Λ2Λ1)θ^=(B2B1)T型.
(7)

那么我们受到惩罚的估计是

μ^(x个z)=1κc(c)11c(c)2θ^κBκ1(x个)B2(z).
(8)

使用等式(5),很容易证明^=(B2B1)θ^满足方程(1)这证实了所提出的方法使用具有特定惩罚的张量积样条。

2.1. 与E-M估计值的比较

三明治平滑器和E–M估计器之间的唯一区别(Eilers和Marx,2003; 马克思和艾勒斯,2005)就是惩罚。P(P)E类-M(M)表示E–M估计量的惩罚矩阵;然后P(P)E类-M(M)=λ1c(c)21T型1+λ22T型2c(c)1.二元第一、二罚项P(P)-样条线惩罚Θ分别被称为列惩罚和行惩罚。可以看出,方程中的第一个惩罚项(5)B2T型B21T型1,比如c(c)21T型1,是“列”惩罚,但它惩罚ΘB2T型而不是Θ。我们称之为修改列惩罚。从更仔细的模型中可以看出此修改列惩罚的含义(6).根据模型(6)作为一个模型B-花键底座B1和系数ΘB2T型,型号(6)变系数模型(Hastie和Tibshirani,1993)在x个系数取决于z因此,我们可以将修改后的列惩罚解释为对单变量的惩罚P(P)-沿x个-轴。同样,罚款期限2T型2B1T型B1对于三明治来说,更平滑的三明治会减少B1Θ可以解释为对单变量的惩罚P(P)-沿z-轴。等式中的第三个惩罚(4)对应于两个单变量平滑器的交互。

2.2. 快速实施

通过显示如何通过GCV的快速计算来选择平滑参数,我们导出了三明治平滑器的快速实现。GCV需要计算Y(Y)^Y(Y)F类2以及整个平滑矩阵的轨迹。我们需要一些初始计算。首先,我们需要奇异值分解

(BT型B)1/2T型(BT型B)1/2=单位诊断()单位T型对于=12
(9)

哪里单位是特征向量矩阵是特征值的向量。对于=1,2,让A类=B(BT型B)1/2单位; 然后A类T型A类=c(c)A类A类T型=B(BT型B)1BT型。由此可见= 1,2,S公司=A类ΣA类T型具有Σ={c(c)+λ诊断()}1.

我们首先计算Y(Y)^Y(Y)F类2.替换A类ΣA类T型对于S公司在方程式中(1)我们获得

Y(Y)^=A类1{Σ1(A类1T型Y(Y)A类2)Σ2}A类2T型=A类1(Σ1Y(Y)˜Σ2)A类2T型

哪里Y(Y)˜=A类1T型Y(Y)A类2.让˜=血管内皮细胞(Y(Y)˜); 然后

^=(A类2A类1)(Σ2Σ1)˜.
(10)

我们将对向量使用以下运算:是仅包含正元素的向量,1/2表示的元素平方根和1/表示。我们可以推导出

Y(Y)^Y(Y)F类2={˜T型(˜2˜1)}22{˜T型(˜21/2˜11/2)}2+T型
(11)

哪里˜=1/(1c(c)+λ)对于=1.2和1c(c)是长度为1s的向量c(c)。请参阅附录A用于方程推导(11).方程式的右侧(11)显示了每对平滑参数的计算Y(Y)^Y(Y)F类2只是长度向量的两个内积c(c)2c(c)1和术语T型只需对所有平滑参数进行一次计算。

接下来,可以首先使用张量积的另一个恒等式(Seber(2007),第235页),

信托收据(S公司2S公司1)=信托收据(S公司2)·信托收据(S公司1)
(12)

然后使用跟踪标识tr(实验室)=tr(文学士)(如果尺寸兼容)(Seber(2007),第55页),以及A类T型A类=c(c)

信托收据(S公司)=κ=1c(c)11+λκ
(13)

哪里κκ的第个元素.

总而言之,通过方程式(11)(12)(13)我们得到了一个计算GCV的快速实现,它使我们能够有效地选择平滑参数。由于实现速度快,三明治平滑器可以比E-M-GLAM算法快得多;参见第节5.2进行实证比较。对于E–M–GLAM估计量,维数矩阵的逆c(c)1c(c)2×c(c)1c(c)2每对都需要(λ1λ2),而对于三明治更平滑,除了表达式中的初始计算(9),不需要矩阵求逆。

3.渐近理论

在本节中,我们导出了三明治平滑器的渐近分布,并证明了它与具有乘积核的二元核回归估计量渐近等价。此外,我们还证明了当两阶差分惩罚相同时,三明治平滑器具有最佳收敛速度。

我们将使用最初用于研究平滑样条线的等效核方法(Silverman,1984)也有助于研究P(P)-样条(Li和Ruppert,2008; .,2011). 非参数点估计通常是所有数据点的加权平均值,其权重取决于所使用的点和方法。等效核方法表明,对于某个核函数(等效核)和某个带宽(等效带宽),权重是核回归估计量的渐近权重。首先,我们定义了一个单变量核函数

H(H)(x个)=ν=1ψν2经验(ψν|x个|)
(14)

哪里是一个正整数ψνs是复根x个2+(1)=0有积极的现实部分。在这里H(H)是一元惩罚样条函数的等效核(Wang.,2011). 通过引理1 in附录BH(H)为2阶注意,核的阶决定了核估计的收敛速度。见Wand和Jones(1995)了解更多详细信息。具有乘积核的二元核回归估计H(H)1(x个)H(H)2(z)形式为

(nh型n个1小时n个2)1j个j个H(H)1{小时n个11(x个x个)}H(H)2{小时n个21(zzj个)}

哪里小时n个1小时n个2是带宽。在适当的假设下,三明治平滑器与上述核估计量渐近等价(命题1)。因为核回归估计量的渐近理论已经建立(Wand和Jones,1995),可以类似地为三明治平滑器建立渐近理论。为了方便记法,b条意味着/b条收敛到1。

提议1.假设满足以下条件。

  • (a)

    有一个常数δ>0,这样啜饮j个{E类(|j个|2+δ)}<.

  • (b)

    回归函数μ(x个z)具有连续2四阶导数,其中=最大值(12).

  • (c)

    方差函数σ2(x个z)是连续的。

  • (d)

    协变量满足(x个zj个)=((12)/n个1(j个12)/n个2).

  • (e)

    n个1˜c(c)n个2哪里c(c)是一个常量。

小时n个1=K(K)11(λ1K(K)1n个11)1/21小时n个2=K(K)21(λ2K(K)2n个21)1/22小时n个=小时n个1小时n个2.假设小时n个1=O(运行)(n个ν1)小时n个2=O(运行)(n个ν2)对于某些常数0<ν1ν2<1也假设(K(K)1小时n个12)1=o个(1)(K(K)2小时n个22)1=o个(1).让μ^(x个z)使用1th-和2四阶差分惩罚和分别第页11第页21B-上的样条曲线x个-轴和z-轴分别具有等间距的节点。修复(x个z) ∈ (0,1)×(0,1). μ*(x个z)=

(n个小时n个)1j个j个H(H)1{小时n个11(x个x个)}H(H)2{小时n个21(zzj个)}.

然后

E类{μ^(x个z)μ*(x个z)}=O(运行)[最大值{(K(K)1小时n个1)2(K(K)2小时n个2)2}]无功功率,无功功率{μ^(x个z)μ*(x个z)}=o个{(nh型n个)1}.

所有证明均在附录B.

定理1在命题1中使用相同的符号,并假设命题1中的所有条件和假设都得到满足。为了简化符号,让我们=412+1+2此外,假设K(K)1˜C类1n个τ1K(K)2˜C类2n个τ2具有τ1>(1+1)2/τ2>1(2+1)/小时n个1˜小时1n个2/小时n个2˜小时2n个1/对于正常数C类1C类2小时1小时2。那么,对于任何(x个z)∈(0,1)×(0,1),我们得到

n个212/{μ^(x个z)μ(x个z)}N个{μ˜(x个z)(x个z)}
(15)

作为分发n个1n个2,其中

μ˜(x个z)=(1)1+1小时12121x个21μ(x个z)+(1)2+1小时22222z22μ(x个z)
(16)
(x个z)=σ2(x个z)H(H)12(u个)d日u个H(H)22(v(v))d日v(v).
(17)

备注1.案例1=2=非常重要。估计量的收敛速度变为n个/(2+1).石头(1980)得到了非参数估计的最优收敛速度。对于二元光滑函数μ(x个z)连续2th导数,估计的相应最优收敛速度μ(x个z)单位正方形的任何内部点为n个/(2+1)因此,当1=2=,三明治平滑器达到最佳收敛速度。注意,具有乘积核的二元核估计H(H)(x个)H(H)(z)收敛速度也为n个/(2+1).

备注2.对于单变量情况P(P)-带有四阶差分惩罚为n个2/(4+1)(见王. (2011))。因此,二元情形的收敛速度较慢,这表明了“维数诅咒”的影响。

备注3定理1表明,只要足够快,节数的发散率不会影响渐近分布。为了实际使用,我们建议K(K)1=最小值{n个1/235}K(K)2=最小值{n个2/235},以便每个箱子至少有四个数据点。对于单变量P(P)-样条曲线,最小值{n个/Ruppert建议4,35}节(2002).

4.不规则间隔的数据

假设设计点是随机的,我们使用模型=μ(x个z)+ε=1n个,即。x个z现在只有一个索引,而不是i、 j个和以前一样。假设设计点{(x个1z1)(x个n个zn个)}独立并从分布中取样F类(x个z)在[01]2。三明治平滑器不能直接应用于不规则间隔的数据。这个问题的解决方案是先将数据装箱。我们划分[01]2变成1×2等尺寸矩形箱的网格和let˜κ成为所有人的中庸使得(x个z)位于(κ)第th个bin。如果(κ)第th个仓,˜κ是任意定义的,例如由最近邻估计量(见下文)。假设˜κ是位于的数据点(x个˜κz˜),位于(κ)th bin,我们将三明治平滑器应用于网格数据Y(Y)˜=(˜κ)1κ112以获得

θ^*=(Λ21Λ11)(B2B1)T型˜

哪里˜=血管内皮细胞(Y(Y)˜)。那么我们的惩罚估计被定义为

μ^(x个z)=κ=1c(c)1=1c(c)2θ^k个*Bκ1(x个)B2(z).

4.1. 实际实施

为了使上述估算程序与第节中的快速实施协同工作2.2,我们需要处理由于采样变化而导致某些箱子中没有数据的问题。如果中没有数据(κ)一个解决方案是定义˜κ为相邻垃圾箱中的平均值。这样做对渐近没有影响,因为箱子最终会有数据。对于小样本,以这种方式填充空单元格可以更平滑地计算三明治,但可能会将空箱子附近的估计值标记为不可靠。

另一种解决方案是使用在数据和平滑参数之间迭代的算法,如下所示。最初,我们让˜κ=0如果(κ)th bin没有数据点。另一种可能性是˜κ对一些人来说是M(M)>0,是M(M)的值带有(x个z)最靠近中心的坐标(κ)确定平滑参数(λ1λ2)为了最小化GCV,我们只计算有数据的箱子的平方误差之和,而忽略没有数据的箱子。这为我们提供了一对初始平滑参数。然后,对于没有数据的箱子,我们替换˜κs乘以这对平滑参数的估计值。现在,通过更新数据,我们可以获得另一对平滑参数。我们重复上述步骤,直到达到某种收敛。

4.2. 渐近理论

如前所述,我们将单位间隔划分为1×2网格和出租=12是箱子的数量。

定理2.假设满足以下条件。

  • (a)

    有一个常数δ>0,这样啜饮{E类(||2+δ)}<.

  • (b)

    回归函数μ(x个z)具有连续2阶导数,其中=最大值(12).

  • (c)

    设计要点{(x个z)}=1n个独立并从分布中取样F类(x个z)具有密度函数(f)(x个z)和(f)(x个z)是肯定的[01]2并具有连续的一阶导数。

  • (d)

    条件启用{(x个z)}=1n个,随机误差ε1n个,与均值0和条件方差无关σ2(x个z).

  • (e)

    方差函数σ2(x个z)是两倍连续可微的。

  • (f)

    ˜c(c)n个τ1˜c(c)02对于某些常数c(c)c(c)0τ>412/(412+1+2).

修复(x个z)(01)2然后,使用与定理1相同的符号和假设,我们得到了

n个212/{μ^(x个z)μ(x个z)}N个{μ˜(x个z)(x个z)/(f)(x个z)}

作为分发n个→∞ 哪里μ˜(x个z)在方程式中定义(16)(x个z)在方程式中定义(17).

备注4.我们在定理2中假设随机设计点。对于固定的设计点,如果我们将条件(c)替换为啜饮κ|n个κ/(1)(f)(x个˜κz˜)|=o个(1)哪里n个κ是(κ)th bin和(f)(x个z)是一个连续的正函数。

5.仿真研究

本节比较了艾勒和马克思的三明治P(P)-在MISE和计算速度方面,使用GLAM算法(E–M–GLAM)和Wood的薄板回归样条(TPRS)实现的样条。章节5.1结果表明,三明治平滑器的MISE和E–M–GLAM方法大致相当,且小于TPRS方法,而第5.2说明了三明治平滑器相对于其他平滑器的计算优势。

5.1. 回归函数估计

模拟研究中使用了两种测试功能:(f)1(x个z)={2π(x个0.5)}余弦(4πz)

(f)2(x个z)=0.75πσx个σz经验{(x个0.2)2σx个2(z0.3)2σz2}+0.45πσx个σz经验{(x个0.7)2σx个2(z0.8)2σz2}

哪里σx个=0.3σz=0.4。请注意(f)2用于木材(2003). 两个真实表面如所示图1.

图1

(a)表面(f)1和(b)(f)2

在两个样本大小下评估了三种平滑器的性能。在较小的样本研究中,每个测试函数都是在单位正方形上的20×30规则网格上采样的,随机误差是独立的,且分布相同N个(0σ2)具有σ等于0.1和0.5。在每种情况下,生成100个重复数据集,对于每个重复数据,由三个估计器拟合测试函数,并计算积分平方误差(ISE)。对于样条基和节点设置,根据备注3中的建议,10和15个等距节点用于x个-以及z-两个轴P(P)-样条估计。因此,总共使用了150节来建造B-样条曲线基础。立方(Cubic)B-样条曲线使用二阶差分惩罚。对于薄板回归估计器TPRS,我们使用R包mgcv(Wood,2006). 在本研究中,TPRS的等级为150(即基本维度为150)。对于所有三个估计量,平滑参数由GCV选择。MISE评估了这三种估计器的性能(表1)以及ISE的箱线图(图2).

表1

小样本三个估计量的MISE(20×30网格上的数据)

σ以下估算结果:
三明治平滑器E–M–GLAM公司TPRS公司
(f)1
0.18.13×1049.29×1041.46×10
0.51.08×1021.18×1021.56×102
(f)2
0.16.45×1045.73×1046.68×104
0.59.25×108.34×108.06×10
σ以下估算结果:
三明治平滑器E–M–GLAM公司TPRS公司
(f)1
0.18.13×1049.29×1041.46×10
0.51.08×1021.18×1021.56×102
(f)2
0.16.45×1045.73×1046.68×104
0.59.25×108.34×108.06×10
表1

小样本三个估计量的MISE(20×30网格上的数据)

σ以下估算结果:
三明治平滑器E–M–GLAM公司TPRS公司
(f)1
0.18.13×1049.29×1041.46×10
0.51.08×1021.18×1021.56×102
(f)2
0.16.45×1045.73×1046.68×104
0.59.25×108.34×108.06×10
σ以下估算结果:
三明治平滑器E–M–GLAM公司第三方程序
(f)1
0.18.13×1049.29×1041.46×10
0.51.08×1021.18×1021.56×102
(f)2
0.16.45×1045.73×1046.68×104
0.59.25×108.34×108.06×10

发件人表1我们可以看到,在估计方面,三明治平滑器比E–M–GLAM做得更好(f)1而E–M–GLAM更适合评估(f)2中的箱线图图2显示这两个P(P)-样条方法基本上是可比较的。与二者相比P(P)-样条方法,TPRS给出了较大的MISE,只有一例除外。TPRS估算性能相对较差的一种解释(f)1TPRS是各向同性的,只有一个平滑参数,因此在两个方向上应用相同数量的平滑,这可能不适合(f)1作为(f)1非常平滑x个并且变化迅速z(请参见图1).

图2

小样本三种估计量的ISE的箱线图:(a)(f)1σ= 0.1; (b)(f)1σ= 0.5; (c)(f)2σ= 0.1; (d)(f)2σ= 0.5

更大样本的模拟研究n个1=60n个2=80也完成了。对于这两个人P(P)-样条估计,节点数为K(K)1=30K(K)2=35薄板回归样条的秩为1050,这是两个样条中使用的节点总数P(P)-样条估计。所有其他设置与较小样本研究中的设置相同。得出的MISE和箱线图得出了与小样本研究相同的结论。为了简单起见,我们这里不显示结果。

5.2. 计算速度

三种样条平滑器的平滑计算速度(f)2使用不同数量的数据点进行评估。为了简单起见,我们让n个1=n个2并考虑了这个案子σ= 0.1. 我们为两者选择了结数P(P)-样条平滑器遵循备注3中的建议。我们将TPRS的等级固定为P(P)-样条曲线平滑器。对于两人P(P)-样条平滑器,报告的计算时间是在20×20对数尺度网格上搜索最优平滑参数的情况下[54]2.更精细的网格402还使用了网格点。计算是在运行Windows的2.83-GHz计算机上进行的,该计算机具有3 GB的随机访问内存。表2总结了结果,并表明三明治平滑器是迄今为止最快的方法。请注意,括号中的值是使用更精细网格的计算时间。

表2

在运行Windows且随机访问内存为3G字节的2.83-GHz计算机上,三个估计器的计算时间平均超过100个数据集

n个K(K)1K(K)2以下估算值的时间:
三明治平滑器E–M–GLAM公司TPRS公司
2021020.06 (0.24)4.09 (19.74)0.53
4022020.08 (0.30)94.76 (344.13)19.50
8023520.13 (0.45)1379.21 (5487.33)1032.07
30024220.18 (0.58)3798.23 (15192.92)
50025720.32 (0.89)21023.44 (84093.76)
n个K(K)1K(K)2以下估算值的时间:
三明治平滑器E–M–GLAM公司TPRS公司
2021020.06 (0.24)4.09 (19.74)0.53
4022020.08 (0.30)94.76 (344.13)19.50
8023520.13 (0.45)1379.21 (5487.33)1032.07
30024220.18(0.58)3798.23 (15192.92)
50025720.32 (0.89)21023.44(84093.76)

夹层平滑器和E–M–GLAM的时间是针对平滑参数值的20×20网格,(括号中)是针对更精细的40×40网格n个=202402802,每个轴的节数由备注3中的建议选择。对于n个=3002n个=5002,三明治平滑器的总节数约为n个/5+0.1如定理1所示。

表2

在运行Windows且随机访问内存为3G字节的2.83-GHz计算机上,三个估计器的计算时间平均超过100个数据集

n个K(K)1K(K)2以下估算值的时间:
三明治平滑器E–M–GLAM公司TPRS公司
2021020.06 (0.24)4.09 (19.74)0.53
4022020.08 (0.30)94.76 (344.13)19.50
8023520.13 (0.45)1379.21 (5487.33)1032.07
30024220.18 (0.58)3798.23 (15192.92)
50025720.32 (0.89)21023.44 (84093.76)
n个K(K)1K(K)2以下估算值的时间:
三明治平滑器E–M–GLAM公司TPRS公司
2021020.06 (0.24)4.09 (19.74)0.53
4022020.08 (0.30)94.76 (344.13)19.50
8023520.13 (0.45)1379.21 (5487.33)1032.07
30024220.18 (0.58)3798.23 (15192.92)
50025720.32 (0.89)21023.44(84093.76)

三明治平滑器和E–M–GLAM的时间用于平滑参数值的20×20网格,(括号中)用于更精细的40×40网格n个=202402802,每个轴的节数由备注3中的建议选择。对于n个=3002n个=5002,夹层平滑器的结总数约为n个/5+0.1如定理1所示。

为了进一步说明其计算能力,将三明治平滑器应用于大小为30025002.对于立方B-样条函数与二阶差分惩罚耦合,定理1建议选择K(K)1>n个/10K(K)2>n个/10.所以我们让K(K)1=K(K)2具有K(K)1K(K)2接近n个/5+0.1在仿真中。我们还评估了E-M-GLAM的速度。为了节省时间,仅对25对平滑参数运行E–M–GLAM,并将计算时间乘以16或64,以分别在粗网格或细网格上与三明治平滑器的计算时间相比较表2这表明三明治平滑器可以在个人电脑上快速处理大数据,而E-M-GLAM要慢得多。薄板回归样条不适用于这些大数据,因为它需要比计算机提供的更多的内存空间。

总之,这里的模拟研究以及第节中的快速实现2.2显示三明治比其他两个估计值更平滑的优势。因此,当考虑到计算时间时,最好使用三明治平滑器。

6.应用:协方差函数估计

由于函数数据分析已成为一个主要的研究领域,协方差函数的估计已成为二元平滑的一个重要应用。由于函数数据集可能非常大,因此在函数数据分析中,快速计算二元平滑是必不可少的,尤其是在使用bootstrap进行推理时。局部多项式平滑是估计协方差函数的常用方法(参见示例Yao. (2005)或者姚明和李(2006))而其他平滑方法,如核(Staniswalis和Lee,1998)和惩罚样条(Di.,2009)也已使用。在本节中,通过模拟研究,我们比较了在固定网格上观察或测量数据时,三明治平滑器和局部多项式用于估计协方差函数的性能。

让{X(X)(t吨):t吨∈[0,1]}是具有连续协方差函数的随机过程K(K)(t吨)=覆盖{X(X)(),X(X)(t吨)}. 为了简单起见,我们假设E类{X(X)(t吨)}=0,t吨∈ [0,1]. 假设{X(X)(t吨)=1n个}是上述随机过程的独立实现的集合,我们观察到随机函数X(X)在具有测量误差的离散设计点,

Y(Y)ij公司=X(X)(t吨j个)+εij公司1j个J型1n个

哪里J型是每条曲线的测量次数,n个是曲线的总数εij公司是独立且同分布的测量误差,平均值为0且方差有限,且与随机函数无关X(X).让Y(Y)=(Y(Y)1Y(Y)国际期刊)T型。可以通过平滑样本协方差矩阵来获得协方差函数的估计n个1Σ=1n个Y(Y)Y(Y)T型通过二元平滑器。因为我们要平滑对称矩阵,所以对于三明治平滑器,我们使用两个相同的单变量平滑器矩阵,所以只有一个平滑参数可供选择。我们使用常用的局部线性平滑器(Yao.,2005; 霍尔.,2006)用于比较,并且通过留出一条曲线进行交叉验证来选择带宽。我们编写了Yao使用的估计器的R实现. (2005),因为他们的代码在MATLAB中。

我们让K(K)(t吨)=Σk个=14λk个ψk个()ψk个(t吨)其中特征值λk个=0.5k个1k个=1,2,3,4和{ψ1ψ4}是情况1中任一情况的本征函数,

{2(2πt吨)2余弦(2πt吨)2(4πt吨)2余弦(4πt吨)}

或情况2,

{1(2t吨1)(6t吨26t吨+1)5(20t吨30t吨2+12t吨1)7}.

这两组特征函数用于Di. (2009)、格雷文. (2010)和Zipunniknov. (2011). 我们让σ= 0.5. 我们模拟了100个数据集,并根据MISE评估了两个双变量平滑器。结果见表3。来源表3,对于带有的情况1(n个J型)=(25,20)局部线性平滑器稍好,ISE的平均值和标准偏差较小,对于其他情况,两个平滑器的结果相近。情形1中两个平滑器估计的特征函数(n个J型)=(25,20)如所示图3这表明这两种平滑器都能很好地估计特征函数。我们发现了类似的结果(n个J型)=(100,40)(结果未显示)。

表3

估计协方差函数的三明治平滑器和局部线性平滑器的MISE

(n,J)案例三明治更加光滑局部线性平滑器的结果
(25, 20)10.053 (0.035)0.050 (0.026)
20.199 (0.139)0.204 (0.144)
(100, 40)10.014 (0.008)0.013 (0.008)
20.050 (0.034)0.050 (0.036)
(n,J)案例三明治更光滑的效果局部线性平滑器的结果
(25, 20)10.053(0.035)0.050(0.026)
20.199 (0.139)0.204 (0.144)
(100, 40)10.014 (0.008)0.013 (0.008)
20.050 (0.034)0.050 (0.036)

括号中的数字是ISE的标准偏差。

表3

估计协方差函数的三明治平滑器和局部线性平滑器的MISE

(n,J)案例三明治更加光滑局部线性平滑器的结果
(25, 20)10.053 (0.035)0.050 (0.026)
20.199 (0.139)0.204 (0.144)
(100, 40)10.014 (0.008)0.013 (0.008)
20.050 (0.034)0.050 (0.036)
(n,J)案例三明治更加光滑局部线性平滑器的结果
(25, 20)10.053 (0.035)0.050 (0.026)
20.199 (0.139)0.204 (0.144)
(100, 40)10.014 (0.008)0.013 (0.008)
20.050(0.034)0.050 (0.036)

括号中的数字是ISE的标准偏差。

真实和估计的特征函数用(n个J型)=(25,20)对于情况1(噪声方差为0.25)(---,真本征函数;图解的,逐点中值估计特征函数;图解的第5和第95百分位曲线):(a)三明治更平滑;(b) 局部线性平滑器

我们还通过使用案例1比较了两个平滑器的计算时间J型。对于三明治平滑器,我们搜索了20多个平滑参数。对于局部线性平滑器,我们固定了带宽。请注意,通过保留一条曲线进行交叉验证来选择带宽意味着局部线性平滑器的计算时间将乘以带宽数和曲线数。表4结果表明,即使在协方差函数估计的带宽固定的情况下,三明治平滑器的计算速度也比局部线性平滑器快得多。

表4

平滑a的计算时间J型×J型使用三明治平滑器和局部线性平滑器的协方差矩阵

J型三明治平滑器的计算时间(s)局部线性平滑器的计算时间
400.022.98
800.0350.04
1600.05961.42
3200.1613854.40
J型三明治平滑器的计算时间(s)局部线性平滑器的计算时间
400.022.98
800.0350.04
1600.05961.42
3200.1613854.40

除了一个例外,在运行Windows的2.83-GHz计算机上,计算时间平均超过100个数据集,随机访问内存为3 GB。曲线数固定为100。局部线性平滑器的带宽在计算中是固定的。例外情况是,当J型=320仅为10个数据集的平均值。

表4

平滑a的计算时间J型×J型使用三明治平滑器和局部线性平滑器的协方差矩阵

J型三明治平滑器的计算时间(s)局部线性平滑器的计算时间
400.022.98
800.0350.04
1600.05961.42
3200.1613854.40
J型三明治平滑器的计算时间(s)局部线性平滑器的计算时间
400.022.98
800.0350.04
1600.05961.42
3200.1613854.40

除了一个例外,在运行Windows的2.83-GHz计算机上,计算时间平均超过100个数据集,随机访问内存为3 GB。曲线数固定为100。局部线性平滑器的带宽在计算中是固定的。例外情况是,当J型=320仅为10个数据集的平均值。

总之,模拟研究表明,对于协方差函数估计,当功能数据在固定网格上测量时,三明治平滑器在MISE方面与局部线性平滑器相当。三明治平滑器的计算速度比局部线性平滑器快得多。

7.多元P(P)-样条曲线

我们将三明治平滑地扩展到维度大于2的数组数据。假设我们有一个非参数回归模型d日≥3个协变量

1d日=μ(x个1x个d日)+ε1d日1k个n个k个1k个d日

因此数据收集在d日-维度网格。为了简单起见,假设协变量在[01]d日。在双变量情况下,我们对d日-变量函数μ(x个1x个d日)按张量积B-的样条曲线d日变量Σκ1κ2κd日θκ1κ2κd日Bκ11(x个1)Bκ21(x个2)Bκd日d日(x个d日)哪里Bκ11Bκ22Bκd日d日B-样条基函数。我们同时平滑所有协变量,以便拟合值和数据满足

^=(S公司d日S公司d日1S公司1)
(18)

哪里S公司是更平滑的矩阵使用th协变量P(P)-表达式中的样条线(3)数据向量首先由x个1,然后通过x个2,依此类推,以及^组织方式与类似于方程式(7),系数的估计θ^满足

(Λd日Λd日1Λ1)θ^=(Bd日Bd日1B1)T型

被处罚的估计是

μ^(x个1x个2x个d日)=κ1κ2κd日θ^κ1κ2κd日Bκ11(x个1)Bκ21(x个2)Bκd日d日(x个d日).

7.1. 多元的实现P(P)-样条曲线

在多维网格上平滑数据会出现两个计算问题。第一个问题是,除非S公司s都很小S公司d日S公司d日1S公司1将具有挑战性。第二个问题是平滑参数的选择。由于涉及大量的平滑参数,很难找到使一些模型选择标准(如GCV)最小化的平滑参数。

柯里的GLAM. (2006)通过利用模型矩阵的数组结构和数据,为第一个问题提供了一个优雅的解决方案。更平滑的矩阵S公司d日S公司d日1S公司1多元平滑具有张量积结构;因此^在方程式中(18)可以通过上的一系列嵌套操作高效计算通过GLAM算法。例如,考虑d日= 3. 然后^可以用一行R代码高效计算:#函数“RH”是矩阵对数组的旋转变换

#参见Currie等人(2006)

yhat=矢量(右侧(S3,右侧(S2,右侧,S1,Y)))

我们编写了RH函数的R版本。

第二个问题可以很容易地处理多元快速P(P)-样条曲线。由于平滑矩阵的张量积结构2.2可以推广到多元情况。作为一个例子,我们展示了如何计算平滑矩阵的轨迹S公司所以这个表达式(13)为所有人保留= 1,…,d日; 然后通过以下公式计算平滑矩阵的轨迹

信托收据(S公司d日S公司d日1S公司1)=Π=1d日信托收据(S公司)

在表达式中使用标识(12)重复。请注意信托收据(S公司)与表达式中的表达式类似(13)为所有人.

三明治平滑器没有广义线性模型权重矩阵,当它用于二元平滑时,不需要旋转数组,因此我们不认为二元三明治平滑器是GLAM算法。然而,我们对双变量三明治平滑器的实现使用张量积结构来简化计算,与GLAM类似。

7.2. 一个例子

使用20由平滑参数组成的网格,三明治平滑器在运行Macintosh软件和4GB随机访问内存的2.4GHz计算机上大约需要20秒。我们还没有找到其他平滑器的计算时间,但我们可以给出一个粗略的下限。我们看到了表2E–M–GLAM在802在20×20网格上搜索平滑参数的二维网格。在20×20x20网格上搜索以选择平滑参数,GCV计算次数现在增加了20倍。此外,对于每个GCV计算,E–M–GLAM将需要更多的时间来平滑大小为128×128×24的数据,这要大得多。因此,对于计算GCV效率不如三明治平滑器的算法,E–M–GLAM估计器平滑128×128×24数据的计算时间将为数小时。

致谢

这项研究得到了美国国家科学基金会DMS-0805975和美国国立卫生研究院R01-NS060910的部分资助。罗晓的研究得到了国家研究资源中心资助UL1-RR024996的部分支持。李英星的研究得到了国家自然科学基金11201390的部分资助。我们感谢Iain Currie教授对GLAM算法的有益讨论。我们感谢两位审稿人和一位副编辑提出的最有帮助的意见和建议,这些意见和建议极大地改进了本文。我们非常感谢裁判建议使用“三明治平滑剂”这个名字。

工具书类

克莱斯肯斯
G.公司。
克里沃博科娃
T。
Opsomer公司
J·D·。
(
2009
)
惩罚样条估计的渐近性质
.
生物特征
96
529
544
.

咖喱
身份证号码。
德班
M。
艾尔斯
P.H.C.公司。
(
2006
)
广义线性阵列模型及其在多维平滑中的应用
.
J.R.统计。Soc.B公司
68
259
280
.

C、。
克拉伊尼恰努
C.M.公司。
卡福
学士学位。
旁遮普语
N。
(
2009
)
多层次函数主成分分析
.
附录申请。统计师。
458
488
.

迪尔克克斯
第页。
(
1982
)
使用样条函数在矩形网格上平滑数据的快速算法
.
SIAM J.数字。分析。
19
1286
1304
.

迪尔克克斯
第页。
(
1995
)
用样条曲线和曲面拟合
.
牛津
:
克拉伦登
.

杜勒特
R。
(
2005
)
概率:理论与实例
,第3版。
贝尔蒙特:汤姆森
.

艾尔斯
第页。
戈曼
J。
(
2004
)
使用平滑密度增强散点图
.
生物信息学
20
623
628
.

艾尔斯
第页。
马克思
B。
(
1996
)
使用B样条曲线和惩罚进行灵活平滑(带讨论)
.
统计师。科学。
11
89
121
.

艾尔斯
第页。
马克思
B。
(
2003
)
基于二维惩罚信号回归的温度相互作用多元校正
.
化学家。智力。实验室系统。
66
159
174
.

格拉德斯坦
一、。
雷日克
一、。
(
2007
)
积分、级数和乘积表
.
纽约
:
学术出版社
.

格雷文
美国。
克拉伊尼恰努
C、。
卡福
B。
赖希
D。
(
2010
)
纵向功能主成分
.
电子。J.统计。
4
1022
1054
.

C、。
(
2002
)
平滑样条方差分析模型
.
纽约
:
施普林格
.

霍尔
第页。
米勒
H。
J。
(
2006
)
用于函数和纵向数据分析的主成分方法的性质
.
安。统计师。
34
1493
1517
.

霍尔
第页。
运算器
J。
(
2005
)
惩罚样条回归理论
.
生物特征
92
105
118
.

汉森
B。
(
2008
)
相依数据核估计的一致收敛速度
.
经济计量学。西奥。
24
726
748
.

哈斯蒂
T。
提比什拉尼
R。
(
1993
)
变系数模型(含讨论)
.
J.R.统计。Soc.B公司
55
757
796
.

考尔曼
G.公司。
克里沃博科娃
T。
法尔迈尔
L。
(
2009
)
广义惩罚样条光滑的一些渐近结果
.
J.R.统计。Soc.B公司
71
487
503
.

Y。
鲁珀特
D。
(
2008
)
关于惩罚样条的渐近性
.
生物特征
95
415
436
.

马克思
B。
艾尔斯
第页。
(
2005
)
多维惩罚信号回归
.
技术计量学
47
13
22
.

鲁珀特
D。
(
2002
)
为受惩罚的样条线选择节点数
.
J.计算图表。统计师。
1
735
757
.

鲁珀特
D。
魔杖
M。
卡罗尔
R。
(
2003
)
半参数回归
.
剑桥
:
剑桥大学出版社
.

塞贝尔
G.公司。
(
2007
)
统计学家矩阵手册
.
霍博肯
:
威利-国际科学
.

西尔弗曼
B。
(
1984
)
样条平滑:等价变量核方法
.
安。统计师。
12
898
916
.

斯坦尼斯瓦利斯
J。
J。
(
1998
)
纵向数据的非参数回归分析
.
美国统计学杂志。助理。
93
1403
1418
.

石头
C、。
(
1980
)
非参数估计的最优收敛速度
.
安。统计师。
8
1348
1360
.

魔杖
M。
琼斯
M。
(
1995
)
平滑化
.
伦敦
:
查普曼和霍尔
.

十、。
J。
鲁珀特
D。
(
2011
)
广义惩罚样条光滑的一些渐近结果
.
电子。J.统计。
4
1
17
.

木材
序号。
(
2003
)
薄板回归样条
.
J.R.统计。Soc.B公司
65
95
114
.

木材
美国。
(
2006
)
广义可加模型:R引言
.
伦敦
:
查普曼和霍尔
.

L。
Y。
阿帕纳索维奇
T。
鲁珀特
D。
(
2012
)
P样条的局部渐近性。技术报告
.
康奈尔大学
伊萨卡
。(可从http://arxiv.org/abs/1201.0708v3.)

姚明
F。
总成本管理。
(
2006
)
函数主成分分析的惩罚样条模型
.
J.R.统计。Soc.B公司
68
25
.

姚明
F。
米勒
H。
J。
(
2005
)
稀疏纵向数据的功能数据分析
.
美国统计学杂志。助理。
100
577
590
.

齐普尼科夫
五、。
卡福
学士学位。
克拉伊尼恰努
C.M.公司。
尤森
D。
达瓦特齐科斯
C、。
施瓦茨
B。
(
2011
)
高维数据的多级函数主成分分析
.
J.计算图表。统计师。
20
852
873
.

附录A:方程推导(11)

首先我们有

Y(Y)^Y(Y)F类2=(^)T型(^)=^T型^2^T型+T型.

可以用公式表示(10)那个

^T型^=˜T型(Σ2Σ1)(A类2A类1)T型(A类2A类1)(Σ2Σ1)˜=˜T型(Σ2Σ1)(Σ2Σ1)˜=|˜T型(Σ2Σ1)|2={˜T型(˜2˜1)}2.

在这个推导中,|·|表示倒数第二个等式中的欧几里得范数;我们使用的事实是A类T型A类=c(c)而且两者都是Σ2Σ1是对角矩阵。类似地,我们得到

^T型={˜T型(˜21/2˜11/2)}2

从而建立方程(11).

附录B:定理证明

引理1.单变量核函数H(H)(x个)在表达式中定义(14)满足

x个H(H)(x个)d日x个={1=00很奇怪0是均匀的,并且222(1)+1(2)!=2.

因此H(H)(x个)为2阶.

证明。我们需要计算两种类型的积分:x个经验(斧头)余弦(bx公司)d日x个x个经验(斧头)(bx公司)d日x个这些不定积分由Gradshteyn和Ryzhik第230页的结果3和4给出(2007). 然后进行例行计算,得出预期结果。部分引理在Wang中导出. (2011). 推导的详细信息可以在Xiao中找到. (2012).

在证明命题1之前,我们需要以下引理。

引理2.使用与命题1中相同的符号,并假设命题1中的所有条件和假设均已满足。对于(x个z)∈(0,1)×(0,1),有一个常数C类>0,这样

μ^(x个z)=j个j个[{κ第页Bκ1(x个)B第页1(x个)S公司κ第页x个}B2(z)B2(zj个)S公司z+b条˜j个(x个z)]

哪里b条˜j个(x个z)=O(运行)[经验{C类最小值(小时n个11小时n个21)}].

证明.通过方程式(8)μ^(x个z)=Σθ^κBκ1(x个)B2(z)。我们只需要考虑θ^κ对于其中Bκ1(x个)B2(z)都是非零的。因此假设κ满足κ(K(K)1x个第页11K(K)1x个+第页1+1)(K(K)2z第页21K(K)2z+第页2+1).让1=最大值(第页11)2=最大值(第页22)。表示方式Λ1j个这个j个第列,共列Λ1Λ2j个这个j个第列,共列Λ2.如肖所示. (2012)李和鲁珀特(2008),有向量S公司κx个和一个常数C类>0这样,对于1<j个<c(c)11S公司κx个T型Λ1j个=δκj个和,用于1j个1c(c)11j个c(c)1S公司κx个T型Λ1j个=O(运行)[经验{C类小时n个11最小值(x个1x个)}].在这里δκj个=1如果j个=κδk个j个=0否则。同样,也有向量S公司z和一个常数C类4>0这样,对于2<j个<c(c)22S公司zT型Λ2j个=δj个、和,用于1j个2c(c)22j个c(c)2S公司zT型Λ2j个=O(运行)[经验{C类4小时n个21最小值(z1z)}].让θ˜κ=(S公司zS公司κx个)T型(Λ2Λ1)θ^C类=最小值{C类最小值(x个1x个)C类4最小值(z1z)}; 然后

θ˜κθ^κ=j个b条˜j个κj个
(19)

哪里b条˜j个κ=O(运行)[经验{C类最小值(小时n个11小时n个21)}].通过方程式(7)

θ˜κ=(S公司zS公司κx个)T型(B2T型B1T型)=(S公司zT型B2T型S公司κx个T型B1T型)=S公司κx个T型(B1T型Y(Y)B2)S公司z.

出租S公司κ第页x个成为第页的第个元素S公司κx个和类似的S公司z这个的第个元素S公司z,我们快递θ˜κ作为双倍总和

θ˜κ=第页S公司κ第页x个{j个B第页1(x个)j个B2(zj个)}S公司z=j个j个{第页B第页1(x个)S公司κ第页x个}B2(zj个)S公司z.
(20)

使用方程式(8)(19)(20),我们有

μ^(x个z)=κθ˜κBκ1(x个)B2(z)+κ(θ^κθ˜κ)Bκ1(x个)B2(z)=j个j个[{κ第页Bκ1(x个)B第页1(x个)S公司κ第页x个}B2(z)B2(zj个)S公司z+b条˜j个(x个z)]

哪里b条˜j个(x个z)=O(运行)[经验{C类最小值(小时n个11小时n个21)}].

B.1、。命题1的证明

λ˜1=λ1K(K)1n个11=(K(K)1小时n个1)21λ˜2=λ2K(K)2n个21=(K(K)2小时n个2)22.根据肖的命题5.1. (2012),有一些常量0<ϕ1ϕ2<使得

n个1小时n个1k个第页Bk个1(x个)B第页1(x个)S公司k个第页x个=H(H)1(|x个x个|小时n个1)+δ{第页1>1}{O(运行)(λ˜12+1/21)+δ{|x个x个|<ϕ1/K(K)1}O(运行)(λ˜1第页1/(第页11)+1/21)}+经验(ϕ2|x个x个|小时n个1){O(运行)(λ˜11/1)+
(21)

在这里δ{第页1>1}=1如果第页1>1δ{第页1>1}=0否则;其他的δ-术语的定义类似。同样,也有一些常量0<ϕϕ4<使得

n个2小时n个2B2(z)B2zj个S公司z=H(H)2zzj个小时n个2+δ第页2>2O(运行)λ˜22+1/22+δzzj个<ϕ/K(K)2O(运行)λ˜2第页2/第页22+1/22+经验ϕ4zzj个小时n个2O(运行)λ˜21/2+δ2=1δzzj个第页2+1λ˜21/22O(运行)λ˜21/22.
(22)

d日1=k个第页Bk个1(x个)B第页1(x个)S公司k个第页x个(n个1小时n个1)1H(H)1{小时n个11(x个x个)}
d日2=B2(z)B2(zj个)S公司z(n个2小时n个2)1H(H)2{小时n个21(zzj个)}
b条j个(x个z)=1n个1小时n个1H(H)1(|x个x个|小时n个1)d日2+1n个2小时n个2H(H)2(|zzj个|小时n个2)d日2+d日1d日2+b条˜j个(x个z).

从引理2可以得出μ^(x个z)μ*(x个z)=Σj个b条j个(x个z)j个.因此E类{μ^(x个z)μ*(x个z)}=Σj个b条j个(x个z)μ(x个zj个)无功功率,无功功率{μ^(x个z)μ*(x个z)}=Σj个b条j个2(x个z)σ2(x个zj个).

为了简化符号,表示最大值{(K(K)1小时n个1)2(K(K)2小时n个2)2}通过ξ.我们证明了这一点E类{μ^(x个z)μ*(x个z)}=O(运行)(ξ)通过展示Σj个|b条j个(x个z)μ(x个zj个)|O(运行)(ξ). 根据引理2,b条˜j个(x个z)=O(运行)[经验{C类最小值(小时n个11小时n个21)}].自小时n个1=O(运行)(n个ν1)小时n个2=O(运行)(n个ν2)b条˜j个(x个z)=n个1o个(ξ)因此Σj个|b条˜j个(x个z)μ(x个zj个)|=o个(ξ).为了简单起见,我们只展示

j个|1n个1小时n个1H(H)1(|x个x个|小时n个1)d日2μ(x个zj个)|=O(运行)(ξ)
(23)

我们在以下情况下使用案例第页22作为一个例子。因为

1nh型n个j个|H(H)1(|x个x个|小时n个1)经验(ϕ4|zzj个|小时n个2)μ(x个zj个)|=O(运行)(1)
1nh型n个j个|H(H)1(|x个x个|小时n个1)经验(ϕ4|zzj个|小时n个2)δ{|zzj个|(第页2+1)λ˜21/22}μ(x个zj个)|=O(运行)(λ˜21/22)

λ˜21/2=(K(K)2小时n个2)2,平等(23)已被证明。情况发生时第页2>2以及期望的结果,包括d日1可以得到类似的证明。

接下来我们展示一下无功功率,无功功率{μ^(x个z)μ*(x个z)}=o个{(nh型n个)1},即。Σj个b条j个2(x个z)σ2(x个zj个)=o个{(nh型n个)1}。请注意b条j个2(x个z)σ2(x个zj个)可以扩展为单个术语的总和。与之前的分析类似b条j个2(x个z)σ2(x个zj个),双倍总和j个是其中之一O(运行){(nh型n个)1λ˜12/1}O(运行){(nh型n个)1λ˜22/2}、或的顺序较小。

B.2节。定理1的证明

命题1表明三明治平滑器渐近等价于具有乘积核的核回归估计量H(H)1(x个)H(H)2(z)为了确定核估计量的渐近偏差和方差,我们对多元核密度估计量进行了类似于Wand和Jones中的分析(1995). 根据命题1,

E类{μ^(x个z)}=1nh型n个1小时n个2j个μ(x个zj个)H(H)1(x个x个小时n个1)H(H)2(zzj个小时n个2)+O(运行)(ξ)
(24)

我们继续使用符号ξ=最大值{(K(K)1小时n个1)2(K(K)2小时n个2)2}.让

E类{μ^(x个z)}=1nh型n个1小时n个2j个μ(x个zj个)H(H)1(x个x个小时n个1)H(H)2(zzj个小时n个2)+O(运行)(ξ)
(25)

方程式右侧的第一项(25)是的Riemann有限和(小时n个1小时n个2)1μ(u个v(v))×H(H)1{小时n个11(x个u个)}H(H)2{小时n个21(zv(v))}在网格上,而第二项是相同函数的积分,以及μ0(x个z)计算这两个术语之间的差异。μ0(x个z)不是随机的,下面的引理4表明μ0(x个z)=O(运行){最大值(n个12小时n个12n个22小时n个22)}.现在等式(24)成为

E类{μ^(x个z)}=1小时n个1小时n个2μ(u个v(v))H(H)1x个u个小时n个1H(H)2zv(v)小时n个2d日u个 d日v(v)+μ0(x个z)+O(运行)(ξ)=μx个小时n个1u个z小时n个2v(v)H(H)1(u个)H(H)2(v(v))d日u个 d日v(v)+μ0(x个z)+O(运行)(ξ).
(26)

对于方程中的二重积分(26),我们首先采用泰勒级数展开μ(x个小时n个1u个z小时n个2v(v))在(x个z)直到21关于的th偏导数x个22关于的th偏导数z然后我们抵消那些被引理1消失的积分。由此可以得到渐近平均值的显式表达式:

E类{μ^(x个z)}μ(x个z)μ0(x个z)=(1)1+1小时n个12121x个21μ(x个z)+(1)2+1小时n个22222z22μ(x个z)+o个(小时n个121)+o个(小时n个222)+O(运行)(ξ).

对于任意两个随机变量X(X)Y(Y),如果var(Y(Y)) =o个{变量(X(X))},然后是var(X(X)+Y(Y))=变量(X(X))+o个{变量(X(X))}. 因此,通过让X(X)=μ*(x个z)Y(Y)=μ^(x个z)μ*(x个z),我们可以通过命题1得到

无功功率,无功功率{μ^(x个z)}=(nh型n个)1σ2(x个z)H(H)12(u个)d日u个H(H)22(v(v))d日v(v)+o个{(nh型n个)1}.

为了获得最佳收敛速度,让小时n个121/小时n个222小时n个141/(nh型n个)1收敛到一些常数。然后我们有

小时n个1˜小时1n个2/
小时n个2˜小时2n个1/

对于一些正常数小时1小时2(回忆一下=412+1+2.)我们需要选择K(K)1K(K)2以便最大值{(K(K)1小时n个1)2(K(K)2小时n个2)2}=o个(小时n个121)因此,K(K)1˜C类1n个τ1对于某些正常数C类1τ1>(12+2)/同样,K(K)2˜C类2n个τ2对于某些正常数C类2τ2>(12+1)/。很容易验证最大值(n个12小时n个12n个22小时n个22)=o个(小时n个121).

引理3.让G公司(x个)是[0,1]中具有连续二阶导数的实函数。x个=(12)/n个对于= 1,…,n个.假设小时=o个(1) 以及(nh型2)1=o个(1)作为n个→∞. 然后

|1小时01H(H)(x个u个小时)G公司(u个)d日u个1nh型=1n个H(H)(x个x个小时)G公司(x个)|=O(运行)(n个2小时2)

哪里H(H)(x个)在表达式中定义(14).

证明首先要注意H(H)(x个)对称且以1为界。阿尔索H(H)(x个)在(−∞,0]上是无穷可微的,并且所有导数都有界超过(-∞,0]。让L(左)=[(1)/n个/n个]对于= 1,…,n个.假设在不失一般性的情况下最大值u个[01]|G公司(u个)|.我们有

|1小时01H(H)(x个u个小时)G公司(u个)d日u个1nh型=1n个H(H)(x个x个小时)G公司(x个)|=O(运行)(n个2小时2)
(27)

|G公司(u个)G公司(x个)(u个x个)G公司x个(x个)|12(u个x个)2最大值0x个1|2G公司x个2(x个)|
(28)

在不等式的推导中(28),术语O(运行)(n个小时1)以下为

|G公司(u个)G公司(x个)(u个x个)G公司x个(x个)|12(u个x个)2最大值0x个1|2G公司x个2(x个)|

|L(左){G公司(u个)G公司(x个)}d日u个|=|L(左){G公司(u个)G公司(x个)(u个x个)G公司x个(x个)}d日u个|;

术语O(运行)(n个小时2)来自

|1小时{H(H)(x个u个小时)H(H)(x个x个小时)}{G公司(u个)G公司(x个)}|=O(运行)(n个2小时2)

自从|u个x个|n个1当两者同时存在时u个x个在中L(左)注意,我们使用了等式L(左)(u个x个)d日u个=0在上面的推导中,我们稍后也将使用它。组合不等式(27)(28),我们有

|1小时{H(H)(x个u个小时)H(H)(x个x个小时)}{G公司(u个)G公司(x个)}|=O(运行)(n个2小时2)
(29)

为了简单起见,用表示H(H)(1)(x个)H(H)(2)(x个)的一阶和二阶导数H(H)(x个)分别是。类似地,表示为H(H)(1)(0)H(H)(2)(0)的右导数H(H)(x个)位于0。如果x个L(左),然后H(H){小时1(x个u个)}H(H){小时1(x个x个)}=O(运行)(n个1小时1)因此

|1小时L(左){H(H)(x个u个小时)H(H)(x个x个小时)}d日u个|=O(运行)(n个2小时2)如果x个L(左).
(30)

如果x个<(−1)/n个,然后x个L(左).让

H(H)˜(u个x个x个小时)=H(H)(x个u个小时)H(H)(x个x个小时)u个x个小时H(H)(1)(x个x个小时)(u个x个)22小时2H(H)(2)(x个x个小时).

然后H(H)˜(u个x个x个小时)=O(运行)(小时|u个x个|).我们有

|1小时L(左){H(H)(x个u个小时)H(H)(x个x个小时)}d日u个|=|1小时L(左){H(H)(x个u个小时)H(H)(x个x个小时)u个x个小时H(H)(1)(x个x个小时)}d日u个||1小时L(左)(u个x个)22小时2H(H)(2)(x个x个小时)d日u个|+|1小时L(左)H(H)˜(u个x个x个小时)d日u个|12n个2小时2L(左)1小时|H(H)(2)(x个x个小时)|d日u个+O(运行)(n个4小时4).
(31)

我们同样可以证明不等式(31)在以下情况下保持x个>/n个现在,有了不平等(30)(31)

=1n个|1小时L(左){H(H)(x个u个小时)H(H)(x个x个小时)}d日u个|12n个2小时2011小时|H(H)(2)(x个x个小时)|d日u个+O(运行)(n个小时4)+O(运行)(n个2小时2)

完成了引理。

引理4.术语μ0(x个z)在方程式中定义(25)O(运行){最大值(n个12小时n个12n个22小时n个22)}.

证明。为了简化符号,让

G公司2(u个z)=小时n个2101H(H)2{小时n个21(zv(v))}μ(u个v(v))d日v(v)

G公司1(u个z)=(n个2小时n个2)1j个H(H)2{小时n个21(zzj个)}μ(u个zj个)G公司2(u个z).

然后G公司1O(运行)(n个22小时n个22)通过引理3。请注意|μ0(x个z)|由以下项之和限定

|1n个1小时n个1H(H)1(x个x个小时n个1)G公司1(x个z)|
(32)

|1n个1小时n个1j个H(H)1(x个x个小时n个1)G公司2(x个z)1小时n个1H(H)1(x个u个小时n个1)G公司2(u个z)d日u个|.
(33)

因为G公司1O(运行)(n个22小时n个22),表达式(32)也是O(运行)(n个22小时n个22).根据Durrett附录中的定理9.1(2005),2G公司2/u个2存在并且等于小时n个2101H(H)2{小时n个21(zv(v))}2μ(u个v(v))/u个2d日v(v).因此2G公司2/u个2连续且有界。引理3表示(33)O(运行)(n个12小时n个12),这就完成了我们的证明。

B.3节。定理2的证明

表示设计要点{x个z}=1n个由(x个z). 引理2和命题1的证明在装箱数据中的应用Y(Y)˜具有n个1n个2替换为12,我们获得

E类{μ^(x个z)|(x个z)}=(I小时n个)1κE类{˜κ|(x个z)}G公司κ
(34)
无功功率,无功功率{μ^(x个z)|(x个z)}=(I小时n个)2κ无功功率,无功功率{˜κ|(x个z)}G公司κ2
(35)

哪里

G公司κ=H(H)1(x个x个˜κ小时n个1)H(H)2(zz˜小时n个2)+b条κ(x个z)

b条κ(x个z)定义类似于b条j个(x个z)在命题1的证明中n个1n个2替换为12.让n个κ是中的数据点数量(κ)第个箱子。然后

无功功率,无功功率{˜κ|(x个z)}=n个κ2=1n个σ2(x个z)δ{|x个x个˜κ|(21)1|zz˜|(22)1}.

所以无功功率,无功功率{˜κ|(x个z)n个κ}是条件方差函数的Nadaraya–Watson核回归估计量σ2(x个z)(x个˜κz˜)类似地,我们可以证明n个κ/(1)是的核密度估计器(f)(x个z)在(x个˜κz˜)根据核密度估计量和Nadaraya–Watson核回归估计量的一致收敛理论(例如,参见Hansen(2008)),

啜饮κ|n个κ/(新国际1)(f)(x个˜κz˜)|=O(运行)第页[{自然对数(n个)/n个}+2]=o个第页(1)
(36)

啜饮κ|无功功率,无功功率{˜κ|(x个z)n个κ}σ2(x个˜κz˜)|=O(运行)第页[{自然对数(n个)/n个}+2]=o个第页(1).

根据以上两个等式

啜饮κ|n个无功功率,无功功率{˜κ|(x个z)}σ2(x个˜κz˜)(f)(x个˜κz˜)|=o个第页(1).
(37)

对于任何连续函数,通过与命题1的证明类似的论点(x个z)超过[01]2,我们可以推导出

1小时n个κx个˜κz˜G公司κ2=(x个z)H(H)12(u个)d日u个H(H)22(v(v))d日v(v)+o个(1).
(38)

然后,通过等式(35)(37)

|无功功率,无功功率{μ^(x个z)|(x个z)}1nh型n个I小时n个κσ2(x个˜κz˜)(f)(x个˜κz˜)G公司κ2|=o个第页(1)nh型n个I小时n个κG公司κ2=o个第页{(nh型n个)1}.
(39)

通过出租(x个z)=σ2(x个z)/(f)(x个z)在方程式中(38),我们从方程中导出(39)那个

无功功率,无功功率{μ^(x个z)|(x个z)}=1nh型n个(x个z)(f)(x个z)+o个第页{(nh型n个)1}
(40)

哪里(x个z)在方程式中定义(17).我们可以写E类{˜κ|(x个z)}作为

E类{˜κ|(x个z)}=(n个κ)1=1n个μ(x个z)δ{|x个x个˜κ|(21)1|zz˜|(22)1}.

平等(36)意味着每个箱子都是非空的,所以通过泰勒级数展开μ(x个zj个)(x个˜κz˜)我们从上面的方程中得出

啜饮κ|E类{˜κ|(x个z)}μ(x个˜κz˜)|=O(运行)第页(1/2).

其次是平等(34)那个

|E类{μ^(x个z)|(x个z)}1I小时n个κμ(x个˜κz˜)G公司κ|=O(运行)第页(1/2)1I小时n个κ|G公司κ|=O(运行)第页(1/2).
(41)

很容易证明

1I小时n个κμ(x个˜κz˜)G公司κ=μ(x个z)+n个21×22/μ˜(x个z)+o个(n个21×22/)

哪里μ˜(x个z)在方程式中定义(16).根据平等原则(41)假设˜c(c)n个τ具有τ>412/

E类{μ^(x个z)|(x个z)}=μ(x个z)+n个21×22/μ˜(x个z)+o个第页(n个21×22/).
(42)

使用方程式(40)(42),我们可以证明

n个21×22/[μ^(x个z)E类{μ^(x个z)|(x个z)}]N个{0(x个z)/(f)(x个z)}
(43)

分配和

n个21×22/[E类{μ^(x个z)|(x个z)}μ(x个z)]=μ˜(x个z)+o个第页(1).
(44)

平等(43)(44)一起证明定理2。

本文根据牛津大学出版社标准期刊出版模式的条款出版和发行(https://academic.oup.com/journals/pages/open_access/funder_policies/chorus/standard_publication_model)