总结
我们使用累积量导出小波回归估计的贝叶斯可信区间。估计后验分布的前四个累积量用观测数据和母小波函数的整数幂表示。这些幂可以通过适当精细尺度的小波尺度函数的线性组合进行近似。因此,对离散小波变换进行适当的修改可以有效地找到任意给定数据集的后验累积量。然后约翰逊变换本身就产生了可信区间。仿真表明,这些区间具有良好的覆盖率,即使底层函数是非均匀的,标准方法也会失败。在曲线平滑的情况下,区间的性能与已建立的非参数回归方法相比仍具有竞争力。
1.简介
考虑函数的估计克从观测数据向量年=(年1,…,年n个)′令人满意的
哪里t吨我=我/n个和ɛ我是独立的N个(0,Σ2)分布式。估计光滑函数有很多方法克诸如样条线平滑(Green和Silverman,1994)核估计(Wand和Jones,1995)和局部多项式回归(Fan和Gijbels,1996). 在大多数情况下,这种点估计可以由具有某些特定标称覆盖概率或显著性水平的区间估计来补充。
估计非均匀性的最新建议克是小波阈值化(Donoho和Johnstone,1994,1995). 代表克就小波基而言,它通常是稀疏的,将数据中的大多数信号集中到几个大系数中,而由于小波基的正交性,噪声在系数中“均匀”传播。数据通过某种阈值规则进行去噪,以丢弃“小”系数,并保留被认为包含信号的那些系数(可能需要进行一些修改)。
一些研究人员描述了贝叶斯小波阈值规则,将先验分布置于小波系数上。我们考虑一种方法来近似每个变量的后验分布克(t吨我)使用与阿布拉莫维奇的贝叶斯阈值法相同的先验等。(1998). 然后可以计算任何标称覆盖概率的后验概率区间。我们的方法也可以应用于其他贝叶斯小波阈值规则,例如Chipman和Wolfson调查的那些规则(1999)阿布拉莫维奇和萨帕蒂纳斯(1999)和维达科维奇(1998).
我们简要回顾了第节中用于曲线估计的小波阈值方法2包括两种贝叶斯小波阈值化方法。在节中三,我们推导了估计后验分布的波带方法克(t吨我)给出了观测数据。我们在第节中给出了一个示例和仿真结果4并在第节中作一些总结5实现WaveBand方法和附带代码的S-PLUS函数可以从http://www.blackwellpublishers.co.uk/rss/
(或http://www.stats.bris.ac.uk/wavethresh).
2.小波与小波阈值
2.1. 小波
小波提供了多种正交基𝕃2(ℝ),上的平方可积函数的空间ℝ; 每个基都是由一个标度函数生成的,用φ表示(t吨),以及相关的母小波ψ(t吨). 小波基由这些函数的伸缩和平移组成。对于j个,k个∈ℤ,水平上的小波j个和位置k个由提供
(1)
φ的类似定义jk公司(t吨). 尺度函数有时被称为父小波,但我们避免使用这个术语。A函数克(t吨)∈𝕃2(ℝ)可以表示为
(2)
具有.
道贝奇人(1992)描述了两类小波基,它们给出了一般函数集的稀疏表示。(技术上,通过选择一个具有适当性质的小波ψ,我们可以为一大组函数空间生成一个无条件小波基;有关详细信息,请参阅Abramovich等。(1998) .) 通常克由少量粗尺度(低水平)系数表示,而局部不均匀特征,如高频事件、尖点和不连续性,由更精细尺度(更高水平)或所有尺度的系数表示。
对于非参数回归问题,我们有离散数据,因此考虑离散小波变换(DWT)。给定一个列向量克=(克1,…,克n个)′,其中克我=克(t吨我),DWT克是d日=W公司克,其中W公司是正交的n个×n个矩阵和d日是离散比例系数的向量c(c)0,0和n个−1离散小波系数{d日j个,k个:j个=0,…,J−1,k个=0,…,2j个−1}. 这些类似于方程中的系数(2),使用和.我们的数据仅限于[0,1],需要边界条件;我们假设克在边界处是周期性的。其他边界条件包括以下假设:克反映在边界上,或科恩的“区间小波”变换等。(1993)可以使用。
Mallat的金字塔算法(1989)计算d日在里面O(运行)(n个)操作,前提是n个=2J,J∈ℕ该算法迭代地计算{c(c)j个,k个}和{d日j个,k个}来自{c(c)j个+1,k个}。从向量d日逆DWT(IDWT)可用于重建原始数据。IDWT从整体缩放和小波系数开始c(c)0,0和d日0,0并重建{c(c)1,k个}; 然后,它迭代地进行到更精细的级别,重建{c(c)j个+1,k个}来自{c(c)j个,k个}和{d日j个,k个}.
2.2. 基于小波阈值的曲线估计
由于DWT是正交变换,因此数据域中的白噪声被变换为小波域中的白噪声。如果d日是的DWT克、和d日*=(c(c)0,0*,d日0,0*,…,d日J−1,2J−1−1*)′通过将DWT应用于数据而获得的经验系数向量年,然后d日*=d日+ ɛ′,其中ɛ′是的向量n个独立的N个(0,Σ2)变量。小波阈值隐式假设大小d日j个,k个*分别表示信号和噪声。提出了各种阈值规则来确定哪些系数大哪些系数小;见维达科维奇(1999)或者阿布拉莫维奇等。(2000)以供审查。真实系数d日通过对经验系数应用阈值规则进行估计d日*获取估计值,以及采样的函数值克通过应用IDWT进行估算,以获得哪里W公司′表示的转置W公司; 象征性地,我们可以将这个IDWT表示为和
(3)
所得曲线估计的置信区间在小波文献中受到了一些关注。贿赂者(1994)导出了var的一个估计当小波分解涉及Haar小波和Brillinger时(1996)表明了这一点在某些条件下是渐近正态的。布鲁斯和果阿(1996)var估计的推广对于非Haar小波的情况,使用的渐近正态性给出了大约100(1-α)%的置信区间.奇普曼等。(1997)给出了其自适应贝叶斯小波收缩方法的近似可信区间,我们将在第节中进行讨论2.3.2而Picard和Tribouley(2000)导出了小波阈值估计的偏差校正置信区间。
2.3. 贝叶斯小波回归
2.3.1. 介绍
一些研究人员提出了贝叶斯小波回归估计,涉及小波系数的先验d日j个,k个,由观测系数更新d日j个,k个*获得后验分布[d日j个,k个|d日j个,k个*]. 点估计值可以根据这些后验分布和用于估计的IDWT计算克以上述常见方式。一些建议包括∑的先验信息2; 我们仅限于∑2可以从数据中很好地估计。
大多数贝叶斯小波收缩规则都使用混合分布作为系数的先验信息,以模拟小部分系数包含大量信号的概念。奇普曼等。(1997)和克劳斯等。(1998)考虑两个正态分布的混合,而阿布拉莫维奇等。(1998),克莱德等。(1998)克莱德和乔治(2000)使用了法向质量和点质量的混合物。其他建议包括点质量和t吨-Vidakovic使用的分发(1998)以及Holmes和Denison考虑的正态分布的无限混合(1999). 奇普曼和沃尔夫森进行了更彻底的审查(1999)阿布拉莫维奇和萨帕蒂纳斯(1999).
2.3.2. 自适应贝叶斯小波收缩
Chipman的自适应贝叶斯小波收缩(ABWS)方法等。(1997)在每个之前放置一个独立的d日j个,k个:
(4)
其中γj个,k个~伯努利(对j个); 超参数对j个,c(c)j个和νj个通过经验贝叶斯方法从数据中确定。在水平面j个,非零系数的比例表示为对j个,而νj个和c(c)j个¦Αj个分别表示可忽略系数和不可忽略系数的大小。
鉴于d日j个,k个,经验系数为d日j个,k个*∼N个(d日j个,k个,Σ2)独立,所以后向分布[d日j个,k个|d日j个,k个*]是两种正常成分的混合物,每种成分独立(j个,k个). 奇普曼等。(1997)使用此混合物的平均值作为其估计值并类似地使用了[d日j个,k个|d日j个,k个*]近似其ABWS估计值的方差克根据后验分布平均值估计每个系数是贝叶斯规则𝕃2损失函数。他们绘制了。这些频带有助于表示估计中的不确定性但是基于正常的假设是具有混合分布的随机变量的总和。
2.3.3. 贝叶斯阈值
阿布拉莫维奇的贝叶斯阈值法等。(1998)还对系数设置独立的先验值:
(5)
其中0≤对j个≤1且δ(0)是零处的概率质量。这是ABWS之前的一个极限情况(4)。
假设超参数的形式为τj个2=2−αj个C类1和对j个=最小值(1,2−βj个C类2)对于非负常数C类1和C类2根据经验从数据和用户选择的α和β中选择。阿布拉莫维奇等。(1998)表明α和β的选择对应于在某些Besov空间中选择先验值,并结合了关于平滑度的先验知识克(t吨)在前面。奇普曼和沃尔夫森(1999)还讨论了α和β的解释。在没有任何此类事先知情的情况下,阿布拉莫维奇等。(1998)表明默认选择α=0.5和β=1对不同平滑度的克(t吨). 通过在标度系数上放置一个非信息性先验值来完成先前的规范c(c)0,0因此具有后验分布N个(c(c)0,0*,Σ2),由估算c(c)0,0*.
由此产生的后验分布d日j个,k个给定的观测值d日j个,k个*每个都是独立的(j个,k个)并由给出
(6)
其中ωj个,k个=(1+ξj个,k个)−1,使用
和第页j个2=τj个2/(Σ2+τj个2). 贝叶斯阈值方法将𝕃1-小波域的后验中值损失[d日j个,k个|d日j个,k个*]作为点估计; 阿布拉莫维奇等。(1998)表明这给出了一个与级别相关的真正阈值规则。BayesThresh方法在S-PLUS(Nason,1998).
3.波段
3.1. 回归曲线的后验累积量
我们现在考虑[克我|年]对于每个我=1,…,n个.根据方程式(三),我们看到了[克我|年]是小波系数和缩放系数的后验函数的卷积,
(7)
这是一种复杂的混合物,无法进行分析评估。从后部进行直接模拟非常耗时。相反,我们估计了方程的前四个累积量(7)并拟合与这些值匹配的分布。评估的累积量[克我|年]需要使用小波的幂ψj个,k个第页(t吨)的第页=2,3,4,我们在第节中讨论3.2。然后,我们将参数分布拟合到[克我|年]在第节中3.3.
如果随机变量的动量生成函数X(X)已写入M(M)X(X)(t吨),则累积生成函数为KX(X)(t吨)=对数{M(M)X(X)(t吨)}. 我们写κ第页(X(X))对于第页第个累积量X(X),由第页的th导数KX(X)(t吨),评估时间t吨=0.注意,第一个第页矩唯一地决定第一个第页累积量,反之亦然。有关累积量及其性质和用途的更多详细信息,请参阅巴恩多夫-尼尔森和考克斯(1989)或斯图亚特和奥德(1994),第3章。
前四个累积量都有直接的解释;κ1(X(X))和κ2(X(X))是的平均值和方差X(X)分别,而β1=κ三(X(X))/κ23/2(X(X))是偏斜度和β2=κ4(X(X))/κ22(X(X))+3是峰度。如果X(X)正态分布,然后κ三(X(X))和κ4(X(X))为0。我们利用了累积量的两个标准性质。如果X(X)和Y(Y)是独立的随机变量一和b条是实常数,那么
(8)
和
(9)
应用方程式(8)和(9)到方程式(7),我们可以看到[克我|年]由提供
(10)
一旦小波系数的累积量已知,当第页=1,但对于第页=2,3,4计算涉及小波的幂。
使用贝叶斯阈值的小波系数的后验分布(6)的形式如下Z轴∼二甲苯+(1−对)δ(0),其中X(X)∼N个(μ,μ)2), 0≤对≤1,δ(0)是零处的点质量。然后𝔼(Z轴第页)=对 𝔼(X(X)第页)所以很容易得到分布(6)的矩。根据这些,我们可以导出[d日j个,k个|d日j个,k个*]:
由于缩放系数c(c)0,0具有正态后验分布,前两个累积量为κ1(c(c)0,0|c(c)0,0*)=c(c)0,0*和κ2(c(c)0,0|c(c)0,0*)=Σ2; 所有高阶累积量均为0。
3.2. 小波的幂
方程之间的平行性(10)IDWT计算的和(3)很清楚,我们将描述一种利用高效IDWT算法计算表达式(10)的方法。对于Haar小波,这是微不足道的;Haar尺度函数和母小波为φ(t吨)=我(0≤t吨<1)和,其中我(●)是指示函数;因此ψ三(t吨)=ψ(t吨)和ψ2(t吨)=ψ4(t吨)=φ(t吨). 此外,ψj个,k个2(t吨)=2j个/2φj个,k个(t吨), ψj个,k个三(t吨)=2j个ψj个,k个(t吨)和ψj个,k个4(t吨)=2三j个/2φj个,k个(t吨),可包含在包含缩放函数系数的IDWT算法的修改版本中的所有术语。因为代表ψj个,k个第页(t吨)通过标度函数和小波在Haar情况下的工作,我们考虑了其他小波基的类似方法。
跟随Herrick(2000)第69页,我们近似一个一般的小波ψj个0,0第页(0≤j个0≤J−米)由
(11)
对于第页=2,3,4,其中米是一个正整数;选择米稍后讨论。我们使用尺度函数而不是小波作为给定水平上尺度函数集的跨度j个与φ的并集相同(t吨)以及0、1、…、,…,j个−1.此外,如果缩放函数φj个,k个(t吨)用于近似某些函数小时(t吨),以及φ和小时至少有v(v)导数,则近似中的均方误差有界于2−虚拟机C类,其中C类是某个正常数;比如看维达科维奇(1999),第87页。
近似ψj个0,k个第页(t吨)对于一些固定的j个0,我们首先计算ψj个0,0第页使用级联算法(Daubechies(1992),第205页),然后取ψ的DWTj个0,0第页并设置系数{e(电子)米0,我}等于缩放函数系数{c(c)米0,k个}在水平面上米0,其中米0=j个0+米回想一下j个只是彼此的转换;根据方程式(1)ψj个,k个(t吨)=ψj个,0(t吨−2−j个k个); 因此
(12)
当我们假设周期性边界条件时{e(电子)米0,我}可以定期循环。
由于小波的局部化性质,系数{e(电子)米0+1,我}用于近似ψj个0+1,0第页(t吨)可以通过插入2找到米0向量的零{e(电子)米0,我}:
近似(11)不能用于米最佳水平J−米,…,J−1.我们用尺度函数和小波在最精细的层次上表示这些小波J−1,使用上述块移位技术使计算更加高效。
在我们检查过的所有案例中,米=3已经足够用于高精度近似;示例如图1和图2所示。考虑用两个消失矩逼近Daubechies极值相位小波的幂;该小波是非常非光滑的,因此可以被视为近似的最坏情况。图。1(a) 显示ψ3,3(t吨),而图1(b)-1(d)显示了近似值中的均方误差除以𝕃2-被近似函数的范数,
对于第页分别=2,3,4。在图1(b)-1(d)中的每一个图中,垂直线都处于分辨率水平j个0=3,被估计功率的小波存在的水平。近似值非常适合米0=j个0+每种情况下3个,在级别上几乎没有改进米0=j个0+4.
图1
(a) 具有两个消失矩ψ的Daubechies极值相位小波3,3(t吨)以及估计ψ的准确性3,3第页对于(b)第页=2(c)第页=3和(d)第页=4,按级别缩放函数米0(估计值的均方误差除以ψ的范数3,3第页,是针对米0; 垂直线位于标高3,即ψ所在的标高3,3存在)
图。2显示了Daubechies最小非对称小波的幂的近似,以八个消失矩作为近似水平米0增加。同样,基小波处于水平j个0=3,并且显示了米0=j个0+1(图2(a)–2(c)),米0=j个0+2(图2(d)-2(f))和米0=j个0+3(图2(g)-2(i))。在每种情况下,完整曲线是小波功率,虚线是近似值。
图2
具有八个消失矩的Daubechies最小非对称小波的逼近(--,小波幂;…..,使用水平尺度函数的逼近米0(原始小波处于水平j个0=3):(a)第页=2,米0=4; (b)第页=3,米0=4; (c)第页=4,米0=4; (d)第页=2,米0=5; (e)第页=3,米0=5; (f)第页=4,米0=5; (g)第页=2,米0=6;(h)第页=3,米0=6; (i)第页=4,米0=6
使用近似(12),我们现在可以重写方程(10)作为
适用系数ρj个,k个,并使用包含缩放函数系数的IDWT算法的修改版本来计算此和。
3.3. 回归曲线的后验分布
我们现在必须估计[克我|年]从其累积量来看。埃奇沃斯展开在分布的尾部给出了较差的结果,我们需要一个很好的近似。鞍点展开改进了这一点,但需要累积生成函数K[克我|年](第页),而我们只有前四个累积量。因此,我们近似[克我|年]通过适当的参数分布。
我们使用Johnson提出的分布集合(1949)它由标准正态分布的三个变换组成。对于√β的任何可能值1和β2,只有一条约翰逊曲线具有指定的偏度和峰度(例如,请参见约翰逊曲线等。(1994)第1章或斯图亚特和奥德(1994),第6章)。因此,对于每个点克我=克(t吨我),有一条独特的约翰逊曲线,其前四个累积量与后验分布相同[克我|年].
除正态分布外,约翰逊曲线可分为三类,
- (a)
对数正态分布(S公司我),z(z)=γ+δ对数(x个-ξ),带ξ<x个,
- (b)
无界的(S公司单位),z(z)=γ+δsinh−1{(x个-ξ)/λ},以及
- (c)
有界的(S公司B类),z(z)=γ+δ对数{(x个−ξ)/(ξ+λ−x个)},带ξ<x个<ξ+λ,
其中,et al(1976)添加了一个极限情况S公司B类-曲线,其中κ三=√(κ4+2) ,称为S公司T型-曲线。在每种情况下z(z)具有标准正态分布,而x个是约翰逊变量。约翰逊曲线提供了与众所周知的皮尔逊曲线一样丰富的分布族,并且具有易于使用的软件的实际优势(等。,1976). 如等人所述(1976)在我们的例子中,当从理论上计算分布的矩时,以效率低下为由逐矩拟合曲线的标准反对意见并不适用。Johnson曲线的百分比点可以使用Hill的算法进行计算(1976).
4.示例和仿真结果
4.1. 例子
我们将我们的WaveBand方法应用于Nason和Silverman的分段多项式测试函数(1994)取样日期n个=512个数据点t吨我=我/512用于我=1,…,512. 此函数定义为
如图所示。三(全曲线)。图。三还显示了将独立的正态分布噪声添加到克对(t吨). 噪声具有平均值0和根信噪比rsnr 3;rsnr定义为数据点标准偏差的比率克对(t吨我)噪声的标准偏差∑。
图3
分段多项式信号(--)的逐点99%波段间隔估计值(…..):•,数据n个=512个等距点,加上独立的正态分布噪声,平均值为0,rsnr=3
图中的虚线曲线。三标记99%可信区间的上下端点克对(t吨我)对于每个t吨我使用我们的WaveBand方法,使用默认参数α=0.5和β=1,以及Daubechies的具有八个消失矩的最小非对称小波进行计算。在本例中,可信区间包括克对(t吨我)512例中490例的经验覆盖率为95.7%。波段中出现的短暂峰值是由于区间对数据中异常值的敏感性;它们可以通过使用不同的α和β来平滑,但这有可能使数据过于平滑。例如,低波段的尖峰t吨=0.9是由峰值正下方的单个数据点引起的,而之前的三个波动集t吨=0.6是由于两个高数据点。用真正的函数值替换这些异常值完全消除了这些尖峰。
我们现在考虑偏度和峰度测量√β1=κ三/κ23/2和β2= 3+κ4/κ22; 作为参考,一个正态随机变量有√β1=0和β2=3.图。4显示方差的估计值,|√β1|和β2第页,共页[克对(t吨我)|年]对于每个点t吨我,以对数标度绘制。除了在t吨=0.5. 对于的许多值t吨我,后向分布[克对(t吨我)|年]具有显著的偏度和峰度;√β的值1范围约为−7.9至7.5,β2从大约1.7到几乎120,这表明,对于一些t吨我后分布有重尾。(为了进行比较F类6,4-分布有√β1=7.1和峰度β2=79.)先验(5)具有峰度3/对j个:注意,在我们的示例中,峰度的最大值出现在函数平滑时;在这些情况下,大多数小波系数为0,因此对j个很小。
图4
(a) 方差,(b)|√β1|和(c)β2如图3所示,以对数标度绘制
4.2. 仿真结果
4.2.1、。非均匀信号
我们通过模拟Nason和Silverman的分段多项式示例来研究我们的波段可信区间的性能(1994)(表示为“PPoly”)和Donoho和Johnstone的标准“Blocks”、“Bumps”、《Doppler》和《HeaviSine》测试功能(1994),如图所示。5对于每个测试函数,100个长度为n个=1024,rsnr=4,在每个数据点评估波段和ABWS可信区间,标称覆盖概率分别为0.90、0.95和0.99。波带使用默认超参数α=0.5和β=1,这两种方法都使用Daubechies的具有八个消失矩的最小非对称小波。表1显示所有点的平均覆盖率和间隔宽度t吨我以及100次复制,括号中显示了标准错误。在每种情况下,波段间隔都具有较高的经验覆盖率,尽管仍低于标称覆盖概率。波段间隔的平均宽度大于ABWS间隔;一个原因是ABWS方法通常具有较低的估计方差。此外[克我|年]正如我们在前面的例子中看到的那样,尾部通常比正态分布更重。
图5
Nason和Silverman的分段多项式(1994)以及Donoho和Johnstone的测试功能(1994)
方法. | 以下标称覆盖概率的覆盖率和间隔宽度:. |
---|
. | 0.90. | 0.95. | 0.99. |
---|
. | CR公司. | 宽度. | CR公司. | 宽度. | CR公司. | 宽度. |
---|
PP聚乙烯 | | | | | | |
世界银行 | 0.804 (0.006) | 0.532 (0.004) | 0.892 (0.004) | 0.685 (0.003) | 0.966 (0.002) | 1.084 (0.005) |
ABWS公司 | 0.657 (0.010) | 0.408 (0.005) | 0.728 (0.009) | 0.486 (0.006) | 0.828 (0.008) | 0.638 (0.007) |
阻碍 | | | | | | |
世界银行 | 0.825 (0.003) | 1.536 (0.005) | 0.899 (0.002) | 1.246 (0.004) | 0.971 (0.001) | 2.202 (0.007) |
ABWS公司 | 0.775(0.004) | 1.121 (0.004) | 0.842 (0.003) | 1.325 (0.005) | 0.923 (0.002) | 1.741 (0.006) |
碰撞 | | | | | | |
世界银行 | 0.865 (0.002) | 1.357 (0.004) | 0.927 (0.001) | 1.676 (0.004) | 0.980(0.001) | 2.408 (0.006) |
ABWS公司 | 0.735 (0.003) | 1.107 (0.003) | 0.810(0.003) | 1.319 (0.004) | 0.904 (0.002) | 1.733 (0.005) |
多普勒 | | | | | | |
世界银行 | 0.847 (0.004) | 0.966 (0.004) | 0.911 (0.002) | 0.765 (0.003) | 0.965 (0.001) | 1.460 (0.005) |
ABWS公司 | 0.808 (0.005) | 0.693 (0.004) | 0.871 (0.004) | 0.827 (0.005) | 0.936 (0.002) | 1.090 (0.006) |
海维辛 | | | | | | |
世界银行 | 0.749 (0.009) | 0.487 (0.005) | 0.851 (0.007) | 0.629 (0.004) | 0.952 (0.003) | 0.997(0.006) |
ABWS公司 | 0.613 (0.011) | 0.371 (0.005) | 0.684 (0.010) | 0.442 (0.006) | 0.790 (0.009) | 0.581 (0.008) |
方法. | 以下标称覆盖概率的覆盖率和间隔宽度:. |
---|
. | 0.90. | 0.95. | 0.99. |
---|
. | CR公司. | 宽度. | CR公司. | 宽度. | CR公司. | 宽度. |
---|
聚乙烯 | | | | | | |
世界银行 | 0.804 (0.006) | 0.532 (0.004) | 0.892 (0.004) | 0.685 (0.003) | 0.966(0.002) | 1.084 (0.005) |
ABWS公司 | 0.657 (0.010) | 0.408 (0.005) | 0.728 (0.009) | 0.486 (0.006) | 0.828 (0.008) | 0.638 (0.007) |
阻碍 | | | | | | |
世界银行 | 0.825 (0.003) | 1.536 (0.005) | 0.899 (0.002) | 1.246 (0.004) | 0.971 (0.001) | 2.202 (0.007) |
ABWS公司 | 0.775 (0.004) | 1.121 (0.004) | 0.842 (0.003) | 1.325 (0.005) | 0.923 (0.002) | 1.741 (0.006) |
碰撞 | | | | | | |
世界银行 | 0.865 (0.002) | 1.357(0.004) | 0.927 (0.001) | 1.676 (0.004) | 0.980 (0.001) | 2.408 (0.006) |
ABWS公司 | 0.735 (0.003) | 1.107 (0.003) | 0.810 (0.003) | 1.319 (0.004) | 0.904(0.002) | 1.733 (0.005) |
多普勒 | | | | | | |
世界银行 | 0.847 (0.004) | 0.966 (0.004) | 0.911 (0.002) | 0.765(0.003) | 0.965 (0.001) | 1.460 (0.005) |
ABWS公司 | 0.808 (0.005) | 0.693 (0.004) | 0.871 (0.004) | 0.827 (0.005) | 0.936 (0.002) | 1.090 (0.006) |
海维辛 | | | | | | |
世界银行 | 0.749 (0.009) | 0.487 (0.005) | 0.851 (0.007) | 0.629 (0.004) | 0.952 (0.003) | 0.997 (0.006) |
ABWS公司 | 0.613 (0.011) | 0.371 (0.005) | 0.684 (0.010) | 0.442 (0.006) | 0.790 (0.009) | 0.581(0.008) |
方法. | 以下标称覆盖概率的覆盖率和间隔宽度:. |
---|
. | 0.90. | 0.95. | 0.99. |
---|
. | CR公司. | 宽度. | CR公司. | 宽度. | CR公司. | 宽度. |
---|
PP聚乙烯 | | | | | | |
世界银行 | 0.804(0.006) | 0.532 (0.004) | 0.892 (0.004) | 0.685 (0.003) | 0.966 (0.002) | 1.084(0.005) |
ABWS公司 | 0.657 (0.010) | 0.408 (0.005) | 0.728 (0.009) | 0.486 (0.006) | 0.828 (0.008) | 0.638 (0.007) |
阻碍 | | | | | | |
世界银行 | 0.825 (0.003) | 1.536 (0.005) | 0.899 (0.002) | 1.246 (0.004) | 0.971 (0.001) | 2.202 (0.007) |
ABWS公司 | 0.775 (0.004) | 1.121 (0.004) | 0.842 (0.003) | 1.325 (0.005) | 0.923 (0.002) | 1.741 (0.006) |
碰撞 | | | | | | |
世界银行 | 0.865 (0.002) | 1.357 (0.004) | 0.927(0.001) | 1.676 (0.004) | 0.980 (0.001) | 2.408 (0.006) |
ABWS公司 | 0.735 (0.003) | 1.107 (0.003) | 0.810 (0.003) | 1.319 (0.004) | 0.904 (0.002) | 1.733(0.005) |
多普勒 | | | | | | |
世界银行 | 0.847 (0.004) | 0.966 (0.004) | 0.911 (0.002) | 0.765 (0.003) | 0.965(0.001) | 1.460 (0.005) |
ABWS公司 | 0.808 (0.005) | 0.693 (0.004) | 0.871 (0.004) | 0.827 (0.005) | 0.936 (0.002) | 1.090 (0.006) |
海维辛 | | | | | | |
世界银行 | 0.749 (0.009) | 0.487 (0.005) | 0.851 (0.007) | 0.629 (0.004) | 0.952 (0.003) | 0.997 (0.006) |
ABWS公司 | 0.613 (0.011) | 0.371 (0.005) | 0.684 (0.010) | 0.442 (0.006) | 0.790 (0.009) | 0.581 (0.008) |
方法. | 以下标称覆盖概率的覆盖率和间隔宽度:. |
---|
. | 0.90. | 0.95. | 0.99. |
---|
. | CR公司. | 宽度. | CR公司. | 宽度. | CR公司. | 宽度. |
---|
PP聚乙烯 | | | | | | |
世界银行 | 0.804 (0.006) | 0.532 (0.004) | 0.892 (0.004) | 0.685 (0.003) | 0.966 (0.002) | 1.084 (0.005) |
ABWS公司 | 0.657(0.010) | 0.408 (0.005) | 0.728 (0.009) | 0.486 (0.006) | 0.828 (0.008) | 0.638(0.007) |
阻碍 | | | | | | |
世界银行 | 0.825 (0.003) | 1.536 (0.005) | 0.899 (0.002) | 1.246 (0.004) | 0.971 (0.001) | 2.202 (0.007) |
ABWS公司 | 0.775 (0.004) | 1.121 (0.004) | 0.842 (0.003) | 1.325 (0.005) | 0.923 (0.002) | 1.741 (0.006) |
碰撞 | | | | | | |
世界银行 | 0.865 (0.002) | 1.357 (0.004) | 0.927 (0.001) | 1.676 (0.004) | 0.980 (0.001) | 2.408 (0.006) |
ABWS公司 | 0.735 (0.003) | 1.107 (0.003) | 0.810(0.003) | 1.319 (0.004) | 0.904 (0.002) | 1.733 (0.005) |
多普勒 | | | | | | |
世界银行 | 0.847 (0.004) | 0.966 (0.004) | 0.911 (0.002) | 0.765 (0.003) | 0.965 (0.001) | 1.460 (0.005) |
ABWS公司 | 0.808 (0.005) | 0.693 (0.004) | 0.871 (0.004) | 0.827 (0.005) | 0.936(0.002) | 1.090 (0.006) |
海维辛 | | | | | | |
世界银行 | 0.749 (0.009) | 0.487 (0.005) | 0.851 (0.007) | 0.629 (0.004) | 0.952 (0.003) | 0.997 (0.006) |
ABWS公司 | 0.613 (0.011) | 0.371 (0.005) | 0.684 (0.010) | 0.442 (0.006) | 0.790 (0.009) | 0.581 (0.008) |
相对于ABWS方法,随着标称覆盖率的增加,波段间隔的性能也会提高。这是我们方法的一个令人满意的方面。WaveBand方法更善于对后验分布的极端尾部进行建模,因为它考虑了更高的矩。
图。6更详细地检查了名义99%可信区间的经验覆盖率。完整曲线表示每个波段间隔的经验覆盖率t吨我,虚线曲线给出了ABWS间隔的等效结果。每个信号的覆盖范围差异很大;不出所料,在信号更平滑、变化更少的地方,覆盖率会更好。这在分段多项式和HeaviSine测试函数的结果中可以最清楚地看到,在不连续性附近,性能急剧下降,多普勒信号的低频部分和凹凸信号的长常量部分覆盖良好。
图6
测试函数(a)分段多项式,(b)块,(c)凸点,(d)多普勒和(e)Heavisine的标称99%区间估计的经验覆盖率在n个=1024个等间距点(在每种情况下,使用100个rsnr=4的模拟数据集):--,WaveBand方法。,ABWS方法
4.2.2. 平滑信号
小波阈值作为一种非参数回归技术的主要优点是能够对非均匀信号建模,如第节所述4.2.1然而,小波阈值也可以成功地用于平滑信号,现在我们考虑这样一个例子,函数克秒(t吨)=正弦(2πt吨)+2(t吨−0.5)2.表2显示了ABWS和WaveBand可信区间的性能以及使用平滑样条的置信区间克秒(t吨).
方法. | 以下标称覆盖概率的覆盖率和间隔宽度:. |
---|
. | 0.90. | 0.95. | 0.99. |
---|
. | CR公司. | 宽度. | CR公司. | 宽度. | CR公司. | 宽度. |
---|
参考号=2 | | | | | | |
世界银行1 | 0.939 (0.008) | 0.300 (0.002) | 0.970 (0.005) | 0.358 (0.003) | 0.990 (0.003) | 0.471 (0.004) |
世界银行2 | 0.906 (0.009) | 0.229 (0.003) | 0.960 (0.006) | 0.344 (0.003) | 0.990 (0.002) | 0.530 (0.004) |
样条曲线 | 0.886 (0.012) | 0.250 (0.004) | 0.942(0.008) | 0.298 (0.005) | 0.980 (0.004) | 0.391 (0.007) |
ABWS公司 | 0.557 (0.017) | 0.166 (0.006) | 0.617 (0.017) | 0.198 (0.007) | 0.706 (0.017) | 0.260(0.009) |
参考号=4 | | | | | | |
世界银行1 | 0.913 (0.009) | 0.153 (0.001) | 0.945(0.007) | 0.183 (0.002) | 0.989 (0.003) | 0.241 (0.002) |
世界银行2 | 0.850 (0.010) | 0.143 (0.002) | 0.919 (0.007) | 0.181 (0.002) | 0.981 (0.002) | 0.276 (0.002) |
样条曲线 | 0.878 (0.011) | 0.133 (0.002) | 0.934 (0.008) | 0.159 (0.002) | 0.979 (0.005) | 0.209 (0.003) |
ABWS公司 | 0.493 (0.016) | 0.078 (0.003) | 0.550 (0.016) | 0.093 (0.003) | 0.643 (0.017) | 0.122 (0.004) |
方法. | 以下标称覆盖概率的覆盖率和间隔宽度:. |
---|
. | 0.90. | 0.95. | 0.99. |
---|
. | CR公司. | 宽度. | CR公司. | 宽度. | CR公司. | 宽度. |
---|
参考号=2 | | | | | | |
世界银行1 | 0.939 (0.008) | 0.300 (0.002) | 0.970 (0.005) | 0.358 (0.003) | 0.990 (0.003) | 0.471 (0.004) |
世界银行2 | 0.906 (0.009) | 0.229(0.003) | 0.960 (0.006) | 0.344 (0.003) | 0.990 (0.002) | 0.530 (0.004) |
样条曲线 | 0.886(0.012) | 0.250 (0.004) | 0.942 (0.008) | 0.298 (0.005) | 0.980 (0.004) | 0.391 (0.007) |
ABWS公司 | 0.557 (0.017) | 0.166 (0.006) | 0.617 (0.017) | 0.198 (0.007) | 0.706 (0.017) | 0.260 (0.009) |
参考号=4 | | | | | | |
世界银行1 | 0.913 (0.009) | 0.153 (0.001) | 0.945 (0.007) | 0.183 (0.002) | 0.989 (0.003) | 0.241 (0.002) |
世界银行2 | 0.850 (0.010) | 0.143 (0.002) | 0.919(0.007) | 0.181 (0.002) | 0.981 (0.002) | 0.276 (0.002) |
样条曲线 | 0.878 (0.011) | 0.133 (0.002) | 0.934 (0.008) | 0.159 (0.002) | 0.979 (0.005) | 0.209 (0.003) |
ABWS公司 | 0.493 (0.016) | 0.078 (0.003) | 0.550 (0.016) | 0.093 (0.003) | 0.643(0.017) | 0.122 (0.004) |
方法. | 以下标称覆盖概率的覆盖率和间隔宽度:. |
---|
. | 0.90. | 0.95. | 0.99. |
---|
. | CR公司. | 宽度. | CR公司. | 宽度. | CR公司. | 宽度. |
---|
参考号=2 | | | | | | |
世界银行1 | 0.939 (0.008) | 0.300 (0.002) | 0.970 (0.005) | 0.358 (0.003) | 0.990 (0.003) | 0.471 (0.004) |
世界银行2 | 0.906 (0.009) | 0.229 (0.003) | 0.960 (0.006) | 0.344(0.003) | 0.990 (0.002) | 0.530 (0.004) |
样条曲线 | 0.886 (0.012) | 0.250 (0.004) | 0.942 (0.008) | 0.298 (0.005) | 0.980 (0.004) | 0.391 (0.007) |
ABWS公司 | 0.557(0.017) | 0.166 (0.006) | 0.617 (0.017) | 0.198 (0.007) | 0.706 (0.017) | 0.260(0.009) |
参考号=4 | | | | | | |
世界银行1 | 0.913 (0.009) | 0.153 (0.001) | 0.945 (0.007) | 0.183 (0.002) | 0.989 (0.003) | 0.241 (0.002) |
世界银行2 | 0.850 (0.010) | 0.143 (0.002) | 0.919 (0.007) | 0.181 (0.002) | 0.981 (0.002) | 0.276 (0.002) |
样条曲线 | 0.878 (0.011) | 0.133 (0.002) | 0.934 (0.008) | 0.159 (0.002) | 0.979 (0.005) | 0.209 (0.003) |
ABWS公司 | 0.493 (0.016) | 0.078(0.003) | 0.550 (0.016) | 0.093 (0.003) | 0.643 (0.017) | 0.122 (0.004) |
方法. | 以下标称覆盖概率的覆盖率和间隔宽度:. |
---|
. | 0.90. | 0.95. | 0.99. |
---|
. | CR公司. | 宽度. | CR公司. | 宽度. | CR公司. | 宽度. |
---|
参考号=2 | | | | | | |
世界银行1 | 0.939 (0.008) | 0.300 (0.002) | 0.970(0.005) | 0.358 (0.003) | 0.990 (0.003) | 0.471 (0.004) |
世界银行2 | 0.906 (0.009) | 0.229(0.003) | 0.960 (0.006) | 0.344 (0.003) | 0.990 (0.002) | 0.530 (0.004) |
样条曲线 | 0.886 (0.012) | 0.250 (0.004) | 0.942 (0.008) | 0.298 (0.005) | 0.980 (0.004) | 0.391 (0.007) |
ABWS公司 | 0.557 (0.017) | 0.166 (0.006) | 0.617 (0.017) | 0.198 (0.007) | 0.706 (0.017) | 0.260 (0.009) |
参考号=4 | | | | | | |
世界银行1 | 0.913 (0.009) | 0.153 (0.001) | 0.945 (0.007) | 0.183(0.002) | 0.989 (0.003) | 0.241 (0.002) |
世界银行2 | 0.850 (0.010) | 0.143 (0.002) | 0.919 (0.007) | 0.181 (0.002) | 0.981 (0.002) | 0.276 (0.002) |
样条曲线 | 0.878 (0.011) | 0.133(0.002) | 0.934 (0.008) | 0.159 (0.002) | 0.979 (0.005) | 0.209 (0.003) |
ABWS公司 | 0.493 (0.016) | 0.078 (0.003) | 0.550 (0.016) | 0.093 (0.003) | 0.643 (0.017) | 0.122 (0.004) |
平滑样条估计克可以写入,其中S公司是一个n个×n个矩阵,so var因此,我们可以为.
信号克秒(t吨)评估于n个=128个等距数据点和100个rsnr=2和rsnr=6的数据集。使用默认超参数α=0.5和β=1以及对应于更平滑先验的值α=4和β=1计算波段间隔。WaveBand和ABWS都使用Daubechies的最小非对称小波,具有八个消失矩。对于每个模拟数据集,使用S-PLUS中的smooth.spline函数通过交叉验证选择样条曲线平滑参数λ。表2报告表中计算的平均覆盖率和间隔宽度1。如预期的那样,具有平滑先验的波段结果稍好一些。然而,默认的先验值仍然提供了相当好的性能,这通常与平滑样条线的性能相当。
5.讨论
5.1. 另一种先验方法
我们在构造后验概率区间时使用的方法原则上可以应用于其他贝叶斯阈值规则。唯一的要求是小波系数后验分布的前四个累积量必须存在;在给定数据的情况下,后验的独立性也是可取的,因为相依情况的计算将更加复杂。
作为一个例子,我们考虑一个双指数先验;该先验的较重尾部适合表示几个较大小波系数的可能性。Johnstone和Silverman(个人通信)已经证明,这个先验比那些先验具有更好的渐近性质(5)。它还具有以下属性无论多大都是有界的是,标准软阈值函数也是如此;这与前面(5)的情况不同。牟林和刘(1999)建议使用广义高斯先验,其中双指数是一种特殊情况,理由是重尾分布对先验的指定错误更为稳健。
定义,并考虑随机变量X(X)∼N个(θ,1), θ∼(1−对)δ(0)+第页,其中G公司是密度函数γ的双指数变量。给出观察结果x个属于X(X),θ≠=0的后验概率为,其中φ是标准正态随机变量的密度函数,而不是标度函数,“°”表示卷积。为与φ相关的分布函数写Φ,并让年=x个−一和z(z)=x个+一; 然后是
给定观测值的θ的后验分布x个属于X(X)θ是从分布的非零部分得出的
(13)
哪里和我(●)是指示器功能。这个第页方程零点的第阶矩(13)是,其中
和
对于第页=1,2,3,4,这些数量为
和
5.2. 闭幕词
我们导出了未知回归函数值的贝叶斯阈值估计的后验分布的近似值克(t吨我)给定数据年对于t吨我=我/n个,我=0,…,n个−1.此近似值可用于评估克(t吨我)具有任何期望的标称覆盖概率。我们的模拟表明,WaveBand方法可以产生合理的间隔估计,特别是对于较高的标称覆盖率。
一些研究人员提出了贝叶斯阈值规则,其中先验值与小波系数有关。对这些阈值规则的研究可以为同时评价后部可信带提供一条途径。然而,由于相依随机变量之和的累积量不具有相同的性质(9),因此所涉及的计算将更加复杂。此外,后验分布的独立性意味着所涉及的计算是有序的n个; 如果先证者是依赖性的,情况就不再是这样了。
第一作者提供了实现我们方法的软件,并将包含在Nason的WaveThresh包的下一版本中(1998),其当前版本可从获取http://www.stats.bris.ac.uk/wavethresh.
致谢
作者感谢工程和物理科学研究委员会(Engineering and Physical Sciences Research Council)拨款GR/M10229和联合利华研究公司(Unilever Research)的支持;GPN还得到了工程和物理科学研究委员会高级研究奖学金AF/001664的支持。作者希望感谢Eric Kolaczyk和Thomas Yee分别实现ABWS和样条方法的程序。作者还感谢联合编辑和两位裁判的建设性意见。
工具书类
©2002皇家统计学会