×

多样本异方差非参数回归的Minimax小波估计。 (英语) Zbl 1468.62270号

本文作者研究了基于函数混合效应模型的多样本噪声曲线的基线信号估计。在质谱分析中,信号是一种光谱,其峰值给出了有关生物样品蛋白质含量的信息。U.阿马托萨帕蒂纳斯锥虫【高级申请状态5,第1号,21–50(2005;Zbl 1096.62028号)]提出了一种基于观测数据的经验小波系数估计基线的方法,但估计量的收敛性没有从理论上进行评估。本文假设函数固定效应为Besov类。作者提出了一种小波估计器,以达到接近最优的收敛速度,并优于Amato和Sapatinas提出的方法[loc.cit.]。
第二节开始建立一个函数模型,用于(N)曲线(Y_i(cdot))、(i=1,2,dots,N)和(M)均匀分布的时空点(t=[0,1]^M),其中(M=2^J)用于某个整数(J)。第(i)-个个体的观测信号(Y_i(t_j)=\mu(t_j)+E_i(t_j))是一个函数模型,其随机函数(E_i(\cdot))为(1 \leq-i\leq-N),其中(\mu)是表征总体平均分布的主要函数固定效应。表示\({\mathbf Y}_i=(Y_i(t_1),\dots,Y_i,t_M))为时间网格上的观测矢量,类似地,表示\(}\mu}=(\mu(t_1。目的是从噪声观测中恢复主要功能效应。它的极小极大估计是Besov类({mathcal F})上最大风险的极小值,\[R(hat{\mu}^*{N,M})=\min_{\hat{\ mu}_{N,M}}R(hat{\mu}_{N,M,{\mathcal F})=\min_\hat{\ mu}_{N,M.}}\sup_{\mu\ in{\ mathcal F}E(\|hat{mu}{N,M2}-\mu\|)。\]面临的挑战是提出一个最优极小极大估计(hat{mu}^*{N,M})及其相关风险(R(hat[mu}^*{N,M})=R{N,M.}({mathcal F}))。
定理2.1和2.2给出了具有多样本数据集(N>1)的非齐次Besov类中(R^2_{N,M}({mathcal F}))的渐近上界和下界。下界由两项之和给出,一项是方差有噪的最小最大速率(当(N=1)),另一项(当(N>1)网格外没有信息时)是在Besov类中确定的参数的极限项(M^{-2s'})。通过构造(mu)的小波估计量(hat{mu}_{N,M})给出了上界。设\(\phi\)是紧支撑的标度函数,\(\psi\)是一个紧支撑的母小波,其中\(\phi_{j'k}(t)=2^{j'/2}\phi(2^{j'}t-k)\)和\(\psi_{jk}[t)=2 ^{j/2}\psi(2^jt-k)是\(L^2[0,1]\)的正交基。因此,\(\mu\)可以由正交基表示\[\μ(t)=\sum_{k=0}^{2^{j'}-1}\alpha_{j'k}^*\phi_{j'k}(t)+\sum_{j\geqj'}\sum_}k=0{2^j-1}\beta_{jk}^*\psi_{jk}(t)。\]因此我们有\[\|\mu\|{spq}=|\alpha^*|+\left(\sum_{j=0}^{\infty}(2^{j(s-1/p+1)/2}\|\beta_j^*\|p)^q\right)^{1/q}。\]《美国统计协会期刊》93,第444号,1461–1474(1998;Zbl 1064.62543号)],W·哈德尔等人在[Biometrika 81,no.3,425–455(1994;Zbl 0815.62019号)],D.L.多诺霍I.M.约翰斯通在白噪声模型中,非线性小波阈值化利用小波的自然空间自适应性,实现了一类贝索夫类的最优阈值率。对于\(N>1\),Amato和Sapatinas[loc.cit.]提出了三种策略来估计同方差情况下的\(\mu\)。作者采用了Amato和Sapatinas[loc.cit.]中的第三种策略(称为平均然后收缩方法)来显示近极小极大估计。
第三节介绍了阈值化策略,由于理论原因,只有通用阈值(lambda{jk}=hat{sigma}{jk{sqrt{frac{2\logM}{M}})在主要小波包中非常流行。目标是选择一个能将(L^2)-风险(mathrm{SURE}(lambda;上划线{mathbf d}))的估计值最小化的(lambda\),计算细节见附录a.3。
第四节给出了同方差情形下的异方差阈值估计,以及阈值的选择对实际模拟数据集的影响。通过处理零和非零系数和参数值,作者在定理2.2中考虑了异方差设置下具有通用阈值的SCAD阈值函数,并在表1中给出了平均MISE,其中异方差估计在所有考虑配置的函数重建方面大大优于同方差估计。在异方差背景下,使用SURE阈值可以提高重建主效应的性能。在最后一小节中,给出了本文提出的方法在一项卵巢癌研究中发布的SELDI-TOF质谱数据集中的应用。
第5节处理的是不规则数据,一般信号大小的二次方可能不适合实际的统计应用。可能的方法R.T.奥格登[公共统计,模拟计算26,No.2,467–488(1997;Zbl 0900.62208号)]可以通过将原始的不规则信号插值到大小为2次幂的规则网格,并以最佳尺度数值计算小波细节系数,将问题转换回规则的等间距设计。作者陈述了一些具有\(N=1\)的设计,这些设计可以直接扩展到\(N>1\)。
本文中的一些简短部分值得进行详细介绍。

MSC公司:

62克07 密度估算
62G08号 非参数回归和分位数回归
62J12型 广义线性模型(逻辑模型)
62页第10页 统计学在生物学和医学中的应用;元分析
42立方厘米 涉及小波和其他特殊系统的非三角谐波分析
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 阿马托,美国。;Sapatinas,T.,基于重复噪声测量的基线信号估计的小波收缩方法,统计学进展与应用,51,21-50(2005)·Zbl 1096.62028号
[2] 安东尼亚迪斯,A。;Fan,J.,小波逼近的正则化,美国统计协会杂志,96939-967(2001)·Zbl 1072.62561号 ·doi:10.1198/016214501753208942
[3] 安东尼亚迪斯,A。;Lavergne,C.,《小波方法回归中的方差函数估计》,统计学“小波与统计学”讲义,103,31-42(1995)·Zbl 0828.62032号 ·doi:10.1007/978-1-4612-2544-73
[4] 安东尼亚迪斯,A。;Sapatinas,T.,《函数混合效应模型中的估计和推断》,计算统计与数据分析,51,4793-4813(2007)·Zbl 1162.62341号 ·doi:10.1016/j.csda.2006.09.038
[5] 安东尼亚迪斯,A。;Bigot,J。;Lambert-Lacroix,S。;Letue,F.,用于分析飞行时间质谱数据的非参数预处理方法和推断工具,当前分析化学,3127-147(2007)·数字标识代码:10.2174/157341107780361718
[6] 阿里巴斯·吉尔,A。;Bertin,K。;Meza,C。;Rivoirard,V.,《半参数非线性混合效应模型的LASSO型估计——估计、统计与计算》,24,443-460(2014)·Zbl 1325.62070号 ·doi:10.1007/s11222-013-9380-x
[7] Cai,T.T。;Brown,L.D.,非等间距样本的小波收缩,统计年鉴,261783-1799(1998)·Zbl 0929.62047号 ·doi:10.1214/aos/1024691357
[8] Cai,T.T。;Wang,L.,异方差非参数回归中的自适应方差函数估计,《统计年鉴》,362025-2054(2008)·Zbl 1148.62021号 ·doi:10.1214/07-AOS509
[9] 科伊夫曼,R。;Donoho,D.,平移不变去噪,小波与统计学,103,125-150(1995)·Zbl 0866.94008号 ·doi:10.1007/978-1-4612-2544-79
[10] Delyon,B。;Juditsky,A.,《关于小波系数的计算》,《近似理论杂志》,88,47-79(1997)·Zbl 0862.42023号 ·doi:10.1006/jath.1996.3008
[11] Devore,R。;Lorentz,G.,《构造逼近》(1993),海德堡:施普林格-弗拉格出版社·Zbl 0797.41016号
[12] Donoho,D.(1994),“带块系数核的平滑小波分解”,小波分析的最新进展L.Schumaker编辑。波士顿:学术出版社·Zbl 0813.42020号
[13] 多诺霍,D。;Johnstone,I.,《基于小波收缩的理想空间自适应》,生物特征,81425-455(1994)·Zbl 0815.62019号 ·doi:10.1093/biomet/81.3.425
[14] Donoho,D.L。;Johnstone,I.M.,通过小波收缩适应未知的平滑度,美国统计协会杂志,901200-124(1995)·Zbl 0869.62024号 ·网址:10.1080/01621459.1995.10476626
[15] 多诺霍,D。;约翰斯通,I。;Kerkyacharian,G。;Picard,D.,《小波收缩:渐近性》,《皇家统计学会杂志》,B辑,57371-394(1995)·Zbl 0827.62035号
[16] 埃克尔·帕索,J.E。;Oberg,A.L。;塞诺,T.M。;Bergen,H.R.,《高分辨率质谱数据透视》,生物统计学,10481-500(2009)·Zbl 1437.62450号 ·doi:10.1093/biostatistics/kxp006
[17] 范,J。;Li,R.,《基于非关联惩罚可能性的变量选择及其Oracle属性》,美国统计协会杂志,96,1348-1360(2001)·Zbl 1073.62547号 ·doi:10.19198/0162114501753382273
[18] 弗雷泽,M。;Jawerth,B。;Weiss,G.,Littlewood-Paley理论与函数空间研究,第79卷(1991年),普罗维登斯:美国数学学会·Zbl 0757.42006号
[19] Gasser,T。;斯特罗卡,L。;Jennen-Steinmetz,C.,非线性回归中的残差方差和残差模式,生物统计学,73,625-633(1989)·Zbl 0649.62035号 ·doi:10.1093/biomet/73.3.625
[20] Giacofci,M。;Lambert-Lacroix,S。;马洛特,G。;Picard,F.,《基于小波的高维混合效应功能模型聚类》,生物统计学,69,31-40(2013)·Zbl 1274.62774号 ·doi:10.1111/j.1541-0420.2012.01828.x
[21] 霍尔,P。;Turlach,B.A.,《非规则空间设计非线性小波回归的插值方法》,《统计学年鉴》,第25期,1912-1925(1997)·Zbl 0881.62044号 ·doi:10.1214/aos/1069362378
[22] Härdle,W。;Kerkyacharian,G。;Picard,D。;Tsybakov,A.,《小波、近似和统计应用》(1998),纽约:施普林格出版社·Zbl 0899.62002号
[23] 约翰斯通,I.M。;Silverman,B.W.,相关噪声数据的小波阈值估计,皇家统计学会期刊,B辑,59,319-351(1997)·Zbl 0886.62044号 ·数字对象标识代码:10.1111/1467-9868.00071
[24] 朱迪茨基,A。;Delyon,B.,《关于Minimax小波估计》,应用和计算谐波分析,3215-228(1996)·兹比尔0865.62023 ·doi:10.1006/acha.1996.017
[25] 科瓦克公司。;Silverman,B.W.,通过系数相关阈值扩展小波回归方法的范围,美国统计协会杂志,95,172-183(2000)·doi:10.1080/01621459.2000.10473912
[26] Mallat,S.,《信号处理的小波之旅》(1999),圣地亚哥:学术出版社·Zbl 0945.68537号
[27] 莫里斯,J.S。;Carroll,R.J.,基于小波的函数混合模型,英国皇家统计学会期刊B系列统计方法论,68179-199(2006)·Zbl 1110.62053号 ·文件编号:10.1111/j.1467-9868.2006.00539.x
[28] 莫里斯,J。;布朗,P。;Herrick,R。;巴格利,K。;Coombes,K.R.,使用基于小波的函数混合模型对质谱蛋白质组数据进行贝叶斯分析,生物计量学,64479-489(2008)·Zbl 1137.62399号 ·doi:10.1111/j.1541-0420.2007.00895.x
[29] Nason,G.,《R统计中的小波方法》(2008),纽约:斯普林格出版社,纽约·Zbl 1165.62033号
[30] Ogden,R.T.,《样本大小不是2的幂时小波变换数据的预处理》,《统计学中的通信——模拟和计算》,26,467-486(1997)·Zbl 0900.62208号 ·doi:10.1080/03610919708813391
[31] Park,C.,使用{SCAD}惩罚的块阈值小波回归,统计规划与推断杂志,1402755-2770(2010)·Zbl 1188.62150号 ·doi:10.1016/j.jspi.2010.03.035
[32] 彭斯基,M。;Vidakovic,B.,《非等间距小波回归》,统计数学研究所年鉴,53,681-690(2001)·Zbl 1003.62037号 ·doi:10.1023/A:1014640632666
[33] Petricoin,E.F。;Ardekani,A.M。;Hitt,B.A。;莱文,P.J。;Fusaro,V.A。;斯坦伯格,S.M。;米尔斯,G.B。;西蒙,C。;Fishman,D.A。;科恩,东卡罗来纳州。;Liotta,L.A.,《使用血清中的蛋白质组模式识别卵巢癌》,《柳叶刀》,359,572-577(2002)·doi:10.1016/S0140-6736(02)07746-2
[34] Scheipl,F。;Staicu,A.M。;Greven,S.,《函数加法混合模型》,《计算与图形统计杂志》,24477-501(2015)·doi:10.1080/10618600.2014.901914
[35] Stein,C.M.,多元正态分布平均值的估计,《统计年鉴》,第9期,第1135-1151页(1981年)·Zbl 0476.62035号 ·doi:10.1214/aos/1176345632
[36] 冯·萨克斯,R。;Macgibbon,B.,通过局部平稳误差的小波阈值进行非参数曲线估计,斯堪的纳维亚统计杂志,27475-499(2000)·Zbl 0976.62034号 ·doi:10.1111/1467-9469.00202
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。