×

删失数据下自适应内维数核回归估计的一致收敛速度。 (英语) Zbl 1466.62292号

小结:本文的重点是现代经验过程理论导出的回归函数(\mathbb{E}(\phi(\mathbf{Y})|\mathbf{X}=\mathbf{X})的核型估计的带宽一致性,在核上的条件比以前文献中使用的弱。我们的定理允许数据驱动的局部带宽用于这些统计。我们扩展了核回归估计量的现有一致界,使其适应于(mathbf{X})潜在分布的内在维数,其特征是所谓的内在维数。此外,在相同的背景下,我们证明了随机删失下回归函数的非参数截尾加权逆概率(I.P.C.W.)估计的带宽一致性。给出了核型估计量(密度、回归、条件分布、导数函数、熵、模式和可加模型)的统计应用,以激发这些结果。

MSC公司:

62克08 非参数回归和分位数回归
62G07年 密度估算
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Akaike,H.,密度函数的近似,统计数学研究所年鉴,6127-132(1954)·Zbl 0058.12302号
[2] Auestad,B.和Tjötheim,D.(1991),“非线性时间序列中的函数识别”,非参数函数估计和相关主题,G.Roussas编辑,《北约ASI系列》第335卷,施普林格荷兰,第493-507页·Zbl 0727.62082号
[3] Bousquet,O.,一个Bennett浓度不等式及其在经验过程最高级中的应用,Comptes-Rendus Mathematique,334,6,495-500(2002)·兹比尔1001.60021
[4] Bouzebda,S.,关于Bootstrapped经验Copula过程的强逼近及其应用,统计数学方法,21,3,153-188(2012)·Zbl 1295.60042号
[5] Bouzebda,S。;Didi,S.,平稳和遍历连续时间过程的加性回归模型,统计学中的通信——理论和方法,46,5,2454-2493(2017)·Zbl 1380.62165号
[6] Bouzebda,S。;Elhattab,I.,《香农熵核型估计的带宽一致性》,《电子统计杂志》,5,440-459(2011)·Zbl 1274.62186号
[7] Bouzebda,S。;Chokri,K.,《部分线性加性回归模型的统计检验》,《统计方法》,第19期,第4-24页(2014年)·Zbl 1486.62098号
[8] Bouzebda,S。;Nemouchi,B.,《涉及函数数据的非参数回归估计和条件U统计量的一致一致性和带宽一致性》,《非参数统计杂志》,32,2,452-509(2020)·兹比尔1476.62073
[9] Bouzebda,S。;Chokri,K。;Louani,D.,部分线性可加模型分量估计中的一些一致性结果,统计学中的通信-理论和方法,45,5,1278-1310(2016)·Zbl 1337.62100号
[10] Bouzebda,S。;Elhattab,I。;Seck,C.T.,基于Copula表示的非参数回归的带宽一致性,统计与概率字母,137173-182(2018)·Zbl 1463.62118号
[11] 布雷曼,L。;Friedman,J.H.,估计多元回归和相关的最优变换,美国统计协会杂志,803391580-619(1985)·Zbl 0594.62044号
[12] Brunel,E.和Comte,F.(2006),“存在Censoring的非参数自适应回归估计”。
[13] 布贾,A。;哈斯蒂,T。;Tibshirani,R.,线性平滑和加法模型,《统计年鉴》,17,2,453-555(1989)·Zbl 0689.62029号
[14] Carbonez,A。;Györfi,L。;van der Meulen,E.C.,随机删失下回归函数的分区估计,统计与风险建模,13,1,21-38(1995)·Zbl 0814.62019号
[15] Chacón,J.E.和Duong,T.(2018),多元核平滑及其应用,统计学和应用概率专著第160卷。佛罗里达州博卡拉顿:CRC出版社·Zbl 1402.62003号
[16] Chambers,J.M.和Hastie,T.J.(1992),《S中的统计模型》,统计模型一章。沃兹沃思和布鲁克斯/科尔·Zbl 0776.62007号
[17] Chen,R.、Härdle,W.、Linton,O.和Severance-Lossin,E.(1996),“可加性可分离回归模型的非参数估计”,载于《统计理论与平滑的计算方面》,编辑W.Härd le和M.Schimek,《对统计的贡献》,Physica-Verlag HD,第247-265页。
[18] Collomb,G.,《回归的非随机估计:评论书目》,《国际统计评论》,49,1,75-93(1981)·Zbl 0471.62039号
[19] 盖,T.M。;Thomas,J.A.,《信息理论要素》(2006),新泽西州霍博肯:威利国际科学[John Wiley&Sons],新泽西·Zbl 1140.94001号
[20] Csiszár,I.,信息总监Konvergenzbegriffe Im Raum Der Wahrscheinlichkeitsvertilungen,Magyar Tud。阿卡德。马特·库塔托国际有限公司。,7, 137-158 (1962) ·Zbl 0239.60034号
[21] Deheuvels,P.(2000),“可能无界区间上核密度估计的统一极限定律”,《可靠性理论的最新进展》(Bordeaux,2000),Stat.Ind.Technol。,马萨诸塞州波士顿:Birkhäuser Boston;第477-492页·兹比尔0997.62038
[22] Deheuvels,P.,《One Bootstrap Safficies to Generate Sharp Uniform Bounds in Functional Estimation》,Kybernetika(布拉格),47,6,855-865(2011)·Zbl 1274.62234号
[23] 机动,P。;Mason,D.M.,基于核函数估计的一般渐近置信带,随机过程的统计推断,7,3,225-277(2004)·Zbl 1125.62314号
[24] Devroye,L.(1987),“密度估计课程”,《概率与统计进展》第14卷。马萨诸塞州波士顿:Birkhäuser Boston,Inc·Zbl 0617.62043号
[25] Devroye,L.和Györfi,L.(1985),非参数密度估计。概率与数理统计威利系列:概率与统计丛书。纽约:John Wiley&Sons,Inc·Zbl 0546.62015号
[26] Devroye,L.和Lugosi,G.(2001),密度估算中的组合方法。统计学中的斯普林格系列。纽约:Springer-Verlag·兹比尔0964.62025
[27] Dony,J.和Einmahl,U.(2009),“核回归估计器在固定点的带宽一致性”,《高维概率V:Luminy卷》,《Inst.Math》第5卷。统计(IMS)收集。,俄亥俄州比奇伍德:Inst.Math。统计人员。,第308-325页·Zbl 1243.62052号
[28] 杜德维茨,E.J。;van der Meulen,E.C.,《基于熵的均匀性检验》,《美国统计协会杂志》,76,376,967-974(1981)·Zbl 0484.62035号
[29] Dudley,R.M.(2014),《统一中心极限定理》(第二版),《剑桥高等数学研究》第142卷。纽约:剑桥大学出版社·Zbl 1317.60030号
[30] 易卜拉希米,N。;Habibullah,M。;Soofi,E.,《基于Kullback-Leibler信息的指数检验》,英国皇家统计学会期刊B辑,54,3,739-748(1992)·Zbl 0775.62006号
[31] Eggermont,P.P.B.和LaRiccia,V.N.(2001),《最大惩罚可能性估计》。(第一卷)。统计学中的斯普林格系列。纽约:施普林格出版社·Zbl 0984.62026号
[32] 美国埃因马尔。;Mason,D.M.,核函数估计一致一致性的经验过程方法,理论概率杂志,13,1,1-37(2000)·Zbl 1426.62113号
[33] 美国埃因马尔。;Mason,D.M.,核函数估计的带宽一致性,统计年鉴,33,3,1380-1403(2005)·兹比尔1079.62040
[34] Fan,J.和Gijbels,I.(1996),局部多项式建模及其应用,统计学和应用概率专著第66卷。伦敦:查普曼和霍尔·Zbl 0873.62037号
[35] Federer,H.,曲率测度,美国数学学会汇刊,93,3,418-491(1959)·Zbl 0089.38402号
[36] Földes,A。;Rejtö,L.,乘积极限估计的Lil型结果,Zeitschrift für Wahrscheinlichkeits theorie und verwandte Gebiete,56,1,75-86(1981)·Zbl 0443.62031号
[37] Genovese,C.R.、Perone-Pacifico,M.、Verdinelli,I.和Wasserman,L.A.(2013),“密度模式的非参数推断”,CoRR,abs/1312.7567·Zbl 1411.62093号
[38] 杜松子酒,E。;Nickl,R.,《小波密度估计的统一极限定理》,《概率年鉴》,37,4,1605-1646(2009)·Zbl 1255.62103号
[39] Giné,E.和Sang,H.(2013),“关于以超形式最佳速率通过严格概率密度估计光滑密度”,《从概率到统计再到后:高维模型和过程》,《仪器数学》第9卷。统计(IMS)收集。,俄亥俄州比奇伍德:Inst.Math。统计人员。,第128-149页·Zbl 1325.62082号
[40] 杜松子酒,E。;Koltchinski,V.公司。;Sakhanenko,L.,核密度估计:加权超形式的分布收敛性,概率论及相关领域,130,2,167-198(2004)·Zbl 1048.62041号
[41] Gokhale,D.V.和Kullback,S.(1978),《列联表中的信息》,《统计学:教科书和专著》第23卷。纽约:Marcel Dekker,Inc·Zbl 0405.6202号
[42] Györfi,L.、Kohler,M.、Krzyżak,A.和Walk,H.(2002),非参数回归的无分布理论。统计学中的斯普林格系列。纽约:Springer-Verlag·Zbl 1021.62024号
[43] Hall,P.,回归函数核估计的积分平方误差和交叉验证的渐近性质,Zeitschrift für Wahrscheinlichkeits theory und verwandte Gebiete,67,2,175-196(1984)·Zbl 0556.62020号
[44] Härdle,W.(1990),《应用非参数回归》,《计量经济学社会专题论文》第19卷。剑桥:剑桥大学出版社·Zbl 0714.62030号
[45] Härdle,W。;Marron,J.S.,非参数回归函数估计中的最佳带宽选择,统计学年鉴,13,4,1465-1481(1985)·Zbl 0594.62043号
[46] Hein,M.和Audibert,J.-Y.(2005),“研发中子流形的内在维数估计”,《第22届机器学习国际会议论文集》,ACM,第289-296页。
[47] Hastie,T.J.和Tibshirani,R.J.(1990),广义加法模型,统计学和应用概率专著第43卷。伦敦:查普曼霍尔有限公司·Zbl 0747.62061号
[48] Jaynes,E.T.,《信息理论和统计力学》,《物理评论》(2),106,620-630(1957)·Zbl 0084.43701号
[49] 卡普兰,E.L。;Meier,P.,《不完全观测的非参数估计》,美国统计协会杂志,53,282,457-481(1958)·Zbl 0089.14801号
[50] Kara-Zaitri,L。;Laksaci,A。;拉赫迪,M。;Vieu,P.,涉及函数数据的各种核估计的带宽一致性,非参数统计杂志,29,1,85-107(2017)·兹比尔1365.62163
[51] Kégl,B.(2003),“使用包装数的内在维度估计”,《神经信息处理系统的进展》,第697-704页。
[52] Kim,J.,Shin,J.、Rinaldo,A.和Wasserman,L.(2018年),“自适应内禀体积维的核密度估计器的一致收敛速度”,arXiv电子版,第arXiv:1810.05935页。
[53] Kim,J.,Shin,J.、Rinaldo,A.和Wasserman,L.(2019),“自适应内禀体积维的核密度估计器的一致收敛速度”,第36届国际机器学习会议论文集,编辑K.Chaudhuri和R.Salakhutdinov,《机器学习研究论文集》第97卷,加利福尼亚长滩,美国PMLR,第3398-3407页。
[54] 科勒,M。;英国马瑟。;Pintér,M.,从随机右删失数据预测,多元分析杂志,80,1,73-100(2002)·兹比尔0992.62041
[55] Kosorok,M.R.(2008),《经验过程和半参数推断导论》。统计学中的斯普林格系列。纽约:斯普林格·Zbl 1180.62137号
[56] Kullback,S.,《信息理论与统计》(1959年),纽约:John Wiley and Sons,Inc,纽约·Zbl 0149.37901号
[57] Ledoux,M.,《关于Talagrand的产品度量偏差不等式》,ESAIM:概率与统计,163-87(1997)·Zbl 0869.60013号
[58] Levina,E.和Bickel,P.J.(2005),“内在维度的最大似然估计”,《神经信息处理系统进展》,第777-784页。
[59] Ling,N。;Vieu,P.,《功能数据的非参数建模:未来的调查和跟踪》,统计学,52,4934-949(2018)·Zbl 1411.62084号
[60] Ling,N。;孟,S。;Vieu,P.,函数时间序列数据kNN回归估计的一致一致性率,非参数统计杂志,31,2,451-468(2019)·Zbl 1418.62160号
[61] 林惇,O。;Nielsen,J.P.,基于边缘积分估计结构化非参数回归的核心方法,生物特征,82,1,93-100(1995)·Zbl 0823.62036号
[62] 梅洛特,B。;Viallon,V.,《截尾数据下回归函数非参数估计的对数统一极限定律》,统计数学方法,18,2,159-184(2009)·Zbl 1231.62068号
[63] Mammen,E。;林惇,O。;Nielsen,J.,弱条件下回拟投影算法的存在性和渐近性,《统计年鉴》,27,5,1443-1490(1999)·Zbl 0986.62028号
[64] Mammen,E.、Park,B.U.和Schienle,M.(2012),“加性模型:扩展和相关模型”,SFB 649讨论文件SFB649DP2012-045,Sonderforschungsbereich 649,柏林:洪堡大学。
[65] Mason,D.M.,证明非标准核估计的一致性,随机过程的统计推断,15,2,151-176(2012)·Zbl 1242.62028号
[66] 梅森,D.M。;Swanepoel,J.W.H.,核型函数估计器带宽一致性的一般结果,TEST,20,1,72-94(2011)·Zbl 1331.62235号
[67] 梅森,D.M。;Swanepoel,J.W.H.,混合数据密度核估计的带宽一致性,电子统计杂志,9,1,1518-1539(2015)·Zbl 1333.60056号
[68] Mokkadem,A。;Pelletier,M.,多变量核模式估计的迭代对数定律,ESAIM。概率与统计=概率与统计,7,1-21(2003)·兹比尔1013.62032
[69] Müller,H.-G.(1988),纵向数据的非参数回归分析,统计学讲义第46卷。柏林:Springer-Verlag·Zbl 0664.62031号
[70] Nadaraya,E.,关于估计回归,概率理论及其应用,9,1,141-142(1964)·Zbl 0136.40902号
[71] Nadaraya,E.A.(1989),概率密度和回归曲线的非参数估计,数学及其应用(苏联系列)第20卷。多德雷赫特:Kluwer学术出版集团·Zbl 0709.62039号
[72] Newey,W.K.,部分均值的核估计和一般方差估计,计量经济学理论,10,2,233-253(1994)
[73] Noh,Y.-K。;杉山,M。;刘,S。;普莱西斯,M.C.d。;F.C.公园。;Lee,D.D.,Kullback-leibler散度的最近邻估计的偏差减少和度量学习,神经计算,30,7,1930-1960(2018)·Zbl 1471.62301号
[74] 诺兰,D。;Pollard,D.,《U过程:收敛速度》,《统计年鉴》,第15、2、780-799页(1987年)·Zbl 0624.60048号
[75] 诺沃,S。;Aneiros,G。;Vieu,P.,函数单因次回归中的自动和位置自适应估计,非参数统计杂志,31,2,364-392(2019)·Zbl 1418.62164号
[76] Opsomer,J.D。;Ruppert,D.,用局部多项式回归拟合二元可加模型,《统计年鉴》,25,1,186-211(1997)·Zbl 0869.62026号
[77] Parzen,E.,《概率密度函数和模式的估计》,《数理统计年鉴》,331065-1076(1962)·Zbl 0116.11302号
[78] Pollard,D.(1984),随机过程的收敛性。统计学中的斯普林格系列。纽约:Springer-Verlag·Zbl 0544.60045号
[79] Pollard,D.(1990),《经验过程:理论与应用》,NSF-CBMS概率与统计区域会议系列第2卷,加利福尼亚州海沃德:数理统计研究所;弗吉尼亚州亚历山大市:美国统计协会·Zbl 0741.60001号
[80] 拉赫迪,M。;Vieu,P.,《函数数据的非参数回归:自动平滑参数选择》,《统计规划与推断杂志》,137,92784-2801(2007)·Zbl 1331.62240号
[81] Rényi,A.,《概率分布的维数和熵》,匈牙利科学院数学学报,第10期,193-215页(1959年)·Zbl 0088.10702号
[82] Rosenblatt,M.,关于密度函数的一些非参数估计的注释,数理统计年鉴,27832-837(1956)·Zbl 0073.14602号
[83] Scott,D.W.(2015),《多元密度估计》(第2版)。概率统计威利级数。新泽西州霍博肯:John Wiley&Sons,Inc·Zbl 1311.62004号
[84] Shannon,C.E.,通信数学理论,贝尔系统技术期刊,27379-423(1948)·Zbl 1154.94303号
[85] Silverman,B.W.(1986),《统计和数据分析的密度估计》。统计学和应用概率专著。伦敦:查普曼和霍尔·Zbl 0617.62042号
[86] Singh,R.S.,《密度及其导数的估计在某些统计问题上的应用》,英国皇家统计学会期刊B辑,39,357-363(1977)·Zbl 0377.62039号
[87] Sriperumbudur,B.和Steinwart,I.(2012),“使用Dbscan进行聚类的一致性和速度”,摘自《人工智能与统计》,第1090-1098页。
[88] 斯坦瓦特,I。;Christmann,A.,支持向量机。《信息科学与统计》(2008),纽约:施普林格科学与商业媒体·兹比尔1203.68171
[89] Stone,C.J.,《加性回归和其他非参数模型》,《统计学年鉴》,13,2,689-705(1985)·Zbl 0605.62065号
[90] Stone,C.J.,《广义可加模型的降维原理》,《统计学年鉴》,第14、2、590-606页(1986年)·Zbl 0603.62050号
[91] Stute,W.,条件经验过程,统计年鉴,14,2,638-647(1986)·Zbl 0594.62038号
[92] Szepesvári,C.、Audibert,J.-Y.和Farahmand,A.M.(2007),显式适应维度估计。第24届机器学习国际会议论文集,第265-272页。ACM公司。
[93] Talagrand,M.,高斯过程和经验过程的Sharper边界,概率年鉴,22,1,28-76(1994)·Zbl 0798.60051号
[94] Tapia,R.A.和Thompson,J.R.(1978),非参数概率密度估计,《数学科学中的约翰·霍普金斯系列》第1卷。马里兰州巴尔的摩:约翰·霍普金斯大学出版社·Zbl 0449.62029号
[95] 特约西姆·D·。;Auestad,B.H.,《非线性时间序列的非参数识别:预测》,美国统计协会杂志,89,428,1398-1409(1994)·Zbl 0813.62036号
[96] Tsybakov,A.B.,《非参数核回归中带宽的选择》,Teor。Veroyatnost公司。i Primenen。,32, 1, 153-159 (1987) ·Zbl 0628.62033号
[97] van der Vaart,A.W.和Wellner,J.A.(1996),《弱收敛和经验过程》。统计学中的斯普林格系列。纽约:Springer-Verlag,《统计应用》·Zbl 0862.60002号
[98] Vasicek,O.,《基于样本熵的正态性测试》,英国皇家统计学会期刊B辑,38,1,54-59(1976)·Zbl 0331.62031号
[99] Verdugo Lazo,A.C.G。;Rathie,P.N.,《关于连续概率分布的熵》,IEEE信息理论汇刊,IT-24,1,120-122(1978)·Zbl 0371.94042号
[100] Wand,M.P.和Jones,M.C.(1995),《核平滑》,统计学和应用概率专著第60卷。伦敦:查普曼和霍尔有限公司·Zbl 0854.62043号
[101] Watson,G.S.,平滑回归分析,Sankhyá系列A,26359-372(1964)·Zbl 0137.13002号
[102] Wertz,W.(1978年),《统计密度估计:一项调查》,Angewandte Statistik undØkonometrie[应用统计学和计量经济学]第13卷。哥廷根:范登霍克和鲁普雷希特·Zbl 0388.62035号
[103] Ziegler,K.,关于随机设计模型中回归函数模式的非参数核估计,非参数统计杂志,14,6,749-774(2002)·Zbl 1013.62047号
[104] Ziegler,K.,关于非参数随机设计模型中模式的核回归估计的渐近正态性,统计规划与推断杂志,115,1,123-144(2003)·Zbl 1041.62033号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。