×

分散数据近似中交叉验证的集中不等式。 (英语) Zbl 07501641号

摘要:从假设空间中选择模型是近似理论和反问题中的常见任务。交叉验证是学习者技能库中的一个经典工具,用于比较不同重建模型的拟合优度。许多工作都致力于快速计算这个量,但处理它的理论性质却很困难。到目前为止,大多数最优性结果都是以渐进的方式表述的。在本文中,我们提出了一个关于交叉验证得分和风险函数关于平方误差的差异的集中不等式。这给出了一个具有高概率的前渐近界。对于这些假设,我们依赖于模型一致误差的界限,这允许一个广泛适用的框架。
我们通过将此机制应用于Shepard模型来支持我们的主张,在该模型中,我们能够确定浓度不等式的精确常数。结合快速算法的数值实验表明了我们的结果的适用性。

MSC公司:

62G08号 非参数回归和分位数回归
第41页第63页 多维问题
62H15型 多元分析中的假设检验
62G05型 非参数估计
41甲15 样条线近似
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Bakushinskiĭ,A.B.,关于从拟最优性和关系检验中选择正则化参数的备注,Zh。维奇尔。Mat.I Mat.Fiz.,材料。,24, 8, 1258-1259 (1984) ·Zbl 0575.65059号
[2] 巴特尔,F。;Hielscher,R。;Potts,D.,谐波近似中的快速交叉验证,应用。计算。哈蒙。分析。,49, 2, 415-437 (2020) ·Zbl 07216378号
[3] 贝茨,S。;哈斯蒂,T。;Tibshirani,R.,交叉验证:它估计了什么,做得有多好?ArXiv电子打印(2021)
[4] Bauer,F。;Reiß,M.,与噪声水平无关的正则化:拟最优性分析,逆问题,24,5,文章055009 pp.(2008),16·Zbl 1147.49024号
[5] Becker,S.M.A.,统计反问题的正则化和Bakushinskiĭ否决权,反问题,27,11,第115010条pp.(2011),22·Zbl 1401.62055号
[6] Belytschko,T.等人。;吕义勇。;Gu,L.,无元素伽辽金方法,国际。J.数字。方法工程,37,2,229-256(1994)·Zbl 0796.73077号
[7] Blockeel,H。;Struyf,J.,《决策树交叉验证的高效算法》,J.Mach。学习。第301621-650号决议(2002年)·Zbl 1112.68437号
[8] Combes,R.,《麦克迪米德不等式的延伸》(2015),《ArXiv电子印刷品》,abs/1511.05240
[9] De Vito,E。;Pereverzyev,S。;Rosasco,L.,使用平衡原理的自适应核方法,Found。计算。数学。,10, 4, 455-479 (2010) ·Zbl 1204.68154号
[10] Deshpande,L.N。;Girard,D.,交叉验证稳健样条和其他非线性平滑样条的快速计算,(曲线和曲面(1991)),143-148·Zbl 0735.41010号
[11] Devroye,L.,均匀间距有序统计的重对数定律,Ann.Probab。,9, 5 (1981) ·Zbl 0465.60038号
[12] Fasshauer,G.E.,《使用MATLAB的无网格近似方法》(2007),世界科学出版社·Zbl 1123.65001号
[13] 法绍尔,G.E。;Zhang,J.,移动最小二乘近似的最新结果,(Lucian,L.;Neamtu,M.,《几何建模与计算》(2003),纳什博罗出版社:纳什博罗·布伦特伍德出版社),163-176·Zbl 1060.65523号
[14] Golub,G.H。;希思,M。;Wahba,G.,《广义交叉验证作为选择良好岭参数的方法》,《技术计量学》,21,2,215-223(1979)·Zbl 0461.62059号
[15] 戈登,Y。;利特瓦克,A.E。;Pajor,A。;Tomczak-Jaegermann,N.,Random(varepsilon)-网和嵌入在(l_infty)中,Studia Math。,178, 1, 91-98 (2007) ·Zbl 1126.46006号
[16] Gu,C.,平滑样条方差分析模型(Springer Series in Statistics(2013)第297卷,Springer:Springer New York)·Zbl 1269.62040号
[17] Györfi,L。;科勒,M。;Krzyzak,A。;Walk,H.,非参数回归的无分布理论(Springer Series in Statistics(2002),Springer-Verlag:Springer-Verlag New York)·Zbl 1021.62024号
[18] Holst,L.,《关于随机断裂的木棍的长度》,J.Appl。可能性。,17, 3, 623-634 (1980) ·Zbl 0435.60016号
[19] S.Kale,R.Kumar,S.Vassilvitskii,交叉验证和均方稳定性,摘自:第二届计算机科学创新研讨会,ICS2011,2011年,第487-495页。
[20] J.Keiner,S.Kunis,D.Potts,NFFT 3.5,C子程序库。http://www.tu-chemnitz.de/potts/nfft。撰稿人:F.Bartel、M.Fenn、T.Görner、M.Kircheis、T.Knopp、M.Quellmalz、M.Schmischke、T.Volkmer、A.Vollrath。
[21] 金德曼,S。;Neubauer,A.,关于(迭代)Tikhonov正则化的拟最优性准则的收敛性,逆问题。成像,2291-299(2008)·Zbl 1165.47009号
[22] 金德曼,S。;Pereverzyev,S。;Pilipenko,A.,线性函数策略中的拟最优准则,逆问题,34,7,文章075001 pp.(2018),24·Zbl 1415.65131号
[23] 克里格,D。;诺瓦克,E。;Sonnleitner,M.,sobolev函数的恢复限制为iid采样(2021),ArXiv电子打印
[24] R.Kumar,D.Lokshtanov,S.Vassilvitskii,A.Vattani,通过损失稳定性进行交叉验证的近最优边界,见:第30届机器学习国际会议,第01卷,ICML 2013年,2013年,第27-35页。
[25] Kunsch,R.J.,通过蒙特卡罗方法打破希尔伯特空间中一致逼近的诅咒,《复杂性》,48,15-35(2018)·Zbl 1473.65009号
[26] 莱德勒,A。;Umlauft,J。;Hirche,S.,应用于安全控制的高斯过程回归的统一误差界(2019),ArXiv电子打印
[27] Li,K.C.,(C_L)的渐近最优性和岭回归中的广义交叉验证及其在样条平滑中的应用,Ann.Statist。,14, 3, 1101-1112 (1986) ·Zbl 0629.62043号
[28] Lukas,M.A.,选择正则化参数的稳健广义交叉验证,反问题,22,5,1883-1902(2006)·Zbl 1104.62032号
[29] 卢卡斯,医学硕士。;德胡格,F.R。;Anderssen,R.S.,稳健广义交叉验证样条平滑的高效算法,J.Compute。申请。数学。,235, 102-107 (2010) ·Zbl 1201.65024号
[30] McDiarmid,C.,《关于有界差分方法》,(伦敦数学学会讲义第141卷伦敦数学学会演讲稿第141辑,组合学调查,1989年(诺维奇,1989)(1989),剑桥大学出版社:剑桥大学出版社),148-188·Zbl 0712.05012号
[31] M.Mullin,R.Sukthankar,《最近邻分类器的完全交叉验证》,载于:第17届机器学习国际会议,2000年。
[32] Nadaraya,E.A.,关于估计回归,概率论。申请。,9, 141-142 (1964) ·Zbl 0136.40902号
[33] Nayroles,B。;Touzot,G。;Villon,P.,有限元方法的推广:扩散近似和扩散单元,计算。机械。,10, 5, 307-318 (1992) ·Zbl 0764.65068号
[34] Pozharska,K。;Ullrich,T.,关于统一范数下多元函数抽样恢复的注记(2021),ArXiv电子印刷品
[35] Rosset,S.,核分位数回归交叉验证解的双层路径跟踪,J.Mach。学习。第10号决议,2473-2505(2009年)·Zbl 1235.68184号
[36] 谢弗,S。;McPhail,T。;Warren,J.,使用移动最小二乘法进行图像变形,ACM Trans。图表。,25, 3, 533-540 (2006)
[37] Shepard,D.,不规则间隔数据的二维插值函数,(1968年第23届美国计算机学会全国会议论文集。1968年第23届美国计算机学会全国会议论文集,美国计算机学会’68(1968),计算机械协会:美国计算机械协会,纽约,纽约),517-524
[38] 西杰,R.B。;威廉姆斯,A.B。;Burrage,K.,使用Krylov子空间方法的快速广义交叉验证,Numer。算法,47,109-131(2008)·Zbl 1157.65012号
[39] Sober,B。;Levin,D.,移动最小二乘投影流形近似(MMLS),Constr。约52,3433-478(2020年)·Zbl 1455.65042号
[40] 斯坦瓦特,I。;Christmann,A.,支持向量机(2008),Springer Publishing Company,Incorporated·Zbl 1203.68171号
[41] 塔什,M。;Weyrich,N.,使用广义交叉验证平滑傅里叶级数反演,结果数学。,29, 1-2, 183-195 (1996) ·Zbl 0853.65145号
[42] G.S.Watson,平滑回归分析,Sankhy=a Ser。答:·Zbl 0137.13002号
[43] Weinert,H.L.,Whittaker-Henderson平滑的高效计算,计算。统计师。数据分析。,52, 959-974 (2007) ·Zbl 1452.62139号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。