×

分段Lipschitz估计的自由度。 (英语。法语摘要) Zbl 1393.62034号

考虑了具有未知参数的多元高斯模型(Y\sim N(\mu,\sigma^2I))。估计器的自由度(DF)是(DF(hat{mu}):=sum{i=1}^n\frac{mathrm{cov}(Y_i,hat{mu}(Y)_i)}{sigma^2})。如果在勒贝格几乎所有点上\(\hat{\mu}\)都是可微的,则\(\mu\)的Stein-si DF是\(DF_S(\hat{\muneneneep):=E(\operatorname{div}(\aht{\mu})(Y))如果\(\hat{\mu}\)是几乎可微的则由于C.M.斯坦因【Ann.Stat.9,1135–1151(1981;Zbl 0476.62035号)]. 本文的主要结果为一系列不连续估计量提供了(df(hat{\mu})-df_S(hat{\muneneneep))的表示形式,这些不连续估计数包含一些包括变量选择的回归估计量。
对于套索-普通最小二乘法(OLS),这将产生DF估计值,进而可以估计套索-OLS的二次风险。仿真结果表明,风险估计可导致可靠的模型选择,且风险估计本身的均方误差小于交叉验证估计。
对于最佳子集选择,\(df(\hat{\mu})-df_S(\hat{\mu})\)的表示也适用,但与套索OLS相比,情况更复杂。然而,可以导出一个近似值,这对于正交设计是精确的。

MSC公司:

62J05型 线性回归;混合模型
62J07型 岭回归;收缩估计器(拉索)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] L.布雷曼。回归中选择维数的小bootstrap等方法:X固定预测误差。J.Amer。统计师。协会87(419)(1992)738-754·Zbl 0850.62518号 ·doi:10.1080/01621459.1992.10475276
[2] P.Bühlmann和S.van de Geer。高维数据统计:方法、理论和应用。统计学中的斯普林格系列。施普林格,海德堡,2011年·Zbl 1273.62015年
[3] A.Dalalyan和A.Tsybakov。通过指数加权、尖锐的PAC-Baysian边界和稀疏性进行聚集。机器。学习72(2008)39-61·Zbl 1470.62054号
[4] D.L.Donoho和I.M.Johnstone。通过小波收缩适应未知平滑度。J.Amer。统计师。协会90(432)(1995)1200-1224·兹比尔0869.62024 ·网址:10.1080/01621459.1995.10476626
[5] B.埃夫隆。预测误差的估计:协方差惩罚和交叉验证。J.Amer。统计师。Assoc.99(467)(2004)619-632·兹比尔1117.62324 ·doi:10.1198/016214500000692
[6] B.Efron、T.Hastie、I.Johnstone和R.Tibshirani。最小角度回归。《统计年鉴》32(2)(2004)407-499。通过讨论,以及作者的反驳·Zbl 1091.62054号 ·doi:10.1214/009053604000000067
[7] L.Evans和R.Gariepy。测度理论与函数的精细性质。高等数学研究。Taylor&Francis,伦敦,1992年·Zbl 0804.28001号
[8] J.Fan、L.Xue和H.Zou。折凹惩罚估计的强预言最优性。《统计年鉴》42(3)(2014)819-849·兹比尔1305.62252 ·doi:10.1214/13-AOS1198
[9] H.费德勒。几何测量理论。Grundlehren der mathematischen Wissenschaften公司。柏林施普林格,1969年·Zbl 0176.00801号
[10] J.Friedman、T.Hastie和R.Tibshirani。广义线性模型的坐标下降正则化路径。《J.Stat.Softw.33(1)》(2010)1-22。
[11] G.Givens和J.Hoeting。计算统计。计算统计学中的威利级数。约翰·威利父子公司,霍博肯,2012年·Zbl 1079.62001号
[12] N.R.Hansen和A.Sokol。非线性最小二乘估计的自由度,2014年。可在http://arxiv.org/abs/1402.2997。
[13] T.J.Hastie和R.J.Tibshirani。广义加性模型。统计学和应用概率专著。43.查普曼和霍尔有限公司,伦敦,1990年·Zbl 0747.62061号
[14] 加藤。关于收缩率估计中的自由度。《多变量分析杂志》100(7)(2009)1338-1352·Zbl 1162.62067号 ·doi:10.1016/j.jmva.2008.12.002
[15] J.D.Lee、D.L.Sun、Y.Sun和J.E.Taylor。精确的后选择推理,并应用于套索。《统计年鉴》44(3)(2016)907-927·Zbl 1341.62061号 ·doi:10.1214/15-AOS1371
[16] T.Loi和P.Phien。Hausdorff测度的界是驯服集。数学学报。越南39(4)(2014)637-647·Zbl 1308.14040号 ·doi:10.1007/s40306-014-0090-z
[17] N.明绍森。放松的套索。计算。统计师。数据分析52(1)(2007)374-393·Zbl 1452.62522号 ·doi:10.1016/j.csda.2006.12.019
[18] M.Meyer和M.Woodroof。形状限制回归中的自由度。《统计年鉴》28(4)(2000)1083-1104·Zbl 1105.62340号 ·doi:10.1214/aos/1015956708
[19] F.Mikkelsen和N.Hansen。2017年“分段Lipschitz估计器的自由度”补充材料。可在http://doi.org/10.5281/zenodo.321847。 ·兹比尔1393.62034
[20] S.Reid、R.Tibshirani和J.Friedman。套索回归中误差方差估计的研究。统计师。Sinica 26(1)(2016)35-67·Zbl 1372.62023号
[21] C.M.斯坦因。多元正态分布平均值的估计。《统计年鉴》9(6)(1981)1135-1151·Zbl 0476.62035号 ·doi:10.1214/aos/1176345632
[22] R.Tibshirani。通过套索进行回归收缩和选择。J.R.Stat.Soc.,B 58(1)(1996)267-288·Zbl 0850.62538号
[23] R.J.Tibshirani。套索问题和唯一性。电子。J.Stat.7(2013)1456-1490·Zbl 1337.62173号 ·doi:10.1214/13-EJS815
[24] R.J.Tibshirani。自由度和模型搜索。统计师。Sinica 25(3)(2015)1265-1296·Zbl 1415.62058号
[25] R.J.Tibshirani和J.Taylor。套索问题的自由度。《统计年鉴》40(2)(2012)1198-1232·Zbl 1274.62469号 ·doi:10.1214/12-AOS1003
[26] M.Vincent、K.Perell、F.Nielsen、G.Daugaard和N.Hansen。建立组织污染模型,以改进转移原发肿瘤部位的分子鉴定。生物信息学30(10)(2014)1417-1423。
[27] Ye。关于测量和纠正数据挖掘和模型选择的影响。J.Amer。统计师。协会93(441)(1998)120-131·Zbl 0920.62056号 ·数字标识代码:10.1080/01621459.1998.10474094
[28] H.Zou、T.Hastie和R.Tibshirani。关于套索的自由度。《统计年鉴》35(5)(2007)2173-2192·Zbl 1126.62061号 ·doi:10.1214/09053607000000127
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。