×

线性模型中的去凸正则估计和区间估计。 (英语) Zbl 07714166号

摘要:为(xi/\operatorname{Var}[xi]^{1/2})和(boldsymbol{z}\sim N(\boldsymbol{0},\boldsymbol)的线性函数和二次函数之间的距离(L_2)开发了新的上界{我}_{n} )\)对于形式为\(\xi=\boldsymbol{z}^\top f(\boldsymbol{z})-\operatorname{div}f(\boldsymbol{z})\)的随机变量。当\(f(\boldsymbol{z})\)的平方范数在期望中支配\(nabla f(\boldsymbol{z})\)的平方Frobenius范数时,线性近似产生了一个中心极限定理。
在常数(0,infty)的区域(p/n\leq\gamma)中,给出了带相关设计和凸惩罚的线性回归中亏损估计的渐近正态性的这个正态近似的应用。对于线性函数的估计{a} _0(0)未知系数向量(β)的β),此分析导致大多数归一化方向(黑体符号{a} 0\)其中,“大多数”被精确地量化。该渐近正态性适用于任何凸惩罚,如果\(\gamma<1),以及任何强凸惩罚,当\(\gamma\geq 1)。特别是,惩罚不需要是可分离的或置换不变量。通过允许任意正则化,结果大大拓宽了去噪方法的适用范围,以获得高维的置信区间。在(p>n)不存在强凸性的情况下,在附加条件下,得到了Lasso和群Lasso的亏损估计的渐近正态性。对于一般凸惩罚,我们的分析还提供了独立利益的预测和估计误差界。

MSC公司:

62甲12 多元分析中的估计
62层35 鲁棒性和自适应程序(参数推断)
62G15年 非参数容差和置信区间
62J07型 岭回归;收缩估计器(拉索)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Bayati,M.和Montanari,A.(2012年)。高斯矩阵的LASSO风险。IEEE传输。Inf.理论58 1997-2017. ·Zbl 1365.62196号 ·doi:10.1109/TIT.2011.2174612
[2] Bellec,P.和Tsybakov,A.(2017年)。带凸惩罚的惩罚最小二乘估计的预测误差界。随机分析与统计的现代问题Springer程序。数学。斯达。208 315-333. 查姆施普林格·Zbl 06848045号 ·数字对象标识代码:10.1007/978-3-319-65313-6_13
[3] BELLEC,P.C.(2018年)。套索和其他凸估计器的噪声屏障和大信号偏差。网址:arXiv:1804.01230,https://arxiv.org/pdf/1804.01230.pdf。
[4] BELLEC,P.C.(2020年)。带凸惩罚的鲁棒m-估计的样本外误差估计。arXiv预印本。可在arXiv:2008.11840上获取。
[5] Bellec,P.C.、Lecué,G.和Tsybakov,A.B.(2018年)。斜率符合拉索:改进了预言界和优化。安。统计师。46 3603-3642. ·Zbl 1405.62056号 ·doi:10.1214/17-AOS1670
[6] BELLEC,P.C.和SHEN,Y.(2022)。正则化m-估计量的导数和残差分布及其在自适应调谐中的应用。学习理论会议1912-1947. PMLR公司。
[7] BELLEC,P.C.和ZHANG,C.-H.(2021)。二阶Stein:SURE用于SURE和高维推理中的其他应用。安。统计师。49 1864-1903. ·Zbl 1486.62209号 ·doi:10.1214/20-aos2005
[8] BELLEC,P.C.和ZHANG,C.-H.(2022)。通过自由度调整消除套索的倾斜。伯努利28 713-743. ·Zbl 07526563号 ·doi:10.3150/21-BEJ1348
[9] Belloni,A.、Chernozhukov,V.和Hansen,C.(2014)。关于结构和治疗效果的高维方法和推断。《经济学杂志》。透视。28 29-50.
[10] Bickel,P.J.、Klaassen,C.A.J.、Ritov,Y.和Wellner,J.A.(1993)。半参数模型的有效自适应估计约翰·霍普金斯数理科学系列约翰·霍普金斯大学出版社,马里兰州巴尔的摩·Zbl 0786.62001号
[11] Bickel,P.J.、Ritov,Y.和Tsybakov,A.B.(2009年)。同时分析套索和Dantzig选择器。安。统计师。37 1705-1732. ·Zbl 1173.62022号 ·doi:10.1214/08-AOS620
[12] 布兰查德·J·D、卡蒂斯·C和坦纳·J(2011)。压缩传感:受限制的等距特性有多尖锐?SIAM版本。53 105-125. ·Zbl 1214.41008号 ·doi:10.1137/090748160
[13] Blumensath,T.和Davies,M.E.(2009年)。用于压缩传感的迭代硬阈值。申请。计算。哈蒙。分析。27 265-274. ·Zbl 1174.94008号 ·doi:10.1016/j.acha.2009.04.002
[14] Bogachev,V.I.(1998)。高斯测度数学调查和专著62.美国。数学。佛罗里达州普罗维登斯Soc·doi:10.1090/surv/062
[15] BU,Z.,KLUSOWSKI,J.,RUSH,C.和SU,W.(2019年)。通过近似信息传递对坡度进行算法分析和统计估计。神经信息处理系统研究进展9361-9371. ·Zbl 1473.62238号
[16] Cai,T.T.和Guo,Z.(2017)。高维线性回归的置信区间:最小最大速率和适应性。安。统计师。45 615-646. ·Zbl 1371.62045号 ·doi:10.1214/16-AOS1461
[17] CELENTANO,M.和MONTANARI,A.(2022年)。凸惩罚高维回归的基本障碍。安。统计师。50 170-196. ·Zbl 1486.62198号 ·doi:10.1214/21-aos2100
[18] CELENTANO,M.、MONTANARI,A.和WEI,Y.(2020年)。拉索具有一般高斯设计,用于假设检验。ArXiv预印本。可从ArXiv:2007.13716获得。
[19] Chatterjee,S.(2009年)。特征值波动与二阶Poincaré不等式。普罗巴伯。理论相关领域143 1-40. ·Zbl 1152.60024号 ·doi:10.1007/s00440-007-0118-6
[20] David,K.R.和SZAREK,S.J.(2001年)。局部算子理论、随机矩阵和Banach空间。巴拿赫空间几何手册,第一卷317-366. 荷兰北部,阿姆斯特丹·兹比尔1067.46008 ·doi:10.1016/S1874-5849(01)80010-3
[21] Donoho,D.和Montanari,A.(2016)。高维稳健M估计:通过近似消息传递的渐近方差。普罗巴伯。理论相关领域166 935-969. ·Zbl 1357.62220号 ·doi:10.1007/s00440-015-0675-z
[22] Edelman,A.(1988)。随机矩阵的特征值和条件数。SIAM J.矩阵分析。申请。9 543-560. ·Zbl 0678.15019号 ·doi:10.1137/0609045
[23] El Karoui,N.、Bean,D.、Bickel,P.J.、Lim,C.和Yu,B.(2013)。关于具有高维预测因子的稳健回归。程序。国家。阿卡德。科学。美国110 14557-14562. ·Zbl 1359.62184号
[24] Fan,J.和Li,R.(2001)。通过非冲突惩罚似然及其oracle属性进行变量选择。J.Amer。统计师。协会。96 1348-1360. ·兹比尔1073.62547 ·doi:10.1198/016214501753382273
[25] Feng,L.和Zhang,C.-H.(2019)。排序凹惩罚回归。安。统计师。47 3069-3098. ·Zbl 1435.62262号 ·doi:10.1214/18-AOS1759
[26] Javanmard,A.和Montanari,A.(2014)。高维回归的置信区间和假设检验。J.马赫。学习。物件。15 2869-2909. ·Zbl 1319.62145号
[27] Javanmard,A.和Montanari,A.(2014)。高斯随机设计模型下高维回归的假设检验:渐近理论。IEEE传输。Inf.理论60 6522-6554. ·兹比尔1360.62074 ·doi:10.1109/TIT.2014.2343629
[28] Javanmard,A.和Montanari,A.(2018年)。去除拉索:高斯设计的最佳样本量。安。统计师。46 2593-2622. ·兹比尔1407.62270 ·doi:10.1214/17-AOS1630
[29] Laurent,B.和Massart,P.(2000年)。通过模型选择对二次函数进行自适应估计。安。统计师。28 1302-1338. ·Zbl 1105.62328号
[30] Lecué,G.和Mendelson,S.(2018年)。正则化和小球法I:稀疏恢复。安。统计师。46 611-641. ·Zbl 1403.60085号 ·doi:10.1214/17-AOS1562
[31] Lei,L.、Bickel,P.J.和El Karoui,N.(2018年)。高维回归估计的渐近性:固定的设计结果。普罗巴伯。理论相关领域172 983-1079. ·Zbl 1406.62084号 ·doi:10.1007/s00440-017-0824-7
[32] LOUREIRO,B.、GERBELOT,C.、CUI,H.、GOLDT,S.、KRZAKALA,F.、MEZARD,M.和ZDEBOROVá,L.(2021年)。具有师生模型的真实数据集的通用特征映射的学习曲线。高级神经信息处理。系统。34 18137-18151. ·Zbl 07632718号
[33] MIOLANE,L.和MONTANARI,A.(2021)。套索的分布:对稀疏球的均匀控制和自适应参数调整。安。统计师。49 2313-2335. ·Zbl 1480.62145号 ·doi:10.1214/20-aos2038
[34] MOHAMED,N.(2020年)。高维线性回归中的标度极小极大最优性:一种非凸算法正则化方法。arXiv预印本。网址:arXiv:2008.12236。
[35] NICULESCU,C.P.和PERSSON,L.-E.(2006年)。凸函数及其应用CMS数学书籍/SMC数学手册23.纽约州斯普林格·兹比尔1100.262002 ·doi:10.1007/0-387-31077-0
[36] Silverstein,J.W.(1985)。大维Wishart矩阵的最小特征值。Ann.遗嘱认证。13 1364-1368. ·兹比尔0591.60025
[37] Stein,C.M.(1981)。多元正态分布平均值的估计。安。统计师。9 1135-1151. ·Zbl 0476.62035号
[38] Sun,T.和Zhang,C.-H.(2012)。缩放稀疏线性回归。生物特征99 879-898·Zbl 1452.62515号
[39] Sun,T.和Zhang,C.-H.(2013)。用缩放拉索进行稀疏矩阵反演。J.马赫。学习。物件。14 3385-3418. ·Zbl 1318.62184号
[40] Sur,P.和Candès,E.J.(2019年)。高维逻辑回归的现代极大似然理论。程序。国家。阿卡德。科学。美国116 14516-14525. ·Zbl 1431.62084号 ·doi:10.1073/pnas.1810420116
[41] Talagrand,M.(2011)。自旋玻璃的平均场模型。第一卷以下为:基本示例Ergebnisse der Mathematik和Ihrer Grenzgebiete. 3.福克。现代数学调查系列[数学及相关领域成绩. 3rd系列。现代数学调查系列] 54. 柏林施普林格·Zbl 1214.82002号 ·doi:10.1007/978-3-642-15202-3
[42] THRAMPOULIDIS,C.、ABBASI,E.和HASSIBI,B.(2015)。具有非线性测量的套索相当于具有线性测量的套索。神经信息处理系统研究进展3420-3428.
[43] Thrampoulidis,C.、Abbasi,E.和Hassibi,B.(2018年)。高维正则化M估计的精确误差分析。IEEE传输。Inf.理论64 5592-5628. ·兹比尔1401.94051 ·doi:10.1109/TIT.2018.2840720
[44] Tibshirani,R.J.(2013)。套索问题和唯一性。电子。J.统计。7 1456-1490. ·Zbl 1337.62173号 ·doi:10.1214/13-EJS815
[45] VAITER,S.、DELEDALLE,C.、PEYRÉ,G.、FADILI,J.和DOSSAL,C.(2012年)。套索组的自由度。arXiv预印本。可从arXiv:1205.1481获得·Zbl 1382.62027号
[46] van de Geer,S.、Bühlmann,P.、Ritov,Y.和Dezeure,R.(2014)。关于高维模型的渐近最优置信域和检验。安。统计师。42 1166-1202. ·Zbl 1305.62259号 ·doi:10.1214/14-AOS1221
[47] Vershynin,R.(2018)。高维概率以下为:数据科学应用简介剑桥统计与概率数学系列47.剑桥大学出版社,剑桥·Zbl 1430.60005号 ·doi:10.1017/9781108231596
[48] Zhang,C.-H.(2010)。极小极大凹惩罚下的几乎无偏变量选择。安。统计师。38 894-942. ·Zbl 1183.62120号 ·doi:10.1214/09-AOS729
[49] 张春华(2011)。高维数据的统计推断。数学。福施。Oberwolfach公司48 28-31.
[50] Zhang,C.-H.和Huang,J.(2008)。高维线性回归中LASSO选择的稀疏性和偏差。安。统计师。36 1567-1594·Zbl 1142.62044号 ·doi:10.1214/07-AOS520
[51] Zhang,C.-H.和Zhang、S.S.(2014)。高维线性模型中低维参数的置信区间。J.R.统计社会服务。B.统计方法。76 217-242 ·Zbl 1411.62196号 ·doi:10.1111/rssb.12026
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。