De-biasing the lasso with degrees-of-freedom adjustment

Pierre C. Bellec; Cun-Hui Zhang

doi:10.3150/21-BEJ1348

摘要

本文研究了高斯设计稀疏线性回归中拉索解偏倚的方案，其目标是估计和构造未知系数向量在预想方向上的低维投影的置信区间 ${\boldsymbol{a}_{0}}$ 。我们的分析表明，之前分析的去偏Lasso的命题需要修改，以便在稀疏度的整个范围内享受标称覆盖和渐近效率。这种修改采用了自由度调整的形式，该自由度调整考虑了拉索选择的模型的尺寸。自由度调整（a）在先前提案成功的制度中保持去偏倚方法的成功，以及（b）在先前的提案产生虚假推论且证明无法实现名义覆盖的制度中修复名义覆盖并提供效率。因此，我们的理论和模拟结果要求在去偏倚方法中实施这种自由度调整。

让 ${s_{0}}$ 表示真系数向量的非零系数的个数，∑人口Gram矩阵。未经调整的去偏倚方案可能无法尽快实现标称覆盖 ${s_{0}}\ggg {n^{2/3}}$ 如果∑已知。如果∑未知，则自由度调整将为一般方向上的对比度提供效率 ${\boldsymbol{a}_{0}}$ 什么时候

$\frac{{s_{0}}\log p}{n}+\min {\frac{{s_{\Omega }}\log p}{n},\frac{\| {\Sigma ^{-1}}{\boldsymbol{a}_{0}}{\| _{1}}\sqrt{\log p}}{\| {\Sigma ^{-1/2}}{\boldsymbol{a}_{0}}{\| _{2}}\sqrt{n}}}+\frac{\min ({s_{\Omega }},{s_{0}})\log p}{\sqrt{n}}\to 0$

哪里 ${s_{\Omega }}=\| {\Sigma ^{-1}}{\boldsymbol{a}_{0}}{\| _{0}}$ .中的依赖性 ${s_{0}},{s_{\Omega }}$ 和 $\| {\Sigma ^{-1}}{\boldsymbol{a}_{0}}{\| _{1}}$ 是最优的，并缩小了上下限之间的差距。我们对估计得分向量的构造提供了一种处理密集方向的新方法 ${\boldsymbol{a}_{0}}$ .

除了自由度调整之外，我们的证明技术产生了一个尖锐的 ${\ell _{\infty }}$ Lasso的误差范围是独立关注的。

资金筹措表

P.C.B.得到了NSF拨款DMS-1811976和DMS-1945428的部分支持。
C-H.Z.得到了NSF拨款DMS-1513378、IIS-1407939、DMS-1721495、IIS-1741390和CCF-1934924的部分支持。

引用

下载引文

皮埃尔·C·贝莱克。张存辉。 “通过自由度调整来消除套索的倾斜。” 伯努利 28 (2) 713 - 743, 2022年5月。 https://doi.org/10.3150/21-BEJ1348

问询处

收到日期：2020年5月1日;修订日期：2021年3月1日;发布日期：2022年5月

欧几里德项目首次推出：2022年3月3日

数学科学网：MR4389062型

zbMATH公司：07526563

数字对象标识符：10.3150/21-BEJ1348

关键词：置信区间,效率,Fisher信息,高维数据,拉索,p值,回归，回归,半参数模型,统计推断

摘要

资金筹措表

引用

问询处

关键词/短语

出版物标题：

出版年份