摘要
本文研究了高斯设计稀疏线性回归中拉索解偏倚的方案,其目标是估计和构造未知系数向量在预想方向上的低维投影的置信区间。我们的分析表明,之前分析的去偏Lasso的命题需要修改,以便在稀疏度的整个范围内享受标称覆盖和渐近效率。这种修改采用了自由度调整的形式,该自由度调整考虑了拉索选择的模型的尺寸。自由度调整(a)在先前提案成功的制度中保持去偏倚方法的成功,以及(b)在先前的提案产生虚假推论且证明无法实现名义覆盖的制度中修复名义覆盖并提供效率。因此,我们的理论和模拟结果要求在去偏倚方法中实施这种自由度调整。
让表示真系数向量的非零系数的个数,∑人口Gram矩阵。未经调整的去偏倚方案可能无法尽快实现标称覆盖如果∑已知。如果∑未知,则自由度调整将为一般方向上的对比度提供效率什么时候
哪里.中的依赖性和是最优的,并缩小了上下限之间的差距。我们对估计得分向量的构造提供了一种处理密集方向的新方法.
除了自由度调整之外,我们的证明技术产生了一个尖锐的Lasso的误差范围是独立关注的。
资金筹措表
P.C.B.得到了NSF拨款DMS-1811976和DMS-1945428的部分支持。
C-H.Z.得到了NSF拨款DMS-1513378、IIS-1407939、DMS-1721495、IIS-1741390和CCF-1934924的部分支持。
引用
下载引文
皮埃尔·C·贝莱克。
张存辉。
“通过自由度调整来消除套索的倾斜。”
伯努利
28
(2)
713 - 743,
2022年5月。
https://doi.org/10.3150/21-BEJ1348
问询处
收到日期:2020年5月1日;修订日期:2021年3月1日;发布日期:2022年5月
欧几里德项目首次推出:2022年3月3日
数字对象标识符:10.3150/21-BEJ1348
关键词:置信区间,效率,Fisher信息,高维数据,拉索,p值,回归,回归,半参数模型,统计推断
权利:版权所有©2022 ISI/BS