开放式访问
2020年10月 哪种桥式估计器最适合变量选择?
王帅文,翁浩蕾(Haolei Weng),阿里安·马利基
安。统计师。 48(5): 2791-2823 (2020年10月)。 数字对象标识码:10.1214/19-AOS1906

摘要

我们研究了高维渐近设置下线性模型的变量选择问题,其中观察数$n$的增长速度与预测数$p$的增长速率相同。我们考虑两阶段变量选择技术(TVS),其中第一阶段使用桥式估计量来获得回归系数的估计值,第二阶段简单地阈值化该估计值以选择“重要”预测因子。评估了这些TVS的渐近假发现比例($\operatorname{AFDP}$)和真正比例(ATPP)。我们证明了对于固定的ATPP,为了获得较小的$\operatorname{AFDP}$,应该在TVS的第一阶段选择一个渐近均方误差较小的桥式估计量。基于这一原则性发现,我们通过深入研究桥梁估计器的估计特性,对不同的TVS进行了尖锐的比较。我们的分析侧重于精确的误差表征,而不是使用松散常数的“有序”误差界。研究了各种有趣的信噪比和稀疏度设置。我们的结果为高维变量选择提供了新的、彻底的见解。例如,我们证明了在大噪声设置下,第一阶段具有Ridge的TVS优于具有其他桥接估计器的TVS;当信号稀少且微弱时,两级LASSO变差。作为副产品,我们表明在某些条件下,两阶段方法优于一些标准变量选择技术,例如$\operatorname{LASSO}$和Sure Independence Screening。

引用

下载引文

王帅文。 翁浩雷。 Arian Maleki。 “哪种桥接估计器最适合变量选择?” 安。统计师。 48 (5) 2791 - 2823, 2020年10月。 https://doi.org/10.1214/19-AOS1906

问询处

收到日期:2019年3月1日;发布日期:2020年10月
欧几里德项目首次提供:2020年9月19日

数学科学网:MR4152121
数字对象标识符:10.1214/19-AOS1906

学科:
主要用户:62J05型,62J07型

关键词:桥梁回归,去除油脂,错误发现比例,高维,大噪音,大样本,罕见信号,真正比例,两阶段方法,变量选择

版权所有©2020数学统计研究所

第48卷•第5期•2020年10月
返回页首