摘要
本文探讨了以下问题:在高维模型中进行变量选择时,可以提供什么样的统计保证?特别是,我们研究了一些多级回归方法的错误率和威力。在第一阶段,我们拟合一组候选模型。在第二阶段,我们通过交叉验证选择一个模型。在第三阶段,我们使用假设检验来消除一些变量。我们将前两个阶段称为“筛选”,将最后一个阶段称之为“清理”。我们考虑了三种筛选方法:套索、边际回归和正向逐步回归。我们的方法在一定条件下给出了一致的变量选择。
引用
下载引文
拉里·沃瑟曼(Larry Wasserman)。
凯瑟琳·罗德。
“高维变量选择。”
安。统计师。
37
(5安培)
2178 - 2201,
2009年10月。
https://doi.org/10.1214/08-AOS646
问询处
发布日期:2009年10月
首次在欧几里得项目中提供:2009年7月15日
数字对象标识符:10.1214/08-AOS646
受试者:
主要用户:62J05型
次要:62J07型
关键词:拉索,稀疏度,逐步回归
版权所有©2009数学统计研究所