开放式访问
2008年8月 高维问题中特征选择和回归的“预处理”
德巴希斯·保罗,埃里克·拜尔,黑斯蒂,罗伯特·蒂施莱尼
安。统计师。 36(4): 1595-1618 (2008年8月)。 内政部:10.1214/009053600000000578

摘要

我们考虑回归问题,其中预测因子的数量大大超过了观测值的数量。我们提出了一种变量选择方法,首先估计回归函数,得到“预处理”响应变量。用于初始回归的主要方法是监督主成分。然后我们对预处理的响应变量应用标准程序,如正向逐步选择或LASSO。在许多模拟和实际数据示例中,此两步程序优于正向逐步选择或通常的LASSO(直接应用于原始结果)。我们还表明,在一定的高斯隐变量模型下,随着预报器和观测数的增加,LASSO对预处理响应变量的应用是一致的。此外,当观测噪声较大时,所建议的方法可以比LASSO给出更准确的估计。我们在一些实际问题上说明了我们的方法,包括用微阵列数据进行生存分析。

引用

下载引文

黛巴希斯·保罗。 埃里克·拜尔。 特雷弗·哈斯蒂。 罗伯特·提比拉尼(Robert Tibshirani)。 “预处理”用于高维问题中的特征选择和回归。” 安。统计师。 36 (4) 1595 - 1618, 2008年8月。 https://doi.org/10.1214/009053607000000578

问询处

发布日期:2008年8月
欧几里德项目首次推出:2008年7月16日

zbMATH公司:1142.62022
数学科学网:MR2435449号
数字对象标识符:10.1214/009053600000000578

学科:
主要用户:62J07型

关键词:拉索,型号选择,预测误差

版权所有©2008数学统计研究所

第36卷•第4期•2008年8月
返回页首