基于随机森林的三步变量选择过程。最初开发用于处理高维数据(变量很大程度上超过了观察值的数量)通用,可以处理数据的大多数维度,用于回归和监督分类问题。第一步致力于消除来自数据集的无关变量。第二步旨在选择所有与解释目的的响应相关的变量。第三步通过消除变量集中的冗余来细化选择由第二步选择,用于预测。Genuer,R.Poggi,J.-M.和Tuleau-Malot,C.(2015)<https://journal.r-project.org/archive/2015-2/genuer-poggi-tuleaumalot.pdf>.
请使用规范形式https://CRAN.R-project.org/package=VSURF链接到此页面。