随机子空间集合分类与变量筛选
针对稀疏分类问题,我们提出了一个通用的集成分类框架RaSE算法。在RaSE算法中,对于每个弱学习者,生成一些随机子空间,并根据一些准则选择最优子空间来训练模型。为了适应这一问题,基于Kullback-Leibler散度,提出了一种新的比率信息准则(RIC)。除了最小化RIC之外,还可以应用多种标准,例如,最小化扩展贝叶斯信息准则(eBIC)、最小化训练误差、最小化验证误差、最小化交叉验证误差、最小化遗漏误差。基本分类器有多种选择,例如线性判别分析、二次判别分析、k近邻、逻辑回归、决策树、随机森林、支持向量机。RaSE算法还可以用于进行特征排序,根据在多个子空间中选择的百分比为我们提供每个特征的重要性。RaSE框架可以扩展到一般预测框架,包括分类和回归。我们可以使用选定的变量百分比进行变量筛选。最新版本增加了回归和分类问题的变量筛选功能。
文档:
下载内容:
链接:
请使用规范形式https://CRAN.R-project.org/package=RaSEn链接到此页面。