随机子空间集合分类与变量筛选

针对稀疏分类问题,我们提出了一个通用的集成分类框架RaSE算法。在RaSE算法中,对于每个弱学习者,生成一些随机子空间,并根据一些准则选择最优子空间来训练模型。为了适应这一问题,基于Kullback-Leibler散度,提出了一种新的比率信息准则(RIC)。除了最小化RIC之外,还可以应用多种标准,例如,最小化扩展贝叶斯信息准则(eBIC)、最小化训练误差、最小化验证误差、最小化交叉验证误差、最大限度地减少遗漏误差。基本分类器有多种选择,例如线性判别分析、二次判别分析、k近邻、逻辑回归、决策树、随机森林、支持向量机。RaSE算法还可以用于进行特征排序,根据在多个子空间中选择的百分比为我们提供每个特征的重要性。RaSE框架可以扩展到一般预测框架,包括分类和回归。我们可以使用选定的变量百分比进行变量筛选。最新版本增加了回归和分类问题的变量筛选功能。

版本: 3.0.0
取决于: R(≥3.1.0)
进口: MASS(质量),插入符号,,do并行,e1071号,foreach公司,奈特,随机森林,r零件,统计数据,ggplot2,额外网格,格式R,FNN公司,护林员,内核Knn,实用程序,ModelMetrics(模型度量),格尔姆奈特
建议: 针织者,rmarkdown公司
出版: 2021-10-16
作者: 叶田[aut,cre]和杨峰[aut]
维护人员: 叶田(Ye Tian)<columbia.edu>
许可证: GPL-2型
需要编译:
材料: 新闻
CRAN检查: RaSEn结果

文档:

参考手册: RaSEn.pdf格式
守夜人: RaSEn演示

下载内容:

包源: RaSEn_3.0.0目标.gz
Windows二进制文件: r-devel公司:RaSEn_3.0.0.zip格式,r版本:RaSEn_3.0.0.zip格式,r-oldrel:RaSEn_3.0.0.zip格式
macOS二进制文件: r释放(arm64):拉森_3.0.0.tgz,r-oldrel(arm64):瑞森-3.0.0.tgz,r-版本(x86_64):瑞森-3.0.0.tgz,r-oldrel(x86_64):瑞森-3.0.0.tgz
旧来源: RaSEn存档

链接:

请使用规范形式https://CRAN.R-project.org/package=拉森链接到此页面。