随机子空间集合分类与变量筛选
针对稀疏分类问题,我们提出了一个通用的集成分类框架RaSE算法。在RaSE算法中,对于每个弱学习者,生成一些随机子空间,并根据一些准则选择最优子空间来训练模型。为了适应这一问题,基于Kullback-Leibler散度,提出了一种新的比率信息准则(RIC)。除了最小化RIC之外,还可以应用多种标准,例如,最小化扩展贝叶斯信息准则(eBIC)、最小化训练误差、最小化验证误差、最小化交叉验证误差、最大限度地减少遗漏误差。基本分类器有多种选择,例如线性判别分析、二次判别分析、k近邻、逻辑回归、决策树、随机森林、支持向量机。RaSE算法还可以用于进行特征排序,根据在多个子空间中选择的百分比为我们提供每个特征的重要性。RaSE框架可以扩展到一般预测框架,包括分类和回归。我们可以使用选定的变量百分比进行变量筛选。最新版本增加了回归和分类问题的变量筛选功能。
版本: |
3.0.0 |
取决于: |
R(≥3.1.0) |
进口: |
MASS(质量),插入符号,班,do并行,e1071号,foreach公司,奈特,随机森林,r零件,统计数据,ggplot2,额外网格,格式R,FNN公司,护林员,内核Knn,实用程序,ModelMetrics(模型度量),格尔姆奈特 |
建议: |
针织者,rmarkdown公司 |
出版: |
2021-10-16 |
作者: |
叶田[aut,cre]和杨峰[aut] |
维护人员: |
叶田(Ye Tian)<columbia.edu> |
许可证: |
GPL-2型 |
需要编译: |
不 |
材料: |
新闻 |
CRAN检查: |
RaSEn结果 |
文档:
下载内容:
链接:
请使用规范形式https://CRAN.R-project.org/package=拉森链接到此页面。