统计>机器学习
标题: 修剪变量选择集合
摘要: 在变量选择的背景下,集成学习由于其在提高选择准确性和降低错误发现率方面的巨大潜力而越来越受到人们的关注。 本文设计了一种新的基于排序的选择性集成学习策略,以获得更小但更准确的集成。 特别地,提出了一种贪婪排序策略,以重新安排成员加入集成过程的顺序。 通过尽早停止融合过程,可以获得具有较高选择精度的较小子集合。 更重要的是,序列包含标准揭示了集合成员之间的基本强度-多样性权衡。 以稳定性选择(StabSel)为例,利用模拟数据和实际数据进行了一些实验,以检验新算法的性能。 实验结果表明,与StabSel和其他几种基准方法相比,剪枝StabSel通常可以获得更高的选择精度和更低的错误发现率。