摘要:
针对传统随机森林随特征数增加计算消耗高的问题,提出了一种随机森林多特征置换算法。该算法对数据特征进行聚类,保持其他特征簇不变,逐一对同簇特征同时随机置换,得到全部特征簇的重要性得分及簇间排序。簇内特征按与分类信息的相关程度排序,引入相关性阈值选出重要特征,对剩余特征按先簇间、再簇内的规则进行排序。为了进一步比较该方法的有效性,基于【K】均值聚类、层次聚类、模糊[中]均值聚类算法,设计了三种随机森林多特征置换的特征选择算法。实验结果表明,与传统随机森林方法相比,新算法可选择较少特征时仍取得较高分类精度,且时间效率更高。
武炜杰,张景祥. 融合分类信息的随机森林特征选择算法及应用[J] ●●●●。计算机工程与应用, 2021, 57(17): 147-156.
吴伟杰、张景祥。基于分类信息的随机森林特征选择算法及其应用[J]。计算机工程与应用,2021,57(17):147-156。