珀博斯特加

PBoostGA:用于变量排序和选择的伪boosting遗传算法。变量选择一直是线性回归模型中的一个热门话题,尤其是在面对高维数据时。变量排序,一种高级的选择形式,实际上是更基本的,因为一旦变量被适当地排序,就可以通过阈值来实现选择。近年来,集成学习因其在提高选择精度和降低错误地包含一些不重要变量的风险方面的巨大潜力而受到了广泛的关注。基于boosting算法的广泛成功,本文提出了一种新的集成方法PBoostGA来实现线性回归模型中变量的排序和选择。PBoostGA在训练集上保持一个权值分布,并采用遗传算法作为其基本学习者。最初,为每个实例指定相等的权重。根据AdaBoost.RT等权重更新和集成成员生成机制,对每个变量依次生成一系列略有不同的重要性度量。最后,根据平均重要度对候选变量进行排序,然后通过阈值规则选择有效变量。仿真结果和实际数据说明了PBoostGA的有效性。特别是PBoostGA具有更强的排除冗余变量的能力。