主页

论文

提交文件

新闻

编辑委员会

开源软件

程序(PMLR)

交易(TMLR)

搜索

统计

登录

常见问题

联系我们



RSS源

一种重要加权特征选择稳定性测度

维克托·哈默(Victor Hamer)、皮埃尔·杜邦(Pierre Dupont); 22(116):1−57, 2021.

摘要

当前的特征选择方法,尤其是应用于高维数据的特征选择,往往会受到不稳定性的影响,因为数据中的边际修改可能会导致选择的特征集在很大程度上不同。这种不稳定性严重限制了领域专家对选定变量的合理解释。定义适当的稳定性度量也是一个研究问题。在这项工作中,我们建议将预测模型中选定特征的重要性纳入稳定性度量。这些特征重要性与线性模型中的特征权重成正比。我们还考虑了对非线性设置的推广。我们从理论和实验上说明,当前的稳定措施会出现不良行为,例如,当它们与预测精度联合优化时。微阵列和质谱数据的结果表明,我们的新稳定性度量纠正了在这种双目标环境下过于乐观的稳定性估计,从而改进了决策。在具有高度相关变量组的特征空间中,它也不太容易低估或过高估计稳定性值。

[腹肌][pdf格式][围兜]      
©JMLR公司2021(编辑,贝塔)