主页

文件

提交文件

新闻

编辑委员会

特殊问题

开源软件

程序(PMLR)

数据(DMLR)

交易(TMLR)

搜索

统计

登录

常见问题

联系我们



RSS源

流式功能选择

Jing Zhou,院长P.Foster,Robert A.Stine,Lyle H.Ungar; 7(67):1861−18852006年。

摘要

流向特征选择,新功能按顺序排列考虑加入预测模型。潜在功能很大,可选择流线型功能与传统特征选择方法相比有许多优点假设所有特征都是预先知道的。功能可以是动态生成,重点搜索新功能有希望的子空间和过拟合可以通过动态调整阈值以将功能添加到模型。与传统的正向特征选择不同算法,如逐步回归,其中每一步都评估可能的特征并选择最佳特征,流向特征选择仅在以下情况下对每个特征求值一次它是生成的。我们描述信息投资和α-投资,两种自适应复杂度惩罚方法动态调整阈值的流向特征选择关于添加新特征所需的误差减少。这两个方法提供了错误发现率类型的保证过盈。它们不同于AIC、,BIC和RIC,在无限个非预测特征的极限。经验主义的结果表明,流向回归与(on小数据集)并优于(大数据集)更多计算密集型特征选择方法,如逐步回归,并允许对数百万个问题进行特征选择潜在功能。

[腹肌][pdf格式][围兜]      
©JMLR公司2006(编辑,贝塔)

乳臭虫