当试图学习一个模型来预测给定一组协变量的结果时,统计学家的工具箱中有许多估计程序。这些候选学习者的几个例子是:最小二乘法、最小角度回归、随机森林和样条回归。以前的文章(van der Laan和Dudoit(2003);van der Laan等人(2006);Sinisi等人(2007)从理论上验证了交叉验证在众多候选学习者中选择最佳学习者的应用。基于这种交叉验证的使用,我们提出了一种新的预测方法,用于创建多个候选学习者的加权组合,以构建超级学习者。本文提出了一种用于构建预测中的超级学习器的快速算法,该算法使用V折叠交叉验证来选择权重来组合候选学习器的初始集合。此外,本文还实际演示了这种所谓的超级学习器对各种真实数据生成分布的适应性。这种构造超级学习器的方法可以推广到任何可以定义为损失函数最小值的参数。
©2011 Walter de Gruyter GmbH&Co.KG,柏林/波士顿