跳到内容
获得许可 未经许可 需要身份验证 发布人:德古意特出版社 2008年3月14日

高维Bootstrap样本中有偏复杂度选择的自适应预测误差估计

  • 哈拉尔德粘合剂 马丁·舒马赫

bootstrap是一种工具,可以有效评估统计技术的预测性能,而无需保留数据进行验证。这对于高维数据尤其重要,例如由微阵列产生的数据,因为在那里观察的数量通常是有限的。为了避免过度乐观,必须以用于新数据的相同方式将待评估的统计技术应用于每个引导样本。这包括选择复杂性,例如梯度增强算法的增强步骤数。使用后者,我们在一项模拟研究中证明,在许多情况下,用替换方法绘制的传统引导样本中的复杂性选择存在严重偏差。这就意味着预测误差估计值存在相当大的偏差,通常低估了可以从高维数据中提取的信息量。对这种复杂性选择偏差的潜在补救方法进行了研究,例如使用固定的复杂性水平或使用采样而不进行替换,结果表明,后者在许多情况下都能很好地工作。我们关注高维二进制响应数据,使用bootstrap.632以上的Brier分数估计值进行性能评估,使用0.632以上的预测误差曲线估计值对时间到事件数据进行删减。后者通过改良的引导程序,应用于弥漫性大B细胞淋巴瘤患者的微阵列数据的例子。

在线发布:2008-3-14

©2011 Walter de Gruyter GmbH&Co.KG,柏林/波士顿

于2024年4月25日从下载https://www.degruyter.com/document/doi/10.2202/1544-6115.1346/html
滚动到顶部按钮