尼古拉·明绍森;卢卡斯·迈耶;彼得·伯尔曼 \高维回归的(p\)-值。 (英语) Zbl 1205.62089号 美国统计协会。 104,第488号,1671-1681(2009)。 摘要:在高维回归中分配显著性是一项挑战。大多数计算效率高的选择算法无法防止包含噪声变量。渐近有效\(p\)-值不可用。一个例外是Wasserman和Roeder最近的一项提议,将数据分成两部分。然后,使用第一次拆分将变量数量减少到可管理的大小,而使用第二次拆分的数据,可以将经典变量选择技术应用于其余变量。这在最小条件下产生了渐近误差控制。然而,这涉及到数据的一次性随机分割。结果对这种任意选择很敏感,这相当于“p值彩票”,并且很难重现结果。在这里,我们表明可以聚合多个随机分裂的推断,同时保持对包含噪声变量的渐近控制。我们表明,得到的(p)-值可以用于控制家族错误和错误发现率。此外,所提出的聚合可以提高功率,同时大大减少错误选择的变量的数量。 引用于118文件 MSC公司: 62J05型 线性回归;混合模型 62J07型 岭回归;收缩估计器(拉索) 关键词:数据拆分;错误发现率;家庭错误率;高维变量选择;多重比较 PDF格式BibTeX公司 XML格式引用 \textit{N.Meinshausen}等人,《美国统计协会期刊》104,第488、1671--1681号(2009年;Zbl 1205.62089) 全文: 内政部 arXiv公司