×

\高维回归的(p\)-值。 (英语) Zbl 1205.62089号

摘要:在高维回归中分配显著性是一项挑战。大多数计算效率高的选择算法无法防止包含噪声变量。渐近有效\(p\)-值不可用。一个例外是Wasserman和Roeder最近的一项提议,将数据分成两部分。然后,使用第一次拆分将变量数量减少到可管理的大小,而使用第二次拆分的数据,可以将经典变量选择技术应用于其余变量。这在最小条件下产生了渐近误差控制。然而,这涉及到数据的一次性随机分割。结果对这种任意选择很敏感,这相当于“p值彩票”,并且很难重现结果。在这里,我们表明可以聚合多个随机分裂的推断,同时保持对包含噪声变量的渐近控制。我们表明,得到的(p)-值可以用于控制家族错误和错误发现率。此外,所提出的聚合可以提高功率,同时大大减少错误选择的变量的数量。

MSC公司:

62J05型 线性回归;混合模型
62J07型 岭回归;收缩估计器(拉索)
PDF格式BibTeX公司 XML格式引用