开放式访问
2015年10月 通过仿冒品控制错误发现率
Rina Foygel理发师,伊曼纽尔·坎迪斯
安。统计师。 43(5): 2055-2085 (2015年10月)。 数字对象标识码:10.1214/15-AOS1337

摘要

在许多科学领域,我们观察到一个反应变量以及大量潜在的解释变量,并希望能够发现哪些变量与反应真正相关。同时,我们需要知道,错误发现率(FDR)——所有发现中错误发现的预期比例——并不太高,以便向科学家保证,大多数发现确实是真实的和可复制的。本文介绍了分离过滤器这是一种新的变量选择程序,用于控制统计线性模型中的FDR,只要观测值至少与变量一样多。无论设计或协变量、模型中变量的数量或未知回归系数的幅度如何,该方法都可以在有限样本设置中实现精确的FDR控制,并且不需要任何噪声水平的知识。顾名思义,该方法通过制造廉价的敲除变量来操作——它们的构造不需要任何新数据,并且被设计为模仿现有变量中的相关性结构,以一种允许精确FDR控制的方式,超越了基于排列的方法。仿冒的方法非常通用和灵活,可以处理广泛的测试统计数据。我们结合Lasso的统计数据对该方法进行了稀疏回归测试,并获得了经验结果,表明当零变量比例较高时,所得到的方法比现有的选择规则具有更大的功效。

引用

下载引文

Rina Foygel理发师。 伊曼纽尔·坎迪斯。 “通过仿冒品控制错误发现率。” 安。统计师。 43 (5) 2055 - 2085, 2015年10月。 https://doi.org/10.1214/15-AOS1337

问询处

收到日期:2014年5月1日;修订日期:2015年4月1日;发布日期:2015年10月
欧几里德项目首次推出:2015年8月3日

zbMATH公司:1327.62082
数学科学网:MR3375876号
数字对象标识符:10.1214/15-AOS1337

学科:
主要用户:62F03型,62J05型

关键词:错误发现率,拉索,鞅理论,置换方法,序贯假设检验,变量选择

版权所有©2015数学统计研究所

第43卷•第5期•2015年10月
返回页首