×

爆米花

swMATH ID: 41605
软件作者: Asher Spector;卢卡斯·简森
描述: 通过最小化可重构性实现强大的仿冒产品。X型仿制品(extit{J.R.Stat.Soc.Ser.B.Stat.Methol.}80(2018)551-577)允许分析师使用几乎任何机器学习算法进行特征选择,同时可证明地控制错误发现的预期比例。这一过程涉及到构造称为仿冒的合成变量,它们在特征选择期间有效地充当控件。构建仿冒品的黄金标准是最小化特征及其仿冒品之间的平均绝对相关性(MAC),但令人惊讶的是,我们证明了在极为简单的设置中,包括具有相关可交换特征的高斯线性模型,此过程可能无能为力。关键问题是,最小化MAC会在特征和仿冒品之间产生联合依赖性,这使得机器学习算法能够使用仿冒品重建特征对响应的影响。为了提高功率,我们建议生成可最小化特征可重构性(MRC)的仿冒品,并通过显示高斯特征的计算效率、鲁棒性和强大性来证明我们的建议。我们还证明了某些MRC仿制品最小化了高斯线性模型中的估计误差概念。通过广泛的模拟,我们发现MRC仿冒品通常显著优于MAC最小化仿冒品,并且我们没有发现MAC最小化仿冒品在任何设置中优于MRC仿冒品超过一小部分。我们在一个新的python包(mathtt{knockpy})中实现了我们的方法和其他许多来自仿冒文献的方法。
主页: https://amspector100.github.io/knockpy网站/
关键词: 高维推理;仿冒品;X型;变量选择;错误发现率;权力
相关软件: KnockoffGAN公司;深粉红色;FANOK公司;蟒蛇;玻璃制品
引用于: 3文件

2篇连载文章中引用

2 美国统计协会杂志
1 统计年鉴

在1个字段中引用

统计学(62-XX)

按年份列出的引文