摘要
超高维数据的变量筛选在过去十年中引起了广泛关注。在许多应用中,研究人员从以前的研究中学习到与感兴趣的响应相关的某些重要预测因子或控制变量。在筛选程序中应考虑到这些知识。然而,与大量的通用无条件筛查文献相比,以先验信息为条件的可变筛查的发展成果较少。在本文中,我们提出了一种无模型变量筛选范式,该范式允许高维控制并适用于连续或分类反应。在存在控制变量以及其他候选变量的情况下,通过基于核的再现,对每个单独预测器的贡献进行边际和有条件的量化和部分统计数据。结果表明,该方法在充分性概念下具有一定的筛选性和秩一致性,与现有方法相比具有明显的优越性。通过包含各种回归和分类模型的模拟研究,以及对高通量基因表达数据的应用,证明了该方法的优势。
致谢
我们衷心感谢主编、副主编和两位匿名审稿人的建设性意见,这使本文得到了显著改进。
引用
下载引文
陈璐可。
“通过高维控制进行充分的变量筛选。”
电子。J.统计。
17
(2)
2139 - 2179,
2023
https://doi.org/10.1214/23-EJS2150
问询处
收到日期:2022年8月1日;发布日期:2023年
欧几里德项目首次推出:2023年10月2日
数字对象标识符:10.1214/23-EJS2150
学科:
主要用户:62磅10英寸,62B86号
次要:62克05,62G08号,62H30型
关键词:有条件的独立性,秩一致性,再生核希尔伯特空间,确定筛选