×

通过条件作用放松假冒产品的假设。 (英语) 兹比尔1454.62132

摘要:最近的论文E.坎迪斯等[J.R.Stat.Soc.,Ser.B,Stat.Methodol.80,No.3,551-577(2018;Zbl 1398.62335号)]引入了X模型敲除,这是一种可证明和非症状地控制错误发现率的变量选择方法,在给定协变量的情况下,对数据的维度或响应的条件分布没有限制或假设。该程序的一个要求是,协变量样本是从精确已知(但任意)的分布中独立、一致地提取的。本文表明,在不完全知道协变量分布的情况下,可以做出完全相同的保证,而只需要知道一个具有多达个(Omega(n^*p))参数的参数模型,其中,(p)是维数,(n^*)是协变量样本数(可能超过通常的样本量)(如果也有未标记的样品)。关键是要将协变量视为是根据其观测值有条件绘制的,以便对模型进行充分统计。虽然这个想法很简单,但即使在高斯模型中,对充分统计的条件处理也会导致一组零勒贝格测度支持的分布,这需要拓扑测度理论的技术来建立有效的算法。我们演示了如何对三个感兴趣的模型进行此操作,仿真结果表明,在较弱的假设下,新方法仍然有效。

MSC公司:

62G10型 非参数假设检验
62H22个 概率图形模型
62R40型 拓扑数据分析
62B05型 足够的统计数据和字段
62J12型 广义线性模型(逻辑模型)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Barber,R.F.和Candès,E.J.(2015)。通过仿冒品控制错误发现率。安。统计师。43 2055-2085. Zentralblatt数学:1327.62082
数字对象标识符:doi:10.1214/15-AOS1337
欧几里德项目:Euclid.aos/1438606853
·Zbl 1327.62082号 ·doi:10.1214/15-AOS1337
[2] Barber,R.F.、Candès,E.J.和Samworth,R.J.(2020年)。具有仿冒功能的稳健推理。安。统计师。48 1409-1431. Zentralblatt数学:07241596
数字对象标识符:doi:10.1214/19-AOS1852
·Zbl 1452.62193号 ·doi:10.1214/19-AOS1852
[3] Bates,S.、CandèS,E.、Janson,L.和Wang,W.(2020)。大都市仿冒品抽样。J.Amer。统计师。协会。
[4] Belloni,A.、Chernozhukov,V.和Hansen,C.(2014)。在高维对照中选择后对治疗效果的推断。经济版。螺柱81 608-650。Zentralblatt数学:1409.62142
数字对象标识符:doi:10.1093/restud/rdt044
·Zbl 1409.62142号 ·doi:10.1093/restud/rdt044
[5] Belloni,A.、Chernozhukov,V.和Kato,K.(2015)。最小绝对偏差回归和其他Z估计问题的一致后选择推理。生物特征102 77-94。Zentralblatt数学:1345.62049
数字对象标识符:doi:10.1093/biomet/asu056
·Zbl 1345.62049号 ·doi:10.1093/biomet/asu056
[6] Benjamini,Y.和Hochberg,Y.(1995年)。控制错误发现率:一种实用且强大的多重测试方法。J.罗伊。统计师。Soc.序列号。乙57 289-300。Zentralblatt数学:0809.62014
数字对象标识符:doi:10.1111/j.2517-6161.1995.tb02031.x
·Zbl 0809.62014号 ·doi:10.1111/j.2517-6161.1995.tb02031.x
[7] Benjamini,Y.和Yekutieli,D.(2001年)。依赖下多重测试中错误发现率的控制。安。统计师。29 1165-1188. Zentralblatt数学:1041.62061
数字对象标识符:doi:10.1214/aos/1013699998
欧几里德项目:Euclid.aos/101369998
·Zbl 1041.62061号 ·doi:10.1214/aos/1013699998
[8] Berrett,T.B.、Wang,Y.、Barber,R.F.和Samworth,R.J.(2018年)。条件排列测试。预印本。可从arXiv:1807.05405获得。arXiv公司:1807.05405
Zentralblatt数学:1440.62223
数字对象标识符:doi:10.1111/rssb.12340
·Zbl 1440.62223号 ·doi:10.1111/rssb.12340
[9] Bühlmann,P.和van de Geer,S.(2011)。高维数据统计:方法、理论和应用。统计学中的斯普林格系列。海德堡施普林格·Zbl 1273.62015年
[10] Candès,E.、Fan,Y.、Janson,L.和Lv,J.(2018年)。淘金:高维可控变量选择的“X型”仿制品。J.R.统计社会服务。B.统计方法。80 551-577。Zentralblatt数学:1398.62335
数字对象标识符:doi:10.1111/rssb.12265
·Zbl 1398.62335号 ·doi:10.1111/rssb.12265
[11] Chatterjee,A.和Lahiri,S.N.(2013年)。自适应LASSO估计对预言分布的收敛速度和通过bootstrap进行的高阶精化。安。统计师。41 1232-1259. Zentralblatt数学:1293.62153
数字对象标识符:doi:10.1214/13-AOS1106
欧几里德项目:Euclid.aos/1371150899
·Zbl 1293.62153号 ·doi:10.1214/13-AOS1106
[12] Chernozhukov,V.、Hansen,C.和Spindler,M.(2015)。有效的后选择和后正则化推理:一种基本的通用方法。经济年鉴。7 649-688.
[13] Diaconis,P.、Holmes,S.和Shahsahani,M.(2013)。从歧管取样。现代统计理论与应用进展:莫里斯·L·伊顿纪念活动。Inst.数学。统计(IMS)收集。10 102-125. 俄亥俄州比奇伍德IMS。Zentralblatt数学:1356.62015
·Zbl 1356.62015年
[14] Edwards,D.(2000年)。《图形建模导论》,第二版,《统计学中的斯普林格文本》。施普林格,纽约。Zentralblatt数学:0952.62003
·Zbl 0952.62003号
[15] Fithian,W.、Sun,D.和Taylor,J.(2014)。模型选择后的最优推理。预印本。可从arXiv:1410.2597获得。arXiv:1410.2597
[16] Garey,M.R.和Johnson,D.S.(1979年)。计算机与不可纠正性:NP-完备性理论指南。W.H.Freeman公司,加利福尼亚州旧金山,Zentralblatt MATH:0411.68039
·Zbl 0411.68039号
[17] Gimenez,J.R.、Ghorbani,A.和Zou,J.(2019年)。大量的敲门砖:具有错误发现保证的新功能重要性统计数据。《机器学习研究论文集》(K.Chaudhuri和M.Sugiyama编辑)。机器学习研究论文集89 2125-2133。
[18] Huang,D.和Janson,L.(2020年)。补充“通过调节放松假冒产品的假设”https://doi.org/10.1214/19-AOS1920SUPP。
[19] Huber,P.J.(1972年)。1972年的瓦尔德讲座。稳健统计:综述。安。数学。统计数据43 1041-1067。Zentralblatt数学:0254.62023
数字对象标识符:doi:10.1214/aoms/1177692459
欧几里德项目:Euclid.aoms/1177692459
·Zbl 0254.62023号 ·doi:10.1214/aoms/1177692459
[20] Janson,L.(2017)。高维推理的无模型方法。斯坦福大学博士论文。
[21] Janson,L.和Su,W.(2016)。通过仿冒品进行全系列错误率控制。电子。《美国联邦法律大全》第10卷第960-975页。Zentralblatt数学:1341.62245
数字对象标识符:doi:10.1214/16-EJS1129
·Zbl 1341.62245号 ·doi:10.1214/16-EJS1129
[22] Javanmard,A.和Javadi,H.(2019年)。通过减弱套索控制错误发现率。电子。《美国联邦法律大全》第13卷第1212-1253页。Zentralblatt数学:1418.62061
数字对象标识符:doi:10.1214/19-EJS1554
·兹比尔1418.62061 ·doi:10.1214/19-EJS1554
[23] Javanmard,A.和Montanari,A.(2014)。高维回归的置信区间和假设检验。J.马赫。学习。第15号决议2869-2909。Zentralblatt数学:1319.62145
·Zbl 1319.62145号
[24] Jordon,J.、Yoon,J.和van der Schaar,M.(2019年)。KnockoffGAN:使用生成性对抗网络为特征选择生成仿冒品。在学习代表国际会议上。
[25] Lee,J.D.、Sun,D.L.、Sun,Y.和Taylor,J.E.(2016)。精确的选后推理,并应用于套索。安。统计师。44 907-927. Zentralblatt数学:1341.62061
数字对象标识符:doi:10.1214/15-AOS1371
欧几里德项目:Euclid.aos/1460381681
·兹比尔1341.62061 ·doi:10.1214/15-AOS1371
[26] Lewis,R.M.R.(2016)。图形着色指南:算法和应用。查姆施普林格。Zentralblatt数学:1330.05002
·Zbl 1330.05002号
[27] Liu,Y.和Zheng,C.(2019)。用于生成仿冒品的深层潜在变量模型。统计数据8 e260。
[28] Malaguti,E.和Toth,P.(2010年)。顶点着色问题综述。国际事务处理。操作。决议17 1-34。Zentralblatt数学:1223.05079
数字对象标识符:doi:10.1111/j.1475-3995.2009.00696.x
·Zbl 1223.05079号 ·文件编号:10.1111/j.1475-3995.2009.00696.x
[29] Ning,Y.和Liu,H.(2017)。稀疏高维模型的假设检验和置信域的一般理论。安。统计师。45 158-195. Zentralblatt数学:1364.62128
数字对象标识符:doi:10.1214/16-AOS1448
欧几里德项目:Euclid.aos/1487667620
·Zbl 1364.62128号 ·doi:10.1214/16-AOS1448
[30] Portnoy,S.(1985)。当\(p^2/n)较大时\(p)回归参数\(M)估计量的渐近行为。法线近似。安。统计师。13 1403-1417. Zentralblatt数学:0601.62026
数字对象标识符:doi:10.1214/aos/1176349744
欧几里德项目:Euclid.aos/1176349744
·Zbl 0601.62026号 ·doi:10.1214/aos/1176349744
[31] Romano,Y.、Sesia,M.和Candès,E.J.(2019年)。深度仿冒。J.Amer。统计师。协会·Zbl 1506.62463号
[32] Rosenbaum,P.R.(1984)。观察性研究中的条件排列检验和倾向得分。J.Amer。统计师。协会79 565-574。
[33] Sesia,M.、Sabatti,C.和Candès,E.J.(2019年)。使用隐马尔可夫模型仿冒品进行基因搜索。生物特征106 1-18。Zentralblatt数学:07051928
数字对象标识符:doi:10.1093/biomet/asy033
·Zbl 1506.62463号 ·doi:10.1093/biomet/asy033
[34] van de Geer,S.、Bühlmann,P.、Ritov,Y.和Dezeure,R.(2014)。关于高维模型的渐近最优置信域和检验。安。统计师。42 1166-1202. Zentralblatt数学:1305.62259
数字对象标识符:doi:10.1214/14-AOS1221
欧几里德项目:Euclid.aos/1403276911
·兹比尔1305.62259 ·doi:10.1214/14-AOS1221
[35] Zhang,C.-H.和Zhang、S.S.(2014)。高维线性模型中低维参数的置信区间。J.R.统计社会服务。B.统计方法。76 217-242. Zentralblatt数学:1411.62196
数字对象标识符:doi:10.1111/rssb.12026
·Zbl 1411.62196号 ·doi:10.1111/rssb.12026
[36] Zhu,Y.和Bradic,J.(2018)。密集高维线性模型中的线性假设检验。J.Amer。统计师。协会113 1583-1600。Zentralblatt数学:1409.62139
数字对象标识符:doi:10.1080/01621459.2017.1356319
·Zbl 1409.62139号 ·doi:10.1080/01621459.2017.1356319
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。