方,伊桑·X。;宁、杨;李润泽 高维纵向数据的显著性测试。 (英语) Zbl 1455.62051号 Ann.统计。 48,第5期,2622-2645(2020). 摘要:本文讨论具有超高维协变量的纵向数据的统计推断。我们首先研究了为感兴趣的低维参数构建置信区间和假设检验的问题。主要挑战是如何在存在高维干扰参数和纵向数据复杂的学科内相关性的情况下构建强大的测试统计量。为了应对这一挑战,我们提出了一种新的二次去相关推理函数方法,该方法同时消除了干扰参数的影响,并结合相关性来提高估计过程的效率。当感兴趣的参数为固定维数时,我们证明了所提出的估计量是渐近正态的,并且达到了半参数信息界,在此基础上我们可以构造最优Wald检验统计量。我们进一步推广了这一结果,并在感兴趣参数的维数以多项式速率随样本大小增长的情况下,建立了估计量的极限分布。最后,我们研究了当高维回归参数向量感兴趣时,如何控制错误发现率(FDR)。我们证明,应用[J.D.斯托里,J.R.Stat.Soc.,序列号。B、 统计方法。64,第3期,479–498页(2002年;兹比尔1090.62073)]每个回归参数的拟议检验统计量的过程在纵向数据中渐近控制FDR。我们进行了模拟研究,以评估所建议程序的有限样本性能。我们的仿真结果表明,新提出的方法可以控制低维参数测试的I型误差和多重测试问题的FDR。我们还将建议的过程应用于实际数据示例。 引用于7文件 MSC公司: 62F03型 参数假设检验 62F05型 参数检验的渐近性质 62H11型 定向数据;空间统计学 62J15型 配对和多重比较;多次测试 关键词:错误发现率;广义估计方程;二次推理函数 引文:Zbl 1090.62073号 PDF格式BibTeX公司 XML格式引用 \textit{E.X.Fang}等人,Ann.Stat.48,No.5,2622-2645(2020;Zbl 1455.62051) 全文: 内政部 欧几里得 参考文献: [1] Barber,R.F.和Candès,E.J.(2015)。通过仿冒品控制错误发现率。安。统计师。43 2055-2085. Zentralblatt数学:1327.62082数字对象标识符:doi:10.1214/15-AOS1337欧几里德项目:Euclid.aos/1438606853·Zbl 1327.62082号 ·doi:10.1214/15-AOS1337 [2] Benjamini,Y.和Hochberg,Y.(1995年)。控制错误发现率:一种实用而强大的多重测试方法。J.罗伊。统计师。Soc.序列号。乙57 289-300。Zentralblatt数学:0809.62014数字对象标识符:doi:10.1111/j.2517-6161.1995.tb02031.x·Zbl 0809.62014号 ·doi:10.1111/j.2517-6161.1995.tb02031.x [3] Benjamini,Y.和Yekutieli,D.(2001年)。依赖下多重测试中错误发现率的控制。安。统计师。29 1165-1188. Zentralblatt数学:1041.62061数字对象标识符:doi:10.1214/aos/1013699998欧几里德项目:Euclid.aos/101369998·Zbl 1041.62061号 ·doi:10.1214/aos/1013699998 [4] Bentkus,V.(2003)。关于Berry-Esseen界对维数的依赖性。J.统计。计划。推论113 385-402。Zentralblatt数学:1017.60023数字对象标识符:doi:10.1016/S0378-3758(02)00094-0·Zbl 1017.60023号 ·doi:10.1016/S0378-3758(02)00094-0 [5] Bühlmann,P.和van de Geer,S.(2011)。高维数据统计:方法、理论和应用。统计学中的斯普林格系列。海德堡施普林格·Zbl 1273.62015年 [6] 董,C.,王,S.,李,W.-D.,李,D.,赵,H.和普莱斯,R.A.(2003)。染色体20和10上的相互作用基因座影响人类极端肥胖。Am.J.Hum.遗传学。72 115-124. [7] Fan,J.和Li,R.(2001)。通过非冲突惩罚似然及其oracle属性进行变量选择。J.Amer。统计师。协会96 1348-1360。Zentralblatt数学:1073.62547数字对象标识符:doi:10.1198/016214501753382273·Zbl 1073.62547号 ·doi:10.1198/016214501753382273 [8] Fan,J.、Liu,H.、Sun,Q.和Zhang,T.(2018)。用于稀疏学习的I-LAMM:同时控制算法复杂性和统计误差。安。统计师。46 814-841. Zentralblatt数学:1392.62215数字对象标识符:doi:10.1214/17-AOS1568欧几里德项目:Euclid.aos/1522742437·兹比尔1392.62215 ·doi:10.1214/17-AOS1568 [9] Fang,E.X.、Ning,Y.和Li,R.(2020年)。补充“高维纵向数据显著性测试”https://doi.org/10.1214/19-AOS1900SUPP。 [10] Fang,E.X.、Ning,Y.和Liu,H.(2017)。高维比例风险模型的测试和置信区间。J.R.统计社会服务。B.统计方法。79 1415-1437. Zentralblatt数学:1380.62240数字对象标识符:doi:10.1111/rssb.12224·Zbl 1380.62240号 ·doi:10.1111/rssb.12224 [11] Grazier G'Sell,M.、Wager,S.、Chouldechova,A.和Tibshirani,R.(2016)。顺序选择程序和错误发现率控制。J.R.统计社会服务。B.统计方法。78 423-444. Zentralblatt数学:1414.62341数字对象标识符:doi:10.1111/rssb.12122·Zbl 1414.62341号 ·doi:10.1111/rssb.12122 [12] Jaquish,C.E.(2007)。弗雷明翰心脏研究将成为心血管遗传流行病学的金标准?BMC医学遗传学。8 63. [13] Javanmard,A.和Montanari,A.(2013)。高维统计模型的置信区间和假设检验。神经信息处理系统进展1187-1195。 [14] Liang,K.Y.和Zeger,S.L.(1986)。使用广义线性模型进行纵向数据分析。生物特征73 13-22。Zentralblatt数学:0595.62110数字对象标识符:doi:10.1093/biomet/73.1.13·Zbl 0595.62110号 ·doi:10.1093/biomet/73.1.13 [15] Liu,W.(2013)。具有错误发现率控制的高斯图形模型估计。安。统计师。41 2948-2978. Zentralblatt数学:1288.62094数字对象标识符:doi:10.1214/13-AOS1169欧几里德项目:Euclid.aos/1388545674·Zbl 1288.62094号 ·doi:10.1214/13-AOS1169 [16] Loh,P.-L.和Wainwright,M.J.(2013)。非凸正则M-估计量:局部最优的统计和算法理论。神经信息处理系统进展476-484。 [17] Ma,S.、Song,Q.和Wang,L.(2013)。纵向/聚类数据半参数建模中的同步变量选择和估计。伯努利19 252-274。Zentralblatt数学:1259.62021数字对象标识符:doi:10.3150/11-BEJ386欧几里德项目:Euclid.bj/1358531749·Zbl 1259.62021号 ·doi:10.3150/11-BEJ386 [18] Ning,Y.和Liu,H.(2017)。稀疏高维模型的假设检验和置信域的一般理论。安。统计师。45 158-195. Zentralblatt数学:1364.62128数字对象标识符:doi:10.1214/16-AOS1448欧几里德项目:Euclid.aos/1487667620·Zbl 1364.62128号 ·doi:10.1214/16-AOS1448 [19] Qu,A.、Lindsay,B.G.和Li,B.(2000)。使用二次推理函数改进广义估计方程。生物特征87 823-836。Zentralblatt数学:1028.62045数字对象标识符:doi:10.1093/biomet/87.4.823·Zbl 1028.62045号 ·doi:10.1093/biomet/87.4.823 [20] Storey,J.D.(2002)。错误发现率的直接方法。J.R.统计社会服务。B.统计方法。64 479-498. Zentralblatt数学:1090.62073数字对象标识符:doi:10.1111/1467-9868.00346·Zbl 1090.62073号 ·doi:10.1111/1467-9868.00346 [21] Tibshirani,R.(1996)。通过套索回归收缩和选择。J.罗伊。统计师。Soc.序列号。乙58 267-288。Zentralblatt数学:0850.62538数字对象标识符:doi:10.1111/j.2517-6161.1996.tb02080.x·Zbl 0850.62538号 ·doi:10.1111/j.2517-6161.1996.tb02080.x [22] van de Geer,S.和Müller,P.(2012)。高维拟似然估计和/或稳健估计。统计师。科学。27 469-480之间。Zentralblatt数学:1331.62354数字对象标识符:doi:10.1214/12-STS397欧几里德项目:Euclid.ss/1356098551·Zbl 1331.62354号 ·doi:10.1214/12-STS397 [23] van de Geer,S.、Bühlmann,P.、Ritov,Y.和Dezeure,R.(2014)。关于高维模型的渐近最优置信域和检验。安。统计师。42 1166-1202. Zentralblatt数学:1305.62259数字对象标识符:doi:10.1214/14-AOS1221欧几里德项目:Euclid.aos/1403276911·Zbl 1305.62259号 ·doi:10.1214/14-AOS1221 [24] Wang,L.(2011年)。协变量数目不同的聚类二进制数据的GEE分析。安。统计师。39 389-417. Zentralblatt数学:1209.62138数字对象标识符:doi:10.1214/10-AOS846欧几里德项目:Euclid.aos/1291388380·Zbl 1209.62138号 ·doi:10.1214/10-AOS846 [25] Wang,L.、Kim,Y.和Li,R.(2013)。校准超高维非凸惩罚回归。安。统计师。41 2505-2536. Zentralblatt数学:1281.62106数字对象标识符:doi:10.1214/13-AOS1159欧几里德项目:Euclid.aos/1383661271·Zbl 1281.62106号 ·doi:10.1214/13-AOS1159 [26] Wang,L.和Qu,A.(2009)。估计方程法中纵向数据的一致模型选择和数据驱动平滑测试。J.R.统计社会服务。B.统计方法。71 177-190. Zentralblatt数学:1231.62074数字对象标识符:doi:10.1111/j.1467-9868.2008.00679.x·Zbl 1231.62074号 ·doi:10.1111/j.1467-9868.2008.00679.x [27] Wang,L.,Zhou,J.和Qu,A.(2012)。高维纵向数据分析的惩罚广义估计方程。生物统计学68 353-360。Zentralblatt数学:1251.62051数字对象标识符:doi:10.1111/j.1541-0420.2011.01678.x·Zbl 1251.62051号 ·doi:10.1111/j.1541-0420.2011.01678.x [28] Wang,L.,Xue,L.、Qu,A.和Liang,H.(2014)。协变量发散数相关数据广义加性部分线性模型的估计和模型选择。安。统计师。42 592-624。Zentralblatt数学:1309.62077数字对象标识符:doi:10.1214/13-AOS1194欧几里德项目:Euclid.aos/1400592171·Zbl 1309.62077号 ·doi:10.1214/13-AOS1194 [29] Xue,L.、Qu,A.和Zhou,J.(2010)。相关数据边际广义可加模型的一致模型选择。J.Amer。统计师。协会105 1518-1530。在线提供补充材料。Zentralblatt数学:1388.62223数字对象标识符:doi:10.1198/jasa.2010.tm10128·Zbl 1388.62223号 ·doi:10.1198/jasa.2010.tm10128 [30] Zhang,C.-H.和Zhang、S.S.(2014)。高维线性模型中低维参数的置信区间。J.R.统计社会服务。B.统计方法。76 217-242. Zentralblatt数学:1411.62196数字对象标识符:doi:10.1111/rssb.12026·Zbl 1411.62196号 ·doi:10.1111/rssb.12026 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。