×

高维线性模型的统计显著性。 (英语) Zbl 1273.62173号

摘要:我们提出了一种在高维线性模型中为一般假设构造p值的方法。假设可以是局部的,用于测试单个回归参数,也可以是全局的,涉及多个甚至所有参数。此外,当考虑许多假设时,我们展示了如何在考虑到p值之间的依赖性的情况下调整多重测试。
我们的技术基于脊线估计,由于高维中存在大量投影偏差,因此附加了一个校正项。我们证明了我们的\(p\)-值有很强的误差控制,并为检测提供了充分的条件:对于前者,我们不对真正的潜在回归系数的大小做出任何假设,而对于后者,我们的程序可能在功率方面不是最优的。我们在模拟示例和实际数据应用中演示了该方法。

MSC公司:

62J07型 山脊回归;收缩估计器(拉索)
62J05型 线性回归;混合模型
62H15型 多元分析中的假设检验
62F05型 参数检验的渐近性质
65C60个 统计中的计算问题(MSC2010)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Bickel,P.J.、Ritov,Y.和Tsybakov,A.B.(2009年)。同时分析套索和Dantzig选择器。安。统计师。37 1705-1732. ·Zbl 1173.62022号 ·doi:10.1214/08-AOS620
[2] Bickel,P.J.、Klaassen,C.A.J.、Ritov,Y.和Wellner,J.A.(1998年)。半参数模型的有效自适应估计。纽约:斯普林格·Zbl 0894.62005号
[3] Bühlmann,P.(2006)。推动高维线性模型。安。统计师。34 559-583. ·Zbl 1095.62077号 ·doi:10.1214/009053600000092
[4] Bühlmann,P.、Kalisch,M.和Maathuis,M.H.(2010年)。高维线性模型中的变量选择:部分忠实分布和PC-simple算法。生物特征97 261-278·Zbl 1233.62135号 ·doi:10.1093/biomet/asq008
[5] Bühlmann,P.和van de Geer,S.(2011)。高维数据统计:方法、理论和应用。统计学中的斯普林格系列。海德堡:施普林格·Zbl 1273.62015年
[6] Bunea,F.、Tsybakov,A.和Wegkamp,M.(2007年)。拉索的稀疏预言不等式。电子。《美国联邦法律大全》第1卷第169-194页·兹比尔1146.62028 ·doi:10.1214/07-EJS008
[7] Candes,E.和Tao,T.(2007)。Dantzig选择器:当\(p)远大于\(n)时的统计估计。安。统计师。35 2313-2351. ·Zbl 1139.62019号 ·doi:10.1214/00905360000001523
[8] Dettling,M.(2004年)。BagBoosting用于基因表达数据的肿瘤分类。生物信息学20 3583-3593。
[9] El Karoui,N.(2008年)。基于随机矩阵理论的大维协方差矩阵谱估计。安。统计师。36 2757-2790. ·Zbl 1168.62052号 ·doi:10.1214/07-AOS581
[10] Fan,J.和Li,R.(2001)。通过非冲突惩罚似然及其oracle属性进行变量选择。J.Amer。统计师。协会96 1348-1360·Zbl 1073.62547号 ·doi:10.1198/016214501753382273
[11] Fan,J.和Lv,J.(2008)。确保超高维特征空间的独立筛选。J.R.Stat.Soc.系列。B统计方法。70 849-911. ·doi:10.1111/j.1467-9868.2008.00674.x
[12] Fan,J.和Lv,J.(2010)。高维特征空间中变量选择的选择性概述。统计师。Sinica 20 101-148号·Zbl 1180.62080号
[13] Greenshtein,E.和Ritov,Y.(2004)。高维线性预测器选择的持续性和超参数化的优点。伯努利10 971-988·Zbl 1055.62078号 ·doi:10.3150/bj/1106314846
[14] Hastie,T.、Tibshirani,R.和Friedman,J.(2009年)。《统计学习的要素:数据挖掘、推断和预测》,第二版,《统计学中的斯普林格系列》。纽约:斯普林格·Zbl 1273.62005年
[15] Huang,J.、Ma,S.和Zhang,C.H.(2008)。稀疏高维回归模型的自适应拉索。统计师。Sinica公元18 1603-1618年·Zbl 1255.62198号
[16] Ingster,Y.I.、Tsybakov,A.B.和Verzelen,N.(2010年)。稀疏回归中的检测边界。电子。《美国联邦法律大全》第4卷第1476-1526页·Zbl 1329.62314号 ·doi:10.1214/10-EJS589
[17] K.奈特和W.傅(2000)。套索型估计量的渐近性。安。统计师。28 1356-1378之间·Zbl 1105.62357号 ·doi:10.1214/aos/1015957397
[18] Koltchinskii,V.(2009年a)。Dantzig选择器和稀疏预言不等式。伯努利15 799-828·Zbl 1452.62486号 ·doi:10.3150/09-BEJ187
[19] Koltchinski,V.(2009年b)。惩罚经验风险最小化中的稀疏性。亨利·彭加雷·普罗巴布(Henri PoincaréProbab)安·Inst。统计数字45 7-57·Zbl 1168.62044号 ·doi:10.1214/07-AIHP146
[20] Meinshausen,N.(2007年)。放松的拉索。计算。统计师。数据分析。52 374-393之间·Zbl 1452.62522号
[21] Meinshausen,N.和Bühlmann,P.(2006)。高维图和用套索选择变量。安。统计师。34 1436-1462. ·Zbl 1113.62082号 ·doi:10.1214/0090536000000281
[22] Meinshausen,N.和Bühlmann,P.(2010年)。稳定性选择。J.R.Stat.Soc.系列。B统计方法。72 417-473. ·文件编号:10.1111/j.1467-9868.2010.00740.x
[23] Meinshausen,N.、Maathuis,M.和Bühlmann,P.(2011)。相关性下多重检验的Westfall-Young置换过程的渐近最优性。安。统计师。39 3369-3391. ·Zbl 1246.62124号 ·doi:10.1214/11-AOS946
[24] Meinshausen,N.、Meier,L.和Bühlmann,P.(2009)\高维回归的(p\)-值。J.Amer。统计师。协会104 1671-1681·Zbl 1205.62089号 ·doi:10.1198/jasa.2009.tm08647
[25] Meinshausen,N.和Yu,B.(2009年)。高维数据稀疏表示的Lasso类型恢复。Ann.Statist公司。37 246-270. ·Zbl 1155.62050号 ·doi:10.1214/07-AOS582
[26] Raskutti,G.、Wainwright,M.J.和Yu,B.(2010年)。相关高斯设计的受限特征值特性。J.马赫。学习。第11号决议2241-2259·Zbl 1242.62071号
[27] Shao,J.和Deng,X.(2012)。具有确定性设计矩阵的高维线性模型中的估计。安。统计师。40 812-831. ·Zbl 1273.62177号 ·doi:10.1214/12-AOS982
[28] Sun,T.和Zhang,C.H.(2012)。比例稀疏线性回归。生物特征99 879-898·Zbl 1452.62515号 ·doi:10.1093/biomet/ass043
[29] Tibshirani,R.(1996)。通过套索回归收缩和选择。J.罗伊。统计师。Soc.序列号。乙58 267-288·Zbl 0850.62538号
[30] Tropp,J.A.(2004)。贪婪是好的:稀疏近似的算法结果。IEEE传输。通知。理论50 2231-2242·Zbl 1288.94019号 ·doi:10.1109/TIT.2004.834793
[31] van de Geer,S.(2007)。确定性拉索。JSM Proceedings,2007年140。美国统计协会。
[32] van de Geer,S.A.(2008年)。高维广义线性模型和套索。安。统计师。36 614-645. ·Zbl 1138.62323号 ·doi:10.1214/00905360700000929
[33] van de Geer,S.A.和Bühlmann,P.(2009)。根据用于证明拉索预言结果的条件。电子。《美国法律总汇》第3卷第1360-1392页·Zbl 1327.62425号 ·doi:10.1214/09-EJS506
[34] van de Geer,S.、Bühlmann,P.和Zhou,S.(2011)。潜在指定错误模型的自适应和阈值拉索(以及拉索的下限)。电子。《美国联邦法律大全》第5卷第688-749页·Zbl 1274.62471号 ·doi:10.1214/11-EJS624
[35] Vershynin,R.(2012)。介绍随机矩阵的非渐近分析。在压缩传感(Y.Eldar和G.Kutyniok编辑)210-268。剑桥:剑桥大学出版社。 ·doi:10.1017/CBO9780511794308.006
[36] Wainwright,M.J.(2009年)。使用(ell_{1})约束二次规划(Lasso)恢复高维和噪声稀疏性的锐化阈值。IEEE传输。通知。理论55 2183-2202·Zbl 1367.62220号 ·doi:10.1109/TIT.2009.2016018
[37] Wang,H.(2009)。超高维变量筛选的前向回归。J.Amer。统计师。协会104 1512-1524·Zbl 1205.62103号 ·doi:10.1198/jasa.2008.tm08516
[38] Wasserman,L.和Roeder,K.(2009年)。高维变量选择。安。统计师。37 2178-2201. ·Zbl 1173.62054号 ·doi:10.1214/08-AOS646
[39] Westfall,P.和Young,S.(1993年)。基于重采样的多重测试:(P)值调整的示例和方法。纽约:John Wiley&Sons·Zbl 0850.62368号
[40] Zhang,C.H.(2010)。极小极大凹惩罚下的几乎无偏变量选择。安。统计师。38 894-942. ·Zbl 1183.62120号 ·doi:10.1214/09-AOS729
[41] Zhang,C.H.和Huang,J.(2008)。高维线性回归中LASSO选择的稀疏性和偏差。安。统计师。36 1567-1594. ·Zbl 1142.62044号 ·doi:10.1214/07-AOS520
[42] Zhang,C.H.和Zhang、S.(2011年)。具有高维数据的低维参数的置信区间。可从获取。1110.2563伏
[43] Zhao,P.和Yu,B.(2006)。关于拉索模型选择的一致性。J.马赫。学习。第7号决议2541-2563·Zbl 1222.62008年
[44] 邹华(2006)。自适应套索及其oracle属性。J.Amer。统计师。协会101 1418-1429·Zbl 1171.62326号 ·doi:10.1198/016214500000735
[45] 邹浩和李若明(2008)。非凹陷惩罚似然模型中的一步稀疏估计。安。统计师。36 1509-1533. ·Zbl 1142.62027号 ·doi:10.1214/0090536007000000802
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。