文件Zbl 1273.62173-zbMATH Open

高维线性模型的统计显著性。（英语） Zbl 1273.62173号

伯努利 19，第4期，1212-1242（2013）。

摘要：我们提出了一种在高维线性模型中为一般假设构造p值的方法。假设可以是局部的，用于测试单个回归参数，也可以是全局的，涉及多个甚至所有参数。此外，当考虑许多假设时，我们展示了如何在考虑到p值之间的依赖性的情况下调整多重测试。
我们的技术基于脊线估计，由于高维中存在大量投影偏差，因此附加了一个校正项。我们证明了我们的\（p\）-值有很强的误差控制，并为检测提供了充分的条件：对于前者，我们不对真正的潜在回归系数的大小做出任何假设，而对于后者，我们的程序可能在功率方面不是最优的。我们在模拟示例和实际数据应用中演示了该方法。

引用于1审查

引用于88文件

MSC公司：

62J07型	山脊回归；收缩估计器（拉索）
62J05型	线性回归；混合模型
62H15型	多元分析中的假设检验
62F05型	参数检验的渐近性质
65C60个	统计中的计算问题（MSC2010）

关键词：

全球测试;套索;多次测试;岭回归;变量选择;Westfall-Young排列程序

软件：

ElemStatLearn（电子状态学习）;促进

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司欧几里得

参考文献：

[1]	Bickel，P.J.、Ritov，Y.和Tsybakov，A.B.（2009年）。同时分析套索和Dantzig选择器。安。统计师。37 1705-1732. ·Zbl 1173.62022号 ·doi:10.1214/08-AOS620
[2]	Bickel，P.J.、Klaassen，C.A.J.、Ritov，Y.和Wellner，J.A.（1998年）。半参数模型的有效自适应估计。纽约：斯普林格·Zbl 0894.62005号
[3]	Bühlmann，P.（2006）。推动高维线性模型。安。统计师。34 559-583. ·Zbl 1095.62077号 ·doi:10.1214/009053600000092
[4]	Bühlmann，P.、Kalisch，M.和Maathuis，M.H.（2010年）。高维线性模型中的变量选择：部分忠实分布和PC-simple算法。生物特征97 261-278·Zbl 1233.62135号 ·doi:10.1093/biomet/asq008
[5]	Bühlmann，P.和van de Geer，S.（2011）。高维数据统计：方法、理论和应用。统计学中的斯普林格系列。海德堡：施普林格·Zbl 1273.62015年
[6]	Bunea，F.、Tsybakov，A.和Wegkamp，M.（2007年）。拉索的稀疏预言不等式。电子。《美国联邦法律大全》第1卷第169-194页·兹比尔1146.62028 ·doi:10.1214/07-EJS008
[7]	Candes，E.和Tao，T.（2007）。Dantzig选择器：当\（p）远大于\（n）时的统计估计。安。统计师。35 2313-2351. ·Zbl 1139.62019号 ·doi:10.1214/00905360000001523
[8]	Dettling，M.（2004年）。BagBoosting用于基因表达数据的肿瘤分类。生物信息学20 3583-3593。
[9]	El Karoui，N.（2008年）。基于随机矩阵理论的大维协方差矩阵谱估计。安。统计师。36 2757-2790. ·Zbl 1168.62052号 ·doi:10.1214/07-AOS581
[10]	Fan，J.和Li，R.（2001）。通过非冲突惩罚似然及其oracle属性进行变量选择。J.Amer。统计师。协会96 1348-1360·Zbl 1073.62547号 ·doi:10.1198/016214501753382273
[11]	Fan，J.和Lv，J.（2008）。确保超高维特征空间的独立筛选。J.R.Stat.Soc.系列。B统计方法。70 849-911. ·doi:10.1111/j.1467-9868.2008.00674.x
[12]	Fan，J.和Lv，J.（2010）。高维特征空间中变量选择的选择性概述。统计师。Sinica 20 101-148号·Zbl 1180.62080号
[13]	Greenshtein，E.和Ritov，Y.（2004）。高维线性预测器选择的持续性和超参数化的优点。伯努利10 971-988·Zbl 1055.62078号 ·doi:10.3150/bj/1106314846
[14]	Hastie，T.、Tibshirani，R.和Friedman，J.（2009年）。《统计学习的要素：数据挖掘、推断和预测》，第二版，《统计学中的斯普林格系列》。纽约：斯普林格·Zbl 1273.62005年
[15]	Huang，J.、Ma，S.和Zhang，C.H.（2008）。稀疏高维回归模型的自适应拉索。统计师。Sinica公元18 1603-1618年·Zbl 1255.62198号
[16]	Ingster，Y.I.、Tsybakov，A.B.和Verzelen，N.（2010年）。稀疏回归中的检测边界。电子。《美国联邦法律大全》第4卷第1476-1526页·Zbl 1329.62314号 ·doi:10.1214/10-EJS589
[17]	K.奈特和W.傅（2000）。套索型估计量的渐近性。安。统计师。28 1356-1378之间·Zbl 1105.62357号 ·doi:10.1214/aos/1015957397
[18]	Koltchinskii，V.（2009年a）。Dantzig选择器和稀疏预言不等式。伯努利15 799-828·Zbl 1452.62486号 ·doi:10.3150/09-BEJ187
[19]	Koltchinski，V.（2009年b）。惩罚经验风险最小化中的稀疏性。亨利·彭加雷·普罗巴布（Henri PoincaréProbab）安·Inst。统计数字45 7-57·Zbl 1168.62044号 ·doi:10.1214/07-AIHP146
[20]	Meinshausen，N.（2007年）。放松的拉索。计算。统计师。数据分析。52 374-393之间·Zbl 1452.62522号
[21]	Meinshausen，N.和Bühlmann，P.（2006）。高维图和用套索选择变量。安。统计师。34 1436-1462. ·Zbl 1113.62082号 ·doi:10.1214/0090536000000281
[22]	Meinshausen，N.和Bühlmann，P.（2010年）。稳定性选择。J.R.Stat.Soc.系列。B统计方法。72 417-473. ·文件编号：10.1111/j.1467-9868.2010.00740.x
[23]	Meinshausen，N.、Maathuis，M.和Bühlmann，P.（2011）。相关性下多重检验的Westfall-Young置换过程的渐近最优性。安。统计师。39 3369-3391. ·Zbl 1246.62124号 ·doi:10.1214/11-AOS946
[24]	Meinshausen，N.、Meier，L.和Bühlmann，P.（2009）\高维回归的（p\）-值。J.Amer。统计师。协会104 1671-1681·Zbl 1205.62089号 ·doi:10.1198/jasa.2009.tm08647
[25]	Meinshausen，N.和Yu，B.（2009年）。高维数据稀疏表示的Lasso类型恢复。Ann.Statist公司。37 246-270. ·Zbl 1155.62050号 ·doi:10.1214/07-AOS582
[26]	Raskutti，G.、Wainwright，M.J.和Yu，B.（2010年）。相关高斯设计的受限特征值特性。J.马赫。学习。第11号决议2241-2259·Zbl 1242.62071号
[27]	Shao，J.和Deng，X.（2012）。具有确定性设计矩阵的高维线性模型中的估计。安。统计师。40 812-831. ·Zbl 1273.62177号 ·doi:10.1214/12-AOS982
[28]	Sun，T.和Zhang，C.H.（2012）。比例稀疏线性回归。生物特征99 879-898·Zbl 1452.62515号 ·doi:10.1093/biomet/ass043
[29]	Tibshirani，R.（1996）。通过套索回归收缩和选择。J.罗伊。统计师。Soc.序列号。乙58 267-288·Zbl 0850.62538号
[30]	Tropp，J.A.（2004）。贪婪是好的：稀疏近似的算法结果。IEEE传输。通知。理论50 2231-2242·Zbl 1288.94019号 ·doi:10.1109/TIT.2004.834793
[31]	van de Geer，S.（2007）。确定性拉索。JSM Proceedings，2007年140。美国统计协会。
[32]	van de Geer，S.A.（2008年）。高维广义线性模型和套索。安。统计师。36 614-645. ·Zbl 1138.62323号 ·doi:10.1214/00905360700000929
[33]	van de Geer，S.A.和Bühlmann，P.（2009）。根据用于证明拉索预言结果的条件。电子。《美国法律总汇》第3卷第1360-1392页·Zbl 1327.62425号 ·doi:10.1214/09-EJS506
[34]	van de Geer，S.、Bühlmann，P.和Zhou，S.（2011）。潜在指定错误模型的自适应和阈值拉索（以及拉索的下限）。电子。《美国联邦法律大全》第5卷第688-749页·Zbl 1274.62471号 ·doi:10.1214/11-EJS624
[35]	Vershynin，R.（2012）。介绍随机矩阵的非渐近分析。在压缩传感（Y.Eldar和G.Kutyniok编辑）210-268。剑桥：剑桥大学出版社。 ·doi:10.1017/CBO9780511794308.006
[36]	Wainwright，M.J.（2009年）。使用（ell_{1}）约束二次规划（Lasso）恢复高维和噪声稀疏性的锐化阈值。IEEE传输。通知。理论55 2183-2202·Zbl 1367.62220号 ·doi:10.1109/TIT.2009.2016018
[37]	Wang，H.（2009）。超高维变量筛选的前向回归。J.Amer。统计师。协会104 1512-1524·Zbl 1205.62103号 ·doi:10.1198/jasa.2008.tm08516
[38]	Wasserman，L.和Roeder，K.（2009年）。高维变量选择。安。统计师。37 2178-2201. ·Zbl 1173.62054号 ·doi:10.1214/08-AOS646
[39]	Westfall，P.和Young，S.（1993年）。基于重采样的多重测试：（P）值调整的示例和方法。纽约：John Wiley&Sons·Zbl 0850.62368号
[40]	Zhang，C.H.（2010）。极小极大凹惩罚下的几乎无偏变量选择。安。统计师。38 894-942. ·Zbl 1183.62120号 ·doi:10.1214/09-AOS729
[41]	Zhang，C.H.和Huang，J.（2008）。高维线性回归中LASSO选择的稀疏性和偏差。安。统计师。36 1567-1594. ·Zbl 1142.62044号 ·doi:10.1214/07-AOS520
[42]	Zhang，C.H.和Zhang、S.（2011年）。具有高维数据的低维参数的置信区间。可从获取。1110.2563伏
[43]	Zhao，P.和Yu，B.（2006）。关于拉索模型选择的一致性。J.马赫。学习。第7号决议2541-2563·Zbl 1222.62008年
[44]	邹华（2006）。自适应套索及其oracle属性。J.Amer。统计师。协会101 1418-1429·Zbl 1171.62326号 ·doi:10.1198/016214500000735
[45]	邹浩和李若明（2008）。非凹陷惩罚似然模型中的一步稀疏估计。安。统计师。36 1509-1533. ·Zbl 1142.62027号 ·doi:10.1214/0090536007000000802

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j：期刊文章；b：book；一：图书文章）

一&b	逻辑和
一\|b	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

高维线性模型的统计显著性。（英语） Zbl 1273.62173号

MSC公司：

关键词：

软件：

参考文献：

示例

领域

操作员

高维线性模型的统计显著性。 （英语） Zbl 1273.62173号

MSC公司：

关键词：

软件：

参考文献：

高维线性模型的统计显著性。（英语） Zbl 1273.62173号