×

高维变量筛选和后续推断中的偏差,并进行实证比较。 (英语) Zbl 1306.65035号

总结:我们回顾了高维线性模型中的变量选择和变量筛选。因此,一个主要关注点是基于128种不同稀疏场景的半真实数据(真实数据协变量,但合成回归系数和噪声)的真阳性和假阳性选择率的各种估计方法的实证比较。此外,我们使用第一阶段选定的变量,给出了后续最小二乘估计中偏差的一些理论界,这对构建回归系数的p值有直接影响。

MSC公司:

62-08 统计问题的计算方法
62J05型 线性回归;混合模型
62J07型 岭回归;收缩估计器(拉索)
62G08号 非参数回归和分位数回归
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Adragni K,Cook R(2009),回归中的充分降维和预测。菲洛斯Trans R Soc A 367:4385-4400·Zbl 1185.62109号 ·doi:10.1098/rsta.2009.0110
[2] Bickel P、Ritov Y、Tsybakov A(2009)《Lasso和Dantzig选择器的同步分析》。Ann统计37:1705-1732·Zbl 1173.62022号 ·doi:10.1214/08-AOS620
[3] Bühlmann P(2012)高维线性模型的统计显著性。伯努利(出现)·Zbl 1273.62173号
[4] Bühlmann P,van de Geer S(2011)高维数据统计:方法、理论和应用。纽约州施普林格·Zbl 1273.62015年 ·doi:10.1007/978-3-642-20192-9
[5] Bühlmann P,Meier L,Kalisch M(2013)《着眼于生物学应用的高维统计》。年度收入统计申请(待出现)·Zbl 1168.62044号
[6] Bunea F、Tsybakov A、Wegkamp M(2007)《拉索的稀疏预言不等式》。电子J统计1:169-194·Zbl 1146.62028号 ·doi:10.1214/07-EJS008
[7] Candès E,Tao T(2007)Dantzig选择器:当p远大于n时的统计估计Ann Stat 35(6):2313-2351·Zbl 1139.62019号 ·doi:10.1214/00905360000001523
[8] Dettling M(2004)Bagboosting,利用基因表达数据进行肿瘤分类。生物信息学20(18):3583-3593·doi:10.1093/bioinformatics/bth447
[9] Fan J,Li R(2001)基于非冲突惩罚似然的变量选择及其预言性质。美国统计学会杂志96:1348-1360·Zbl 1073.62547号 ·doi:10.1198/016214501753382273
[10] Fan J,Lv J(2008)超高维特征空间的确定独立筛选(含讨论)。J R Stat Soc B系列70:849-911·Zbl 1411.62187号 ·doi:10.1111/j.1467-9868.2008.00674.x
[11] Friedman J,Hastie T,Tibshirani R(2010)通过坐标下降法实现广义线性模型的正则化路径。J Stat Softw统计软件33(1):1-22
[12] Greenshtein E,Ritov Y(2004)高维预测因子选择的持续性和超参数化的优点。伯努利10:971-988·Zbl 1055.62078号 ·doi:10.3150/bj/1106314846
[13] Hebiri M,van de Geer S(2011)《光滑的拉索和其他》1+2处罚方法。电子J统计5:1184-1226·Zbl 1274.62443号 ·doi:10.1214/11-EJS638
[14] Koltchinskii V(2009a)Dantzig选择器和稀疏预言不等式。伯努利15:799-828·兹比尔1452.62486 ·doi:10.3150/09-BEJ187
[15] Koltchinskii V(2009b)惩罚经验风险最小化中的稀疏性。亨利·庞加莱研究所,Probab et Stat 45:7-57·Zbl 1168.62044号 ·doi:10.1214/07-AIHP146
[16] Meinshausen N,Bühlmann P(2006)Lasso的高维图和变量选择。安统计34:1436-1462·Zbl 1113.62082号 ·doi:10.1214/0090536000000281
[17] Meinshausen N,Meier L,Bühlmann P(2009)高维回归的P值。美国统计协会杂志104:1671-1681·Zbl 1205.62089号 ·doi:10.1198/jasa.2009.tm08647
[18] Meinshausen N,Yu B(2009)高维数据稀疏表示的Lasso类型恢复。安统计37:246-270·Zbl 1155.62050号 ·doi:10.1214/07-AOS582
[19] Raskutti G,Wainwright M,Yu B(2010)相关高斯设计的受限特征值特性。J Mach学习研究11:2241-2259·Zbl 1242.62071号
[20] Shao J,Deng X(2012)具有确定性设计矩阵的高维线性模型中的估计。安统计40:812-831·Zbl 1273.62177号 ·doi:10.1214/12-AOS982
[21] Sun T,Zhang C-H(2012)标度稀疏线性回归。生物特征99:879-898·兹比尔1452.62515 ·doi:10.1093/biomet/ass043
[22] Tibshirani R(1996)通过Lasso回归收缩和选择。J R Stat Soc Ser B期刊58:267-288·Zbl 0850.62538号
[23] van de Geer S(2007)确定性拉索。摘自:JSM会议记录,第140页。弗吉尼亚州亚历山大美国统计协会·Zbl 1073.62547号
[24] van de Geer S(2008)高维广义线性模型和Lasso。安统计36:614-645·Zbl 1138.62323号 ·doi:10.1214/00905360700000929
[25] van de Geer S,Bühlmann P(2009)《关于证明拉索预言结果的条件》。电子J统计3:1360-1392·Zbl 1327.62425号 ·doi:10.1214/09-EJS506
[26] van de Geer S,Bühlmann P,Zhou S(2011)潜在错误模型的自适应和阈值拉索(以及拉索的下限)。电子J统计5:688-749·Zbl 1274.62471号 ·doi:10.1214/11-EJS624
[27] Wainwright M(2009)使用\[\ell_1\]进行高维和噪声稀疏性恢复的尖锐阈值1-约束二次规划(Lasso)。IEEE Trans-Inf理论55:2183-2202·兹比尔1367.62220 ·doi:10.1109/TIT.2009.2016018
[28] Wasserman L,Roeder K(2009)高维变量选择。安统计37:2178-2201·Zbl 1173.62054号 ·doi:10.1214/08-AOS646
[29] West M,Blanchette C,Dressman H,Huang E,Ishida S,Spang R,Zuzan H,Olson JA,Marks JR,Nevins JR(2001)利用基因表达谱预测人类乳腺癌的临床状态。国家科学院院刊98(20):11462-11467·doi:10.1073/pnas.201162998
[30] Ye F,Zhang C-H(2010)\[\ell_q\]的Lasso和Dantzig选择器的速率极小性\[\ell_r\]中的q损失r球。J Mach学习研究11:3519-3540·Zbl 1242.62074号
[31] Zhang C-H,Huang J(2008)高维线性回归中拉索选择的稀疏性和偏差。安统计36:1567-1594·Zbl 1142.62044号 ·doi:10.1214/07-AOS520
[32] 赵鹏,于波(2006)关于拉索模型选择的一致性。J Mach学习研究7:2541-2563·Zbl 1222.62008年
[33] 邹H,Hastie T(2005)通过弹性网的正则化和变量选择。J R Stat Soc系列B 67:301-320·Zbl 1069.62054号 ·doi:10.1111/j.1467-9868.2005.00503.x
[34] 邹H(2006)自适应套索及其预言属性。美国统计协会期刊101:1418-1429·Zbl 1171.62326号 ·doi:10.1198/016214500000735
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。