文件Zbl 1306.65035-zbMATH Open

高维变量筛选和后续推断中的偏差，并进行实证比较。（英语） Zbl 1306.65035号

计算。斯达。 29，第3-4号，407-430（2014）.

总结：我们回顾了高维线性模型中的变量选择和变量筛选。因此，一个主要关注点是基于128种不同稀疏场景的半真实数据（真实数据协变量，但合成回归系数和噪声）的真阳性和假阳性选择率的各种估计方法的实证比较。此外，我们使用第一阶段选定的变量，给出了后续最小二乘估计中偏差的一些理论界，这对构建回归系数的p值有直接影响。

引用于22文件

MSC公司：

62-08	统计问题的计算方法
62J05型	线性回归；混合模型
62J07型	岭回归；收缩估计器（拉索）
62G08号	非参数回归和分位数回归

关键词：

弹性网;套索;线性模型;脊;稀疏;确定独立性筛选;变量选择

软件：

格尔姆奈特;助推

PDF格式 BibTeX公司 XML格式引用

全文：内政部链接

参考文献：

[1]	Adragni K，Cook R（2009），回归中的充分降维和预测。菲洛斯Trans R Soc A 367:4385-4400·Zbl 1185.62109号 ·doi:10.1098/rsta.2009.0110
[2]	Bickel P、Ritov Y、Tsybakov A（2009）《Lasso和Dantzig选择器的同步分析》。Ann统计37:1705-1732·Zbl 1173.62022号 ·doi:10.1214/08-AOS620
[3]	Bühlmann P（2012）高维线性模型的统计显著性。伯努利（出现）·Zbl 1273.62173号
[4]	Bühlmann P，van de Geer S（2011）高维数据统计：方法、理论和应用。纽约州施普林格·Zbl 1273.62015年 ·doi:10.1007/978-3-642-20192-9
[5]	Bühlmann P，Meier L，Kalisch M（2013）《着眼于生物学应用的高维统计》。年度收入统计申请（待出现）·Zbl 1168.62044号
[6]	Bunea F、Tsybakov A、Wegkamp M（2007）《拉索的稀疏预言不等式》。电子J统计1:169-194·Zbl 1146.62028号 ·doi:10.1214/07-EJS008
[7]	Candès E，Tao T（2007）Dantzig选择器：当p远大于n时的统计估计Ann Stat 35（6）：2313-2351·Zbl 1139.62019号 ·doi:10.1214/00905360000001523
[8]	Dettling M（2004）Bagboosting，利用基因表达数据进行肿瘤分类。生物信息学20（18）：3583-3593·doi:10.1093/bioinformatics/bth447
[9]	Fan J，Li R（2001）基于非冲突惩罚似然的变量选择及其预言性质。美国统计学会杂志96:1348-1360·Zbl 1073.62547号 ·doi:10.1198/016214501753382273
[10]	Fan J，Lv J（2008）超高维特征空间的确定独立筛选（含讨论）。J R Stat Soc B系列70:849-911·Zbl 1411.62187号 ·doi:10.1111/j.1467-9868.2008.00674.x
[11]	Friedman J，Hastie T，Tibshirani R（2010）通过坐标下降法实现广义线性模型的正则化路径。J Stat Softw统计软件33（1）：1-22
[12]	Greenshtein E，Ritov Y（2004）高维预测因子选择的持续性和超参数化的优点。伯努利10:971-988·Zbl 1055.62078号 ·doi:10.3150/bj/1106314846
[13]	Hebiri M，van de Geer S（2011）《光滑的拉索和其他》ℓ1+ℓ2处罚方法。电子J统计5:1184-1226·Zbl 1274.62443号 ·doi:10.1214/11-EJS638
[14]	Koltchinskii V（2009a）Dantzig选择器和稀疏预言不等式。伯努利15:799-828·兹比尔1452.62486 ·doi:10.3150/09-BEJ187
[15]	Koltchinskii V（2009b）惩罚经验风险最小化中的稀疏性。亨利·庞加莱研究所，Probab et Stat 45:7-57·Zbl 1168.62044号 ·doi:10.1214/07-AIHP146
[16]	Meinshausen N，Bühlmann P（2006）Lasso的高维图和变量选择。安统计34:1436-1462·Zbl 1113.62082号 ·doi:10.1214/0090536000000281
[17]	Meinshausen N，Meier L，Bühlmann P（2009）高维回归的P值。美国统计协会杂志104:1671-1681·Zbl 1205.62089号 ·doi:10.1198/jasa.2009.tm08647
[18]	Meinshausen N，Yu B（2009）高维数据稀疏表示的Lasso类型恢复。安统计37:246-270·Zbl 1155.62050号 ·doi:10.1214/07-AOS582
[19]	Raskutti G，Wainwright M，Yu B（2010）相关高斯设计的受限特征值特性。J Mach学习研究11:2241-2259·Zbl 1242.62071号
[20]	Shao J，Deng X（2012）具有确定性设计矩阵的高维线性模型中的估计。安统计40:812-831·Zbl 1273.62177号 ·doi:10.1214/12-AOS982
[21]	Sun T，Zhang C-H（2012）标度稀疏线性回归。生物特征99:879-898·兹比尔1452.62515 ·doi:10.1093/biomet/ass043
[22]	Tibshirani R（1996）通过Lasso回归收缩和选择。J R Stat Soc Ser B期刊58:267-288·Zbl 0850.62538号
[23]	van de Geer S（2007）确定性拉索。摘自：JSM会议记录，第140页。弗吉尼亚州亚历山大美国统计协会·Zbl 1073.62547号
[24]	van de Geer S（2008）高维广义线性模型和Lasso。安统计36:614-645·Zbl 1138.62323号 ·doi:10.1214/00905360700000929
[25]	van de Geer S，Bühlmann P（2009）《关于证明拉索预言结果的条件》。电子J统计3:1360-1392·Zbl 1327.62425号 ·doi:10.1214/09-EJS506
[26]	van de Geer S，Bühlmann P，Zhou S（2011）潜在错误模型的自适应和阈值拉索（以及拉索的下限）。电子J统计5:688-749·Zbl 1274.62471号 ·doi:10.1214/11-EJS624
[27]	Wainwright M（2009）使用\[\ell_1\]进行高维和噪声稀疏性恢复的尖锐阈值ℓ1-约束二次规划（Lasso）。IEEE Trans-Inf理论55:2183-2202·兹比尔1367.62220 ·doi:10.1109/TIT.2009.2016018
[28]	Wasserman L，Roeder K（2009）高维变量选择。安统计37:2178-2201·Zbl 1173.62054号 ·doi:10.1214/08-AOS646
[29]	West M，Blanchette C，Dressman H，Huang E，Ishida S，Spang R，Zuzan H，Olson JA，Marks JR，Nevins JR（2001）利用基因表达谱预测人类乳腺癌的临床状态。国家科学院院刊98（20）：11462-11467·doi:10.1073/pnas.201162998
[30]	Ye F，Zhang C-H（2010）\[\ell_q\]的Lasso和Dantzig选择器的速率极小性ℓ\[\ell_r\]中的q损失ℓr球。J Mach学习研究11:3519-3540·Zbl 1242.62074号
[31]	Zhang C-H，Huang J（2008）高维线性回归中拉索选择的稀疏性和偏差。安统计36:1567-1594·Zbl 1142.62044号 ·doi:10.1214/07-AOS520
[32]	赵鹏，于波（2006）关于拉索模型选择的一致性。J Mach学习研究7:2541-2563·Zbl 1222.62008年
[33]	邹H，Hastie T（2005）通过弹性网的正则化和变量选择。J R Stat Soc系列B 67:301-320·Zbl 1069.62054号 ·doi:10.1111/j.1467-9868.2005.00503.x
[34]	邹H（2006）自适应套索及其预言属性。美国统计协会期刊101:1418-1429·Zbl 1171.62326号 ·doi:10.1198/016214500000735

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
输出	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
作业成本法*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

高维变量筛选和后续推断中的偏差，并进行实证比较。（英语） Zbl 1306.65035号

MSC公司：

关键词：

软件：

参考文献：

示例

领域

操作员

高维变量筛选和后续推断中的偏差，并进行实证比较。 （英语） Zbl 1306.65035号

MSC公司：

关键词：

软件：

参考文献：

高维变量筛选和后续推断中的偏差，并进行实证比较。（英语） Zbl 1306.65035号