×

高维回归中的预测器排序和错误发现比例控制。 (英语) Zbl 1417.62200号

小结:我们提出了一种排序和选择程序,以确定相关预测因子的优先级,并控制变量选择中的错误发现比例(FDP)。我们的程序使用了一种基于去参数化拉索估计量的新排序方法。我们表明,新的排序方法在将相关预测因子排序在不相关预测因子之前时,实现了最小非零效应的最优顺序。采用新的排序方法,我们开发了一个变量选择程序,以在用户特定的水平上渐近控制FDP。我们证明,只要去参数化的Lasso估计量是渐近正态的,我们的方法就可以一致地估计变量选择的FDP。在仿真中,当回归模型相对稀疏时,我们的方法在排序效率和FDP控制方面优于现有方法。

MSC公司:

62J07型 岭回归;收缩估计器(拉索)
62甲12 多元分析中的估计
2012年12月62日 参数估计量的渐近性质
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 巴伯,R.F。;Candès,E.J.,通过仿冒品控制错误发现率,Ann.Statist。,43, 2055-2085 (2015) ·Zbl 1327.62082号
[2] Y.本杰米尼。;Hochberg,Y.,《控制错误发现率:一种实用且强大的多重测试方法》,J.R.Stat.Soc.Ser。B统计方法。,57, 289-300 (1995) ·Zbl 0809.62014号
[3] Bickel,P.J。;Ritov,Y。;Tsybakov,A.B.,Lasso和Dantzig选择器的同步分析,Ann.统计师。,37, 1705-1732 (2009) ·Zbl 1173.62022号
[4] 博格丹,M。;范登伯格,E。;萨巴蒂,C。;苏,W。;Candès,E.,SLOPE-通过凸优化的自适应变量选择,Ann.Appl。统计,9,1103-1140(2015)·Zbl 1454.62212号
[5] Bühlmann,P.,《高维线性模型的统计意义》,伯努利,第19期,第1212-1242页(2013年)·Zbl 1273.62173号
[6] Bühlmann,P。;van de Geer,S.,《高维数据方法、理论和应用的统计》(2011),施普林格出版社:纽约施普林格·Zbl 1273.62015年
[7] Cai,T.T。;郭,Z.,高维线性回归的置信区间:极小极大率和适应性,Ann.Statist。,45, 615-646 (2017) ·Zbl 1371.62045号
[8] Cai,T.T。;刘伟。;Zhou,H.,估计稀疏精度矩阵:最优收敛率和自适应估计,Ann.Statist。,44, 455-488 (2016) ·Zbl 1341.62115号
[9] 坎迪斯,E。;范,Y。;Janson,L。;Lv,J.,《淘金:高维受控变量选择的X型仿冒品》,J.R.Stat.Soc.Ser。B统计方法。,80, 551-577 (2018) ·Zbl 1398.62335号
[10] 陈,X。;Doerge,R.,与多重正态均值相关的强大数字定律(2016),http://arxiv.org/abs/1410.4276v3
[11] Dezeure,R。;Bühlmann,P。;Zhang,C.-H.,高维自举同步推理,Test,26,685-719(2017)·兹伯利06833591
[12] Efron,B.,相关性和大规模同时显著性检验,J.Amer。统计师。协会,10293-103(2007)·Zbl 1284.62340号
[13] 范,J。;韩,X。;Gu,W.,估计任意协方差依赖下的错误发现比例,J.Amer。统计师。协会,1071019-1035(2012)·Zbl 1395.62219号
[14] Feller,W.,《概率论及其应用导论》,第二卷(1971年),Wiley:Wiley New York·Zbl 0219.60003号
[15] 弗里格,C。;Kloareg,M。;Causeur,D.,《依赖性下多重测试的因子模型方法》,J.Amer。统计师。协会,1041406-1415(2009)·Zbl 1205.62071号
[16] Genovese,C。;Wasserman,L.A.,错误发现率程序的操作特征和扩展,J.R.Stat.Soc.Ser。B统计方法。,64, 499-517 (2002) ·Zbl 1090.62072号
[17] G'Sell,M.G。;Wager,S。;Chouldechova,A。;Tibshirani,R.J.,《顺序选择程序和错误发现率控制》,J.R.Stat.Soc.Ser。B统计方法。,78, 423-444 (2016) ·Zbl 1414.62341号
[18] Hartigan,J.A.,《限制相关随机变量的最大值》,电子。J.Stat.,8,3126-3140(2014)·兹比尔1310.60016
[19] 爪哇马德,A。;Montanari,A.,Debising the Lasso:高斯设计的最佳样本量,Ann.Statist。,46, 2593-2622 (2018) ·Zbl 1407.62270号
[20] 吉,P。;Zhao,Z.,高维回归中的速率最优多重测试程序(2014),预印arXiv:1404.2961
[21] Lee,J。;Sun,D。;孙,Y。;Taylor,J.,《精确后选择推理及其在套索中的应用》,Ann.Statist。,44, 907-927 (2016) ·兹比尔1341.62061
[22] 洛克哈特,R.A。;泰勒,J。;Tibshirani,R.J。;Tibshirani,R.J.,套索的显著性检验,Ann.Statist。,42413-468(2014年)·兹比尔1305.62254
[23] Mehler,G.F.,U.die Entwicklung einer Funktion von beliebig vielen Variablen nach Laplaceschen Funktitonen höherer Ordnung,J.Reine Angew。数学。,66, 161-176 (1866) ·ERAM 066.1720cj公司
[24] 明绍森,N。;Bühlmann,P.,《高维图与拉索变量选择》,Ann.Statist。,34, 1436-1462 (2006) ·Zbl 1113.62082号
[25] 明绍森,N。;Meier,L。;Bühlmann,P.,高维回归的(P\)值,J.Amer。统计师。协会,104,1671-1681(2009)·Zbl 1205.62089号
[26] 苏,W。;博格丹,M。;Candès,E.,Lasso路径早期出现错误发现,Ann.Statist。,45, 2133-2150 (2017) ·Zbl 1459.62142号
[27] 苏,W。;Candès,E.,SLOPE适应未知稀疏性和渐近极小极大,Ann.Statist。,44, 1038-1068 (2016) ·Zbl 1338.62032号
[28] Sun,W。;Cai,T.T.,Oracle和错误发现率控制的自适应复合决策规则,J.Amer。统计师。协会,102,901-912(2007)·Zbl 1469.62318号
[29] Tibshirani,R.J.,通过Lasso,J.R.Stat.Soc.Ser.回归收缩和选择。B统计方法。,58, 267-288 (1996) ·Zbl 0850.62538号
[30] van de Geer,S。;Bühlmann,P。;Ritov,Y。;Dezeure,R.,《关于高维模型的渐近最优置信域和检验》,《统计年鉴》。,42, 1166-1202 (2014) ·Zbl 1305.62259号
[31] Wainwright,M.J.,使用(ell_1)约束二次规划(Lasso)恢复高维和噪声稀疏性的夏普阈值,IEEE Trans。通知。理论,55,2183-2202(2009)·Zbl 1367.62220号
[32] Wasserman,洛杉矶。;Roeder,K.,高维变量选择,Ann.Statist。,37, 2178-2201 (2009) ·Zbl 1173.62054号
[33] Watson,G.N.,关于多项式生成函数的注记:(2)Hermite多项式,J.Lond。数学。社会科学,1-8194-199(1933)·Zbl 0007.20301号
[34] 张,X。;Cheng,G.,高维线性模型的同时推理,J.Amer。统计师。协会,112757-768(2016)
[35] 张,C.-H。;Zhang,S.S.,高维线性模型中低维参数的置信区间,J.R.Stat.Soc.Ser。B统计方法。,76, 217-242 (2014) ·Zbl 1411.62196号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。