×

基于排名的高维数据变量选择。 (英语) Zbl 1460.62033号

本文考虑了基于秩的变量选择(RBVS)技术,该技术使用自举样本并选择排名靠前的变量集。作者证明了RBVS在变量选择中的一致性,即RBVS识别与响应变量相关的所有重要协变量,其概率趋向于(1)作为样本量(n)。该理论结果的一组假设允许高维设置,其中协变量的数量(p)大大超过样本量(n)。还使用综合模型进行了仿真研究,将RBVS的实际性能与现有的一些变量选择技术进行了比较。因此,本文展示了一种基于简单思想的变量选择方法的良好理论和实际性能。

MSC公司:

62F07型 统计排名和选择程序
2015年1月62日 贝叶斯推断
62F40型 引导、折刀和其他重采样方法

软件:

径向基车辆姐妹
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Baranowski,R.(2016)。高维、分段和多尺度时间序列中的变量选择。伦敦政治经济学院(LSE)博士论文。
[2] Baranowski,R.、Breheny,P.和Turner,I.(2015)。rbvs:基于排名的变量选择。https://CRAN.R-project.org/package=rbvs。R软件包版本1.0.2。
[3] Barut,A.E.(2013)。高维问题中的变量选择和预测。普林斯顿大学博士论文。
[4] Barut,E.、Fan,J.和Verhasselt,A.(2016)。有条件的确定独立性筛选。J.艾默。统计师。协会1111266-1277。
[5] Bickel,P.J.、G¨otze,F.和van Zwet,W.R.(2012)。重新抽样少于n个观察:收益、损失和损失补救。斯普林格·Zbl 1373.62173号
[6] Breheny,P.和Huang,J.(2011)。非凸惩罚回归的坐标下降算法及其在生物特征选择中的应用。Ann.应用。统计5,232-253·Zbl 1220.62095号
[7] Candes,E.和Tao,T.(2007)。Dantzig选择器:当np远大于n时的统计估计。《统计年鉴》35,2313-2351·Zbl 1139.62019号
[8] Chang,J.、Tang,C.Y.和Wu,Y.(2013)。边际经验似然和确定独立性特征筛选。《统计年鉴》41,2123-2148·Zbl 1277.62109号
[9] Cho,H.和Fryzlewicz,P.(2012)。通过倾斜进行高维变量选择。J.R.统计社会服务。B Stat.Methodol.74,593-622·Zbl 1411.62183号
[10] Delaigle,A.和Hall,P.(2012年)。重尾对超高维变量排序方法的影响。统计师。中国22909-932·Zbl 1257.62057号
[11] Fan,J.、Feng,Y.和Song,R.(2011)。稀疏超高维可加模型中的非参数独立筛选。J.艾默。统计师。协会106544-557·Zbl 1232.62064号
[12] Fan,J.和Li,R.(2001)。通过非冲突惩罚似然及其oracle属性进行变量选择。J.艾默。统计师。协会961348-1360·Zbl 1073.62547号
[13] Fan,J.和Lv,J.(2008)。确保超高维特征空间的独立筛选。J.R.统计社会服务。B Stat.Methodol.70,849-911·Zbl 1411.62187号
[14] Fan,J.和Song,R.(2010年)。NP维数广义线性模型的确定独立性筛选。《统计年鉴》38,3567-3604·Zbl 1206.68157号
[15] G¨otze,F.和Raáckauskas,A.(2001)。引导样本大小的自适应选择。莱克特。注释专题论文系列31,286-309·Zbl 1373.62177号
[16] Hall,P.和Miller,H.(2009年a)。在高维问题中使用广义相关性来影响变量选择。J.计算。图表。统计.18533-550。
[17] Hall,P.和Miller,H.(2009b)。使用引导程序来量化经验排名的权威性。美国国家统计局,第373929-3959页·兹比尔1191.62080
[18] He,X.,Wang,L.和Hong,H.G.(2013)。高维异质数据的分位数自适应无模型变量筛选。《统计年鉴》41,342-369·Zbl 1295.62053号
[19] 霍夫丁(1963)。有界随机变量和的概率不等式。J.艾默。统计师。协会58,13-30·Zbl 0127.10602号
[20] Kalisch,M.和B¨uhlmann,P.(2007年)。用PC-算法估计高维有向非循环图。J.马赫。学习。第8号决议,613-636·Zbl 1222.68229号
[21] Li,G.,Peng,H.,Zhang,J.和Zhu,L.(2012)。基于稳健秩相关的筛选。《统计年鉴》,1846-1877年·Zbl 1257.62067号
[22] Li,R.,Zhong,W.和Zhu,L.(2012)。通过距离相关学习进行特征筛选。J.艾默。统计师。协会1071129-1139·Zbl 1443.62184号
[23] Liu,J.、Zhong,W.和Li,R.(2015)。超高维数据特征筛选的选择性概述。科学中国数学58,1-22。
[24] Lounici,K.(2008)lasso和dantzig估计的超形式收敛速度和符号集中性质。电子。J.Stat.2,90-102·Zbl 1306.62155号
[25] Meinshausen,N.和B¨uhlmann,P.(2010年)。稳定性选择。J.R.统计社会服务。B Stat.Methodol.72,417-473·Zbl 1411.62142号
[26] Saldana,D.F.和Feng,Y.(2018年)。SIS:超高维统计模型中确定独立性筛选的R包。J.Stat.Softw.82.统计软件。
[27] Shah,R.D.和Samworth,R.J.(2013)。带误差控制的变量选择:稳定性选择的另一种观点。J.R.统计社会服务。B统计方法75,55-80·Zbl 07555438号
[28] Shao,X.和Zhang,J.(2014)。鞅差相关及其在高维变量筛选中的应用。J.艾默。统计师。协会109,1302-1318·Zbl 1368.62157号
[29] Sz´ekely,G.J.和Rizzo,M.L.(2009)。布朗距离协方差。Ann.应用。统计3,1236-1265·Zbl 1196.62077号
[30] Tibshirani,R.(1996)。通过套索回归收缩和选择。J.R.统计社会服务。B Stat.Methodol.58267-288·Zbl 0850.62538号
[31] Topsöe,F.(2004)。对数函数的一些边界。不平等。理论应用4,137-151。
[32] Zhang,C.H.(2010)。极小极大凹罚下的近似无偏变量选择。《统计年鉴》38,894-942·Zbl 1183.62120号
[33] Zhu,L.P.、Li,L、Li、R.和Zhu、L.X.(2011)。超高维数据的无模型特征筛选。J.艾默。统计师。协会1061464-1475·Zbl 1233.62195号
[34] 伦敦政治经济学院哥伦比亚学院统计系,
[35] 英国WC2A 2AE伦敦霍顿街。
[36] 电子邮件:r.baranowski@lse.ac.uk
[37] 伦敦政治经济学院哥伦比亚学院统计系,
[38] 1516BARANOWSKI、CHEN和FRYZLEWICZ
[39] 英国WC2A 2AE伦敦霍顿街。
[40] 电子邮件:y.chen101@lse.ac.uk
[41] 伦敦政治经济学院哥伦比亚学院统计系,
[42] 英国WC2A 2AE伦敦霍顿街。
[43] 电子邮件:p。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。