×

高维群优化回归中的一致调整参数选择。 (英语) Zbl 07069497号

总结:针对变量的分组结构,提出了各种形式的惩罚估计量,它们具有良好的统计和计算特性,用于变量选择。然而,这些收缩和选择估计器的吸引人的特性主要取决于调谐参数的选择。用于选择调谐参数的一种方法是通过信息准则,例如贝叶斯信息准则(BIC)。本文研究具有分组结构的高维广义线性回归的一致调整参数选择问题。我们将扩展正则化信息准则(ERIC)的结果推广到包含凹惩罚的群选择方法,然后研究了每个群中发散变量的选择一致性。此外,我们还证明了ERIC类型选择器能够一致地识别真实模型,并且即使在组数远大于样本量时,得到的估计量也具有预言性质。仿真结果表明,在选择真实分组变量时,ERIC型选择器可以显著优于BIC和交叉验证选择器,并给出了一个实证例子来说明其使用。

MSC公司:

62甲12 多元分析中的估计
62J12型 广义线性模型(逻辑模型)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Breheny P,Huang J.具有分组预测因子的非凸惩罚线性和逻辑回归模型的群下降算法。统计计算,2015,25:173-187·Zbl 1331.62359号 ·doi:10.1007/s11222-013-9424-2
[2] Chen J,Chen Z.大模型空间模型选择的扩展贝叶斯信息准则。《生物特征》,2008,95:759-771·Zbl 1437.62415号 ·doi:10.1093/biomet/asn034
[3] 科尔特斯,P。;Silva,A.M G.,《使用数据挖掘预测中学生表现》(2008年)
[4] Fan J,Li R.基于非冲突惩罚似然的变量选择及其预言性质。J Amer统计协会,2001,96:1348-1360·Zbl 1073.62547号 ·doi:10.1198/016214501753382273
[5] Fan J,Peng H.参数个数发散的非塌陷惩罚似然。《统计年鉴》,2004,32:928-961·Zbl 1092.62031号 ·doi:10.1214/009053604000000256
[6] Fan J,Song R.具有NP维的广义线性模型中的确定独立筛选。《统计年鉴》,2010年,38:3567-3604·Zbl 1206.68157号 ·doi:10.1214/10-AOS798
[7] Fan Y,Tang C Y.在高维惩罚似然中调整参数选择。J R Stat Soc Ser B Stat Methodol,2013年,75:531-552·兹比尔1411.62216 ·doi:10.1111/rssb.12001
[8] Friedman J,Hastie T,Tibshirani R.关于LASSO群和稀疏群LASSO的注记。ArXiv:1001.07362010年
[9] Gao X,Carroll R J.高维数据集成。生物特征,2017,104:251-272·Zbl 1506.62302号
[10] Huang J,Breheny P,Ma S.高维模型中群体选择的选择性综述。Statist Sci,2012,27:481-499·Zbl 1331.62347号 ·doi:10.1214/12-STS392
[11] Huang J,Ma S,Zhang C H。稀疏高维回归模型的自适应LASSO。中国统计局,2008,18:1603-1618·Zbl 1255.62198号
[12] Hui F K C,Warton D I,Foster S D。使用ERIC进行自适应LASSO的调谐参数选择。J Amer统计协会,2015,110:262-269·Zbl 1373.62370号 ·doi:10.1080/01621459.2014.951444
[13] Kim Y,Kwon S,Choi H.高维一致的模型选择标准。J Mach Learn Res,2012年,13:1037-1057·Zbl 1283.62143号
[14] McCullagh P,Nelder J A.广义线性模型。博卡拉顿:CRC出版社,1989年·Zbl 0744.62098号 ·doi:10.1007/9781-4899-3242-6
[15] Meier L,Van De Geer S,Bühlmann P。逻辑回归的LASSO组。J R Stat Soc Ser B Stat Methodol,2008年,70:53-71·Zbl 1400.62276号 ·文件编号:10.1111/j.1467-9868.2007.00627.x
[16] 王浩,冷川。关于自适应群LASSO的注记。计算统计数据分析,2008,52:5277-5286·Zbl 1452.62524号 ·doi:10.1016/j.csda.2008.05.006
[17] 王浩,李斌,冷C.参数发散数的收缩率调谐参数选择。J R Stat Soc Ser B Stat Methodol,2009年,71:671-683·Zbl 1250.62036号 ·文件编号:10.1111/j.1467-9868.2008.00693.x
[18] Wang L,Chen G,Li H。微阵列时间进程基因表达数据的SCAD回归分析。生物信息学,2007,23:1486-1494·doi:10.1093/bioinformatics/btm125
[19] Wei F,Huang J.高维线性回归中的一致组选择。伯努利,2010,16:1369-1384·Zbl 1207.62146号 ·doi:10.3150/10-BEJ252
[20] 袁明,林毅。分组变量回归中的模型选择和估计。J R Stat Soc Ser B Stat Methodol,2006,68:49-67·Zbl 1141.62030号 ·doi:10.1111/j.1467-9868.2005.00532.x
[21] 张毅,李锐,蔡家良。基于广义信息准则的正则化参数选择。J Amer统计协会,2010,105:312-323·Zbl 1397.62262号 ·doi:10.1198/jasa.2009.tm08013
[22] Zhang Y,Shen X.高维数据的模型选择程序。统计分析数据Min,2010,3:350-358·Zbl 07260255号 ·doi:10.1002/sam.10088
[23] 邹H。自适应拉索及其预言属性。J Amer统计协会,2006,101:1418-1429·Zbl 1171.62326号 ·doi:10.1198/016214500000735
[24] Zou H,Li R.非凹陷惩罚似然模型中的一步稀疏估计。《统计年鉴》,2008,36:1509-1533·Zbl 1142.62027号 ·doi:10.1214/0090536007000000802
[25] 邹华,张海华。关于参数发散的自适应弹性网。《统计年鉴》,2009,37:1733-1751·Zbl 1168.62064号 ·doi:10.1214/08-AOS625
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。