×

错误指定模型惩罚似然估计中正则化参数选择的效率。 (英语) Zbl 06224985号

摘要:已有研究表明,在总体方差已知或一致估计可用的假设下,Akaike信息准则(AIC)型准则是非协调惩罚回归方法中调整参数的渐近有效选择子。我们放宽了这个假设,以证明AIC本身是渐近有效的,并且我们研究了它在有限样本中的性能。在经典回归中,当最大候选模型的维数相对于样本大小较大时,AIC倾向于选择过于复杂的模型。模拟研究表明,AIC在用于惩罚回归时也存在同样的缺点。因此,我们建议使用经典修正AIC(AIC(c))作为替代,并证明它保持了所需的渐近性质。为了扩大我们的结果,我们进一步证明了AIC在无色散参数的广义线性模型中对惩罚似然方法的有效性。文献中也有类似的结果,但仅限于一组有限的候选模型。通过使用经典文献中关于错误指定模型中最大似然估计的结果,我们能够为一般候选模型集建立此结果。我们使用模拟来评估AIC和AIC以及其他选择器在有限样本中对于平滑剪裁绝对偏差(SCAD)惩罚和Lasso回归的性能,并考虑了一个实际数据示例。本文的补充材料可在网上获得。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Akaike H.,第二届信息理论国际研讨会论文集,第267页–(1973)
[2] Box G.E.P.,《统计稳健性:研讨会论文集》,第201页–(1979)
[3] Breheny P.,《应用统计年鉴》5,第232页–(2011年)·Zbl 1220.62095号 ·doi:10.1214/10-AOAS388
[4] 伯纳姆·K·P,《模型选择和多模型推理:实用信息理论方法》(2002年)·Zbl 1005.62007号
[5] Craven P.,《数值数学》31第377页–(1978)·Zbl 0377.65007号 ·doi:10.1007/BF01404567
[6] 内政部:10.1198/016214501753382273·Zbl 1073.62547号 ·doi:10.1198/016214501753382273
[7] Fan J.,《统计年鉴》32页928–(2004)·Zbl 1092.62031号 ·doi:10.1214/009053604000000256
[8] 内政部:10.1080/00401706.1974.10489231·doi:10.1080/00401706.1974.10489231
[9] Gelman A.,《统计科学》第25卷第162页–(2010年)·Zbl 1328.62045号 ·doi:10.1214/10-STS308B
[10] Hastie T.,Lars:最小角度回归,Lasso和正向分段(2011年)
[11] Hastie T.,《统计学习的要素:数据挖掘、推理和预测》(第二版)(2009年)·Zbl 1273.62005年 ·doi:10.1007/978-0-387-84858-7
[12] Hurvich C.M.,《生物统计学》第76页第297页–(1989)·Zbl 0669.62085号 ·doi:10.1093/biomet/76.2.297
[13] Hurvich C.M.,《生物特征》78第499页–(1991)
[14] Hurvich C.M.,《生物统计学》51第1077页–(1995年)·Zbl 0875.62359号 ·doi:10.2307/2533006
[15] Leng C.,《中国统计》第16卷第1273页–(2006年)
[16] Li K.-C.,《统计年鉴》,第15页,958页–(1987)·Zbl 0653.62037号 ·doi:10.1214/aos/1176350486
[17] 内政部:10.1080/00401706.1973.10489103·文件编号:10.1080/00401706.1973.10489103
[18] McCullagh P.,广义线性模型(第二版)(1989年)·Zbl 0744.62098号 ·doi:10.1007/9781-4899-3242-6
[19] Nishii R.,《多变量分析杂志》,第27页,第392页-(1988)·Zbl 0684.62026号 ·doi:10.1016/0047-259X(88)90137-6
[20] Park M.Y.,glmpath:广义线性模型和Cox比例风险模型的L1正则化路径(2011)
[21] Schwarz G.,《统计年鉴》,第6页,461页–(1978年)·Zbl 0379.62005年 ·doi:10.1214/aos/1176344136
[22] Sela R.J.,《机器学习》86,第169页–(2012年)·Zbl 1238.68131号 ·doi:10.1007/s10994-011-5258-3
[23] 邵杰,《中国统计》第7卷第221页–(1997)
[24] Shibata R.,《统计年鉴》8第147页–(1980)·Zbl 0425.62069号 ·doi:10.1214/aos/1176344897
[25] --,Biometrika 68第45页–(1981)·Zbl 0464.62054号 ·doi:10.1093/biomet/68.1.45
[26] Tibshirani R.,《皇家统计学会杂志》,B辑58,第267页–(1996)
[27] Wang H.,Biometrika 94第553页–(2007年)·Zbl 1135.62058号 ·doi:10.1093/biomet/asm053
[28] White H.,《计量经济学》50第1页–(1982年)·Zbl 0478.62088号 ·doi:10.2307/1912526
[29] Yang Y.,Biometrika 92第937页–(2005)·Zbl 1151.62301号 ·doi:10.1093/biomet/92.4937
[30] 内政部:10.1198/jasa.2009.tm08013·Zbl 1397.62262号 ·doi:10.1198/jasa.2009.tm08013
[31] 赵平,《机器学习研究杂志》,第7页,第2541页–(2006)
[32] 内政部:10.1198/016214500000735·Zbl 1171.62326号 ·doi:10.1198/016214500000735
[33] Zou H.,《皇家统计学会杂志》,B辑67第301页–(2005)·兹比尔1069.62054 ·数字对象标识代码:10.1111/j.1467-9868.2005.0050.x
[34] 邹华,《统计年鉴》,第35页,第2173页–(2007年)·Zbl 1126.62061号 ·doi:10.1214/009053600700000127
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。