文件Zbl 06224985-zbMATH Open

错误指定模型惩罚似然估计中正则化参数选择的效率。（英语） Zbl 06224985号

美国统计协会。 108，第503号，1031-1043（2013）.

摘要：已有研究表明，在总体方差已知或一致估计可用的假设下，Akaike信息准则（AIC）型准则是非协调惩罚回归方法中调整参数的渐近有效选择子。我们放宽了这个假设，以证明AIC本身是渐近有效的，并且我们研究了它在有限样本中的性能。在经典回归中，当最大候选模型的维数相对于样本大小较大时，AIC倾向于选择过于复杂的模型。模拟研究表明，AIC在用于惩罚回归时也存在同样的缺点。因此，我们建议使用经典修正AIC（AIC（c））作为替代，并证明它保持了所需的渐近性质。为了扩大我们的结果，我们进一步证明了AIC在无色散参数的广义线性模型中对惩罚似然方法的有效性。文献中也有类似的结果，但仅限于一组有限的候选模型。通过使用经典文献中关于错误指定模型中最大似然估计的结果，我们能够为一般候选模型集建立此结果。我们使用模拟来评估AIC和AIC以及其他选择器在有限样本中对于平滑剪裁绝对偏差（SCAD）惩罚和Lasso回归的性能，并考虑了一个实际数据示例。本文的补充材料可在网上获得。

引用于10文件

MSC公司：

62至XX

统计

关键词：

Akaike信息准则（AIC）;最小绝对收缩和选择运算符（Lasso）;模型选择/变量选择;正则化方法;平滑剪裁绝对偏差

软件：

拉尔斯;ElemStatLearn（电子状态学习）

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

参考文献：

[1]	Akaike H.，第二届信息理论国际研讨会论文集，第267页–（1973）
[2]	Box G.E.P.，《统计稳健性：研讨会论文集》，第201页–（1979）
[3]	Breheny P.，《应用统计年鉴》5，第232页–（2011年）·Zbl 1220.62095号 ·doi:10.1214/10-AOAS388
[4]	伯纳姆·K·P，《模型选择和多模型推理：实用信息理论方法》（2002年）·Zbl 1005.62007号
[5]	Craven P.，《数值数学》31第377页–（1978）·Zbl 0377.65007号 ·doi:10.1007/BF01404567
[6]	内政部：10.1198/016214501753382273·Zbl 1073.62547号 ·doi:10.1198/016214501753382273
[7]	Fan J.，《统计年鉴》32页928–（2004）·Zbl 1092.62031号 ·doi:10.1214/009053604000000256
[8]	内政部：10.1080/00401706.1974.10489231·doi:10.1080/00401706.1974.10489231
[9]	Gelman A.，《统计科学》第25卷第162页–（2010年）·Zbl 1328.62045号 ·doi:10.1214/10-STS308B
[10]	Hastie T.，Lars：最小角度回归，Lasso和正向分段（2011年）
[11]	Hastie T.，《统计学习的要素：数据挖掘、推理和预测》（第二版）（2009年）·Zbl 1273.62005年 ·doi:10.1007/978-0-387-84858-7
[12]	Hurvich C.M.，《生物统计学》第76页第297页–（1989）·Zbl 0669.62085号 ·doi:10.1093/biomet/76.2.297
[13]	Hurvich C.M.，《生物特征》78第499页–（1991）
[14]	Hurvich C.M.，《生物统计学》51第1077页–（1995年）·Zbl 0875.62359号 ·doi:10.2307/2533006
[15]	Leng C.，《中国统计》第16卷第1273页–（2006年）
[16]	Li K.-C.，《统计年鉴》，第15页，958页–（1987）·Zbl 0653.62037号 ·doi:10.1214/aos/1176350486
[17]	内政部：10.1080/00401706.1973.10489103·文件编号：10.1080/00401706.1973.10489103
[18]	McCullagh P.，广义线性模型（第二版）（1989年）·Zbl 0744.62098号 ·doi:10.1007/9781-4899-3242-6
[19]	Nishii R.，《多变量分析杂志》，第27页，第392页-（1988）·Zbl 0684.62026号 ·doi:10.1016/0047-259X（88）90137-6
[20]	Park M.Y.，glmpath:广义线性模型和Cox比例风险模型的L1正则化路径（2011）
[21]	Schwarz G.，《统计年鉴》，第6页，461页–（1978年）·Zbl 0379.62005年 ·doi:10.1214/aos/1176344136
[22]	Sela R.J.，《机器学习》86，第169页–（2012年）·Zbl 1238.68131号 ·doi:10.1007/s10994-011-5258-3
[23]	邵杰，《中国统计》第7卷第221页–（1997）
[24]	Shibata R.，《统计年鉴》8第147页–（1980）·Zbl 0425.62069号 ·doi:10.1214/aos/1176344897
[25]	--，Biometrika 68第45页–（1981）·Zbl 0464.62054号 ·doi:10.1093/biomet/68.1.45
[26]	Tibshirani R.，《皇家统计学会杂志》，B辑58，第267页–（1996）
[27]	Wang H.，Biometrika 94第553页–（2007年）·Zbl 1135.62058号 ·doi:10.1093/biomet/asm053
[28]	White H.，《计量经济学》50第1页–（1982年）·Zbl 0478.62088号 ·doi:10.2307/1912526
[29]	Yang Y.，Biometrika 92第937页–（2005）·Zbl 1151.62301号 ·doi:10.1093/biomet/92.4937
[30]	内政部：10.1198/jasa.2009.tm08013·Zbl 1397.62262号 ·doi:10.1198/jasa.2009.tm08013
[31]	赵平，《机器学习研究杂志》，第7页，第2541页–（2006）
[32]	内政部：10.1198/016214500000735·Zbl 1171.62326号 ·doi:10.1198/016214500000735
[33]	Zou H.，《皇家统计学会杂志》，B辑67第301页–（2005）·兹比尔1069.62054 ·数字对象标识代码：10.1111/j.1467-9868.2005.0050.x
[34]	邹华，《统计年鉴》，第35页，第2173页–（2007年）·Zbl 1126.62061号 ·doi:10.1214/009053600700000127

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

错误指定模型惩罚似然估计中正则化参数选择的效率。（英语） Zbl 06224985号

MSC公司：

关键词：

软件：

参考文献：

示例

领域

操作员

错误指定模型惩罚似然估计中正则化参数选择的效率。 （英语） Zbl 06224985号

MSC公司：

关键词：

软件：

参考文献：

错误指定模型惩罚似然估计中正则化参数选择的效率。（英语） Zbl 06224985号