×

更快地切换以更快地赶上:自适应估计的预测方法,并应用于AIC-BIC困境。通过讨论和作者的回复。 (英语) Zbl 1411.62073号

总结:基于贝叶斯模型选择和模型平均的预测和估计,以及贝叶斯信息标准BIC等衍生方法,并不总是以尽可能快的速度收敛。我们确定追赶现象作为对贝叶斯方法收敛速度慢的一种新解释,它激发了对贝叶斯预测分布的修改,称为开关配电当用作自适应估计器时,开关分布在非参数密度估计和高斯回归问题中确实达到了最佳的累积风险收敛速度。我们证明了在非常弱的条件下,在不知道潜在平滑度的情况下,可以获得最小最大累积风险。与其他自适应模型选择程序(如Akaike信息标准AIC和leave-on-out交叉验证)不同,BIC和Bayes因子模型选择通常具有统计一致性。我们表明,开关分布保留了这一特性,从而解决了AIC-BIC累积风险的困境。交换机分布具有高效的实现。我们将其性能与AIC、BIC和贝叶斯模型选择进行了比较,并用模拟数据对回归问题进行了平均。

MSC公司:

2015年1月62日 贝叶斯推断
62B10型 信息理论主题的统计方面
62层35 鲁棒性和自适应程序(参数推断)
62升12 序贯估计
62-02 与统计学有关的研究论述(专著、调查文章)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Akaike,H.(1974)统计模型识别的新视角。IEEE传输。自动。控制, 19, 716– 723. ·Zbl 0314.62039号
[2] Akaike,H.(1979)自回归模型拟合最小AIC过程的贝叶斯推广。生物特征, 66, 237– 242. ·Zbl 0407.62064号
[3] Barron,A.R.(1998)贝叶斯性能的信息论表征以及参数和非参数问题中先验的选择。贝叶斯统计6(编辑J.M.Bernardo、J.O.Berger和A.F.M.Smith),第27-52页。牛津:克拉伦登·Zbl 0974.62020号
[4] Barron,A.和Cover,T.(1991)最小复杂度密度估计。IEEE传输。通知。西奥。, 37, 1034– 1054. ·Zbl 0743.62003号
[5] Barron,A.、Rissanen,J.和Yu,B.(1998)编码和建模中的最小描述长度原则。IEEE传输。通知。西奥。, 44, 2743– 2760. ·兹伯利0933.94013
[6] Barron,A.和Sheu,C.(1991)通过指数族序列近似密度函数。安。统计师。, 19, 1347– 1369. ·Zbl 0739.62027号
[7] Barron,A.,Yang,Y.和Yu,B.(1994)最小复杂度准则下的渐近最优函数估计。国际交响乐团。《信息论》,特隆赫姆,第38页。纽约:电气与电子工程师学会。
[8] Bernardo,J.和Smith,A.(1994)贝叶斯理论。奇切斯特:威利·兹比尔0796.62002
[9] Box,G.E.P.和Tiao,G.C.(1973)《统计分析中的贝叶斯推断》。阅读:Addison‐Wesley·Zbl 0271.62044号
[10] Burnham,K.P.和Anderson,D.R.(2002)《模型选择和多模型推断》,第2版。纽约:斯普林格·Zbl 1005.62007号
[11] Cesa‐Bianchi,N.和Lugosi,G.(2006)《预测、学习和游戏》。剑桥:剑桥大学出版社·Zbl 1114.91001号
[12] Clarke,B.(1997)在线预测建议。技术报告。多特蒙德大学。
[13] Clarke,B.S.和Barron,A.R.(1990)贝叶斯方法的信息论渐近性。IEEE传输。通知。西奥。, 36, 453– 471. ·Zbl 0709.62008
[14] Clarke,B.和Barron,A.(1994)Jeffreys的先验在熵风险下是渐近最不利的。J.统计。计划信息。, 41, 37– 60. ·Zbl 0820.62006号
[15] Dawid,A.P.(1984)《统计理论:优先方法》。J.R.统计学家。Soc公司。A、 147278–292·Zbl 0557.62080号
[16] Dawid,A.P.(1992年),序贯分析,随机复杂性和贝叶斯推断。贝叶斯统计学(编辑J.M.Bernardo、J.O.Berger、A.P.Dawid和A.F.A.Smith),第109-125页。牛津:克拉伦登。
[17] Dawid,A.(1992年b)前期数据分析。《统计推断的当前问题:纪念D.Basu的论文》(编辑M.Gosh和P.Pathak),第113-125页。海沃德:数理统计研究所·兹比尔0850.62091
[18] De Luna,X.和Skouras,K.(2003)选择模型选择策略。扫描。J.统计。, 30, 113– 128. ·Zbl 1034.62032号
[19] Diaconis,P.和Freedman,D.(1986)关于贝叶斯估计的一致性。安。统计师。, 14, 1– 26. ·Zbl 0595.62022号
[20] Donoho,D.和Johnstone,I.(1994)小波收缩的理想空间自适应。生物特征,81425-455·Zbl 0815.62019号
[21] van Erven,T.(2010)《当数据压缩和统计不一致时:最小描述长度原则的两个频率学家挑战》。博士论文。莱顿大学。
[22] van Erven,T.、Grünwald,P.D.和de Rooij,S.(2008)通过更早的切换来更快地赶上:AIC‐BIC困境的优先解决方案。预打印arXiv:0807.1005。阿姆斯特丹Wiskunde en Informatica中心
[23] Forster,M.(2001)《简单的新科学》。《简单、推理和建模》(编辑A.Zellner、H.Keuzenkamp和M.McAleer),第83–117页。剑桥:剑桥大学出版社。
[24] Forster,D.和George,E.(1994)多元回归的风险通货膨胀标准。安。统计师。, 22, 1947– 1975. ·Zbl 0829.62066号
[25] Ghosal,S.、Lember,J.和van der Vaart,A.(2008)非参数贝叶斯模型选择和平均。电子。J.统计。, 2, 63– 89. ·Zbl 1135.62028号
[26] Grüwald,P.D.(2007)最小描述长度原则。剑桥:麻省理工学院出版社。
[27] Hansen,M.和Yu,B.(2001)模型选择和最小描述长度原则。《美国统计杂志》。助理。, 96, 746– 774. ·Zbl 1017.62004号
[28] Hansen,M.和Yu,B.(2002)广义线性模型的最小描述长度模型选择标准。《科学与统计:特里·斯皮德的节日》。海沃德:数理统计研究所。
[29] Haussler,D.和Opper,M.(1997)相互信息、度量熵和累积相对熵风险。安。统计师。, 25, 2451– 2492. ·Zbl 0920.62007号
[30] Herbster,M.和Warmuth,M.K.(1998)追踪最佳专家。机器。学习。, 32, 151– 178. ·Zbl 0912.68165号
[31] Kass,R.E.和Raftery,A.E.(1995)贝叶斯因子。《美国统计杂志》。助理。, 90, 773– 795. ·Zbl 0846.62028号
[32] Kontkanen,P.、Myllymäki,P.,Silander,T.、Tirri,H.和Grünwald,P.D.(2000)《预测分布和贝叶斯网络》。J.统计。计算。, 10, 39– 54.
[33] Koolen,W.和de Rooij,S.(2008a)有效地结合专家建议。程序。21世纪A.Conf.计算学习理论.
[34] Koolen,W.和de Rooij,S.(2008b)有效结合专家建议。预印arXiv abs/0802.2015.
[35] Li,K.(1987)交叉验证和广义交叉验证的渐近最优性:离散指标集。安。统计师。, 15, 958– 975. ·Zbl 0653.62037号
[36] Poland,J.和Hutter,M.(2005)在线预测离散MDL的渐近性。IEEE传输。通知。西奥。, 51, 3780– 3795. ·Zbl 1318.68101号
[37] Rissanen,J.(1984)通用编码、信息、预测和估计。IEEE传输。通知。西奥。, 30, 629– 636. ·Zbl 0574.62003号
[38] Rissanen,J.Speed,T.P.和Yu,B.(1992)《随机复杂性密度估计》。IEEE传输。通知。西奥。, 38, 315– 323. ·Zbl 0743.62004号
[39] Schwarz,G.(1978)估算模型的维数。安。统计师。, 6, 461– 464. ·Zbl 0379.62005年
[40] Shibata,R.(1983)回归变量选择的渐近平均效率。Ann.Inst.Statist公司。数学。, 35, 415– 423. ·Zbl 0563.62043号
[41] Shiryaev,A.N.(1996)《概率》。柏林:斯普林格·Zbl 0909.01009
[42] Sober,E.(2004)节俭与可能性之间的较量。系统。生物。, 4, 644– 653.
[43] Speed,T.和Yu,B.(1993)模型选择和预测:正态回归。Ann.Inst.Statist公司。数学。, 45, 35– 54. ·Zbl 0774.62093号
[44] Stone,M.(1977)通过交叉验证和Akaike准则选择模型的渐近等价性。J.R.统计。Soc公司。B、 39、44–47岁·Zbl 0355.6202号
[45] Tibshirani,R.(1996)通过套索进行回归收缩和选择。J.R.统计。Soc公司。B、 58267-288之间·Zbl 0850.62538号
[46] Volf,P.和Willems,F.(1998)在两种通用信源编码算法之间切换。程序。数据压缩Con.,雪鸟第491-500页。
[47] Vovk,V.(1999)随机预测策略去随机化。机器。学习。, 35, 247– 282. ·Zbl 0941.68128号
[48] Wong,H.和Clarke,B.(2004)存在模型不确定性时小样本贝叶斯预测的改进。可以。J.统计。, 32, 269– 283. ·Zbl 1061.62041号
[49] Yang,Y.(1999)非参数回归的模型选择。统计师。罪。, 9, 475– 499. ·Zbl 0921.62051号
[50] Yang,Y.(2000)密度估计的混合策略。安。统计师。, 28, 75– 87. ·Zbl 1106.62322号
[51] Yang,Y.(2005)AIC和BIC的优势可以共享吗?生物特征,92937–950·Zbl 1151.62301号
[52] Yang,Y.(2007a)比较回归程序的交叉验证一致性。安。统计师。, 35, 2450– 2473. ·Zbl 1129.62039号
[53] Yang,Y.(2007b)简单线性模型预测估计:真的那么简单吗?经济计量学。西奥。, 23, 1– 36. ·Zbl 1441.62907号
[54] Yang,Y.和Barron,A.(1999)极小极大收敛率的信息论确定。安。统计师。, 27, 1564– 1599. ·Zbl 0978.62008号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。