×

模型选择:从理论到实践。(模式选择:民族传统。) (法语。英文摘要) Zbl 1455.62030号

小结:自从H.赤介70年代初[见:《第二届信息理论国际研讨会论文集》,Tsahkaporpho 1971年。布达佩斯:Akadémiai Kiadó267–281(1973;Zbl 0283.62006号)]优化惩罚对数似然等惩罚经验准则,已成为从数据中选择合适统计模型问题的经典解决方案。对于许多模型选择问题,例如多变化点检测和变量选择,希望给定维度的维度或模型数量随样本大小增长。因此,在过去十年中,为了考虑到这类情况,出现了一种模型选择的非渐近理论。从实践和理论的角度来看,主要问题是理解如何惩罚对数似然等经验标准,以获得一些最佳选择程序。渐近理论为惩罚的形状提供了一些有用的指示,但它通常让用户选择数值常数。这些常数的最佳值通常未知。在某些情况下,理论确实不够敏锐,无法产生明确的价值观。在其他一些情况下,问题更多的是统计性质的,因为根据理论,最佳值应该取决于观测值的未知分布。我们的目的是推广一些数据驱动的方法来校准惩罚。该方法部分基于我们将回忆的初步理论结果,部分基于我们打算解释的一些启发式。

MSC公司:

62A01型 统计学基础和哲学主题
PDF格式BibTeX公司 XML格式引用
全文: 链接

参考文献:

[1] AKAIKE,H.(1973)。信息论和最大似然原理的推广。编者P.N.Petrov和F.Csaki,《第二届信息理论国际研讨会论文集》。第267-281页。布达佩斯Akademia Kiado·兹bl 0283.62006年
[2] ARLOT,S.(2007)。通过重采样惩罚进行模型选择。arXiv:math/0701542v2·Zbl 1326.62097号
[3] ARLOT,S.(2008)。V-fold交叉验证改进:V-fold惩罚。arXiv:0802.0566v2
[4] ARLOT,S.和MASSART,P.(2008)。数据驱动的最小二乘回归惩罚校准。arXiv:0802.0837v2。
[5] BARAUD,Y.(2000年)。固定设计回归的模型选择。概率论及相关领域117,no 4 467-493·Zbl 0997.62027号
[6] BAHADUR,R.R.(1958年)。最大似然估计不一致的示例。Sankhya Ser.公司。A 2207-210·Zbl 0087.34202号
[7] BARAUD,Y.、COMTE,F.和VIENNET,G.(2001年)。具有相关数据的(自动)回归模型选择。ESAIM:概率与统计5,33-49。http://www.emath.fr/ps/。 ·Zbl 0990.62035号
[8] BARRON,A.R.,BIRG E.,L.,MASSART,P.(1999)。通过惩罚选择模型的风险边界。普罗巴伯。相关字段。113, 301-415 . ·Zbl 0946.62036号
[9] BIRGé,L.和MASSART,P.(1993)。最小对比度估计的收敛速度。普罗巴伯。Th.相关。字段97、113-150·Zbl 0805.62037号
[10] BIRGé,L.和MASSART,P.(1997)。从模型选择到自适应估计。Lucien Lecam:概率与统计研究论文集(D.Pollard、E.Torgersen和G.Yang,eds.),55-87,纽约斯普林格-弗拉格出版社·Zbl 0920.62042号
[11] BIRGé,L.和MASSART,P.(2001)。高斯模型选择。《欧洲数学学会杂志》,第3期,203-268·Zbl 1037.62001
[12] BIRGé,L.,MASSART,P.(2007)。高斯模型选择的最小惩罚。普罗巴伯。Th.Rel.字段138,编号1-2,33-73·Zbl 1112.62082号
[13] BOUCHERON,S.、BOUSQUET,O.、LUGOSI,G.、MASSART,P.(2005)。独立随机变量函数的矩不等式。《概率年鉴》33,第2期,514-560·Zbl 1074.60018号
[14] BOUCHERON,S.和MASSART,P.(分离)。穷人的威尔克斯现象·Zbl 1230.62072号
[15] BOUSQUET,O.(2002)。贝内特浓度不等式及其在经验过程上的应用。C.R.数学。阿卡德。科学。巴黎334号,邮编:6495-500·Zbl 1001.60021号
[16] CASTELLAN,G.(2003)。通过指数模型选择进行密度估计。IEEE传输。通知。理论49,第8期,2052-2060·Zbl 1288.62054号
[17] DANIEL,C.和WOOD,F.S.(1971)。将方程式拟合到数据。纽约威利·Zbl 0264.65011号
[18] DONOHO,D.L.和JOHNSTONE,I.M.(1994年)。通过小波收缩实现理想的空间自适应。生物特征81,425-455·Zbl 0815.62019号
[19] EFRON,B.、HASTIE,T.、JOHNSTONE,I.和TIBSHIRANI,R.(2004)。最小角度回归。安。统计师。32号2,407-499·Zbl 1091.62054号
[20] LEBARBIER,E.(2005)。通过模型选择检测高斯过程均值中的多个变化点。信号处理85,编号4717-736·Zbl 1148.94403号
[21] LEDOUX,M.(1996)。关于产品测度的Talagrand偏差不等式。ESAIM:概率与统计1,63-87。http://www.emath.fr/ps/·Zbl 0869.60013号
[22] LE PENNEC,E.和MALLAT,S.(2005年)。稀疏几何图像的带状表示。IEEE传输。《图像处理》第14期,第4期,第423-438页。
[23] LOUBES,J.M.,MASSART,P.(2004)。关于最小角回归的讨论。《统计年鉴》第32卷第2期,第476-482页。
[24] MALLAT,S.(1999)。信号处理的小波之旅。学术出版社·Zbl 0998.94510号
[25] 马洛斯,C.L.(1973)。关于\(C_p\)的一些注释。技术计量学15,661-675·兹比尔0269.62061
[26] 马萨特,P.(2000)。关于Talagrand的经验过程浓度不等式中的常数。《概率年鉴》28,编号2863-884·Zbl 1140.60310号
[27] MASSART,P.(2007)。集中度不等式和模型选择。《概率论和统计学讲座》,《St-Flour XXXII-2003概率》(J.Picard主编)。柏林施普林格1896号数学课堂讲稿·兹比尔1170.60006
[28] REYNAUD-BOURET,P.(2003)。通过浓度不等式自适应估计非均匀泊松过程的强度。普罗巴伯。理论关联。字段126,编号1,103-153·Zbl 1019.62079号
[29] 施瓦茨(1978)。估算模型的维度。统计年鉴6,461-464·Zbl 0379.62005年
[30] TALAGRAND,M.(1996年)。乘积空间中的新的集中不等式。发明。数学。126, 505-563. ·Zbl 0893.60001号
[31] VAPNIK,V.N.(1982)。基于经验数据的相关性估计。纽约州施普林格·Zbl 0499.62005号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。