帕斯卡·马萨特 模型选择:从理论到实践。(模式选择:民族传统。) (法语。英文摘要) Zbl 1455.62030号 J.Soc.Fr.Stat.&Rev.Stat.申请。 149,第4期,5-27(2008). 小结:自从H.赤介70年代初[见:《第二届信息理论国际研讨会论文集》,Tsahkaporpho 1971年。布达佩斯:Akadémiai Kiadó267–281(1973;Zbl 0283.62006号)]优化惩罚对数似然等惩罚经验准则,已成为从数据中选择合适统计模型问题的经典解决方案。对于许多模型选择问题,例如多变化点检测和变量选择,希望给定维度的维度或模型数量随样本大小增长。因此,在过去十年中,为了考虑到这类情况,出现了一种模型选择的非渐近理论。从实践和理论的角度来看,主要问题是理解如何惩罚对数似然等经验标准,以获得一些最佳选择程序。渐近理论为惩罚的形状提供了一些有用的指示,但它通常让用户选择数值常数。这些常数的最佳值通常未知。在某些情况下,理论确实不够敏锐,无法产生明确的价值观。在其他一些情况下,问题更多的是统计性质的,因为根据理论,最佳值应该取决于观测值的未知分布。我们的目的是推广一些数据驱动的方法来校准惩罚。该方法部分基于我们将回忆的初步理论结果,部分基于我们打算解释的一些启发式。 引用于1文件 MSC公司: 62A01型 统计学基础和哲学主题 关键词:变化点检测;集中不等式;经验过程;型号选择;惩罚;变量选择;数据驱动方法;校准;处罚 引文:兹bl 0283.62006年 PDF格式BibTeX公司 XML格式引用 \textit{P.Massart},J.Soc.Fr.Stat.&Rev.Stat.Appl.(《联邦公报》)。149,第4号,第5--27号(2008;Zbl 1455.62030) 全文: 链接 参考文献: [1] AKAIKE,H.(1973)。信息论和最大似然原理的推广。编者P.N.Petrov和F.Csaki,《第二届信息理论国际研讨会论文集》。第267-281页。布达佩斯Akademia Kiado·兹bl 0283.62006年 [2] ARLOT,S.(2007)。通过重采样惩罚进行模型选择。arXiv:math/0701542v2·Zbl 1326.62097号 [3] ARLOT,S.(2008)。V-fold交叉验证改进:V-fold惩罚。arXiv:0802.0566v2 [4] ARLOT,S.和MASSART,P.(2008)。数据驱动的最小二乘回归惩罚校准。arXiv:0802.0837v2。 [5] BARAUD,Y.(2000年)。固定设计回归的模型选择。概率论及相关领域117,no 4 467-493·Zbl 0997.62027号 [6] BAHADUR,R.R.(1958年)。最大似然估计不一致的示例。Sankhya Ser.公司。A 2207-210·Zbl 0087.34202号 [7] BARAUD,Y.、COMTE,F.和VIENNET,G.(2001年)。具有相关数据的(自动)回归模型选择。ESAIM:概率与统计5,33-49。http://www.emath.fr/ps/。 ·Zbl 0990.62035号 [8] BARRON,A.R.,BIRG E.,L.,MASSART,P.(1999)。通过惩罚选择模型的风险边界。普罗巴伯。相关字段。113, 301-415 . ·Zbl 0946.62036号 [9] BIRGé,L.和MASSART,P.(1993)。最小对比度估计的收敛速度。普罗巴伯。Th.相关。字段97、113-150·Zbl 0805.62037号 [10] BIRGé,L.和MASSART,P.(1997)。从模型选择到自适应估计。Lucien Lecam:概率与统计研究论文集(D.Pollard、E.Torgersen和G.Yang,eds.),55-87,纽约斯普林格-弗拉格出版社·Zbl 0920.62042号 [11] BIRGé,L.和MASSART,P.(2001)。高斯模型选择。《欧洲数学学会杂志》,第3期,203-268·Zbl 1037.62001 [12] BIRGé,L.,MASSART,P.(2007)。高斯模型选择的最小惩罚。普罗巴伯。Th.Rel.字段138,编号1-2,33-73·Zbl 1112.62082号 [13] BOUCHERON,S.、BOUSQUET,O.、LUGOSI,G.、MASSART,P.(2005)。独立随机变量函数的矩不等式。《概率年鉴》33,第2期,514-560·Zbl 1074.60018号 [14] BOUCHERON,S.和MASSART,P.(分离)。穷人的威尔克斯现象·Zbl 1230.62072号 [15] BOUSQUET,O.(2002)。贝内特浓度不等式及其在经验过程上的应用。C.R.数学。阿卡德。科学。巴黎334号,邮编:6495-500·Zbl 1001.60021号 [16] CASTELLAN,G.(2003)。通过指数模型选择进行密度估计。IEEE传输。通知。理论49,第8期,2052-2060·Zbl 1288.62054号 [17] DANIEL,C.和WOOD,F.S.(1971)。将方程式拟合到数据。纽约威利·Zbl 0264.65011号 [18] DONOHO,D.L.和JOHNSTONE,I.M.(1994年)。通过小波收缩实现理想的空间自适应。生物特征81,425-455·Zbl 0815.62019号 [19] EFRON,B.、HASTIE,T.、JOHNSTONE,I.和TIBSHIRANI,R.(2004)。最小角度回归。安。统计师。32号2,407-499·Zbl 1091.62054号 [20] LEBARBIER,E.(2005)。通过模型选择检测高斯过程均值中的多个变化点。信号处理85,编号4717-736·Zbl 1148.94403号 [21] LEDOUX,M.(1996)。关于产品测度的Talagrand偏差不等式。ESAIM:概率与统计1,63-87。http://www.emath.fr/ps/·Zbl 0869.60013号 [22] LE PENNEC,E.和MALLAT,S.(2005年)。稀疏几何图像的带状表示。IEEE传输。《图像处理》第14期,第4期,第423-438页。 [23] LOUBES,J.M.,MASSART,P.(2004)。关于最小角回归的讨论。《统计年鉴》第32卷第2期,第476-482页。 [24] MALLAT,S.(1999)。信号处理的小波之旅。学术出版社·Zbl 0998.94510号 [25] 马洛斯,C.L.(1973)。关于\(C_p\)的一些注释。技术计量学15,661-675·兹比尔0269.62061 [26] 马萨特,P.(2000)。关于Talagrand的经验过程浓度不等式中的常数。《概率年鉴》28,编号2863-884·Zbl 1140.60310号 [27] MASSART,P.(2007)。集中度不等式和模型选择。《概率论和统计学讲座》,《St-Flour XXXII-2003概率》(J.Picard主编)。柏林施普林格1896号数学课堂讲稿·兹比尔1170.60006 [28] REYNAUD-BOURET,P.(2003)。通过浓度不等式自适应估计非均匀泊松过程的强度。普罗巴伯。理论关联。字段126,编号1,103-153·Zbl 1019.62079号 [29] 施瓦茨(1978)。估算模型的维度。统计年鉴6,461-464·Zbl 0379.62005年 [30] TALAGRAND,M.(1996年)。乘积空间中的新的集中不等式。发明。数学。126, 505-563. ·Zbl 0893.60001号 [31] VAPNIK,V.N.(1982)。基于经验数据的相关性估计。纽约州施普林格·Zbl 0499.62005号 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。