亚尼克·巴拉德;克里斯托夫·吉拉德;西尔维·休特 高斯设置中的估计器选择。 (英语。法语摘要) Zbl 1298.62113号 普罗巴伯亨利·彭卡雷(Henri Poincaré)安研究所。斯达。 50,第3期,1092-1119(2014). 小结:我们考虑了用公共未知方差(sigma^{2})的独立分量估计高斯向量(Y)的平均值(f)的问题。我们的估算程序基于估算器选择。更准确地说,我们从基于(Y)的(F)估计量的任意且可能无限的集合(mathbb{F})开始,并且在相同的数据(Y)下,目的是在欧几里德风险最小的(mathbb{F})中选择一个估计量。未对估值器进行假设,其与(Y)的相关性可能未知。当(mathbb{F})由线性估计组成时,我们建立了所选估计量的非渐近风险界,并导出了oracle-type不等式。作为特殊情况,我们的方法允许处理聚合、模型选择以及选择窗口和内核以估计回归函数或调整惩罚标准中涉及的参数的问题。除了聚合之外,在所有这些情况下,该方法都很容易实现。为了举例说明,我们进行了两项模拟研究。其中一个目的是将我们的程序与选择调整参数的交叉验证进行比较。另一个展示了如何在实践中实现我们的方法来解决变量选择问题。 引用于10文件 MSC公司: 62J05型 线性回归;混合模型 62J07型 岭回归;收缩估计器(拉索) 62G08号 非参数回归和分位数回归 关键词:估计器选择;型号选择;变量选择;线性估计量;核估计量;岭回归;套索;弹性网;随机森林;PLS1回归 软件:foba公司;PDCO公司;GeneSrF公司 PDF格式BibTeX公司 XML格式引用 \textit{Y.Baraud}等人,《安娜·亨利·彭卡雷研究所》,普罗巴布。Stat.50,No.3,1092--1119(2014;Zbl 1298.62113) 全文: DOI程序 arXiv公司 欧几里得 参考文献: [1] S.Arlot。Réchantillonage et Séselection de modèles(《圣母玛利亚圣母玛利》和《圣母玛丽亚圣母玛丽亚·圣母玛利亚·圣婴》)。巴黎十一大学博士论文,2007年。 [2] S.Arlot。通过重采样惩罚进行模型选择。电子。《J Stat.3》(2009)557-624·Zbl 1326.62097号 ·doi:10.1214/08-EJS196 [3] S.Arlot和F.Bach。2011年,用最小惩罚对线性估计量进行数据驱动校准。可从获取。0909.1884v2 [4] S.Arlot和A.Celisse。模型选择的交叉验证程序调查。统计调查。4 (2010) 40-79. ·Zbl 1190.62080号 ·doi:10.1214/09-SS054 [5] Y.巴拉德。固定设计回归的模型选择。普罗巴伯。理论相关领域117(2000)467-493·Zbl 0997.62027号 ·doi:10.1007/s004400000058 [6] Y.巴拉德。关于海林格尔型风险的估价师选择。普罗巴伯。理论相关领域151(2011)353-401·Zbl 1513.62062号 ·doi:10.1007/s00440-010-0302-y [7] Y.Baraud、C.Giraud和S.Huet。方差未知的高斯模型选择。安。统计师。37 (2009) 630-672. ·Zbl 1162.62051号 ·doi:10.1214/07-AOS573 [8] Y.Baraud、C.Giraud和S.Huet。2010年高斯环境下的估计器选择。可从获取。1007.2096v1版·Zbl 1298.62113号 ·doi:10.1214/13-AIHP539 [9] L.Birgé。通过测试进行模型选择:最大似然估计量(惩罚)的替代方案。亨利·彭加雷·普罗巴布(Henri PoincaréProbab)安·Inst。《统计》第42卷(2006年)第273-325页·Zbl 1333.62094号 ·doi:10.1016/j.anihpb.2005.04.004 [10] L.Birgé和P.Massart。高斯模型选择。《欧洲数学杂志》。Soc.(JEMS)3(2001)203-268·兹比尔1037.62001 ·doi:10.1007/s100970100031 [11] A.Boulesteix和K.Strimmer。偏最小二乘法:分析高维基因组数据的通用工具。生物信息学简介8(2006)32-44。 [12] L.布雷曼。随机森林。马赫。学习。45 (2001) 5-32. ·Zbl 1007.68152号 ·doi:10.1023/A:1010933404324 [13] F.Bunea、A.B.Tsybakov和M.H.Wegkamp。高斯回归的聚合。安。统计师。35 (2007) 1674-1697. ·兹比尔1209.62065 ·doi:10.1214/00905360000001587 [14] E.坎迪斯和T.陶。Dantzig选择器:当\(p)远大于\(n)时的统计估计。安。统计师。35 (2007) 2313-2351. ·Zbl 1139.62019号 ·doi:10.1214/00905360000001523 [15] Y.Cao和Y.Golubev。关于光滑样条函数的oracle不等式。数学。方法统计。15 (2006) 398-414. [16] O.Catoni。通用模型选择的混合方法。技术报告,法国高等师范学院,1997年·Zbl 0928.62033号 [17] O.卡托尼。统计学习理论和随机优化。2001年7月8日至25日在圣弗洛尔举行的第31届概率论暑期学校的课堂讲稿。施普林格,柏林,2004年。 [18] A.塞利斯。通过密度估计、回归和变化点检测中的交叉验证进行模型选择。巴黎第十一大学博士论文,2008年。 [19] S.S.Chen、D.L.Donoho和M.A.Saunders。通过基追踪进行原子分解。SIAM科学杂志。计算。20(1998)33-61(电子版)·Zbl 0919.94002号 ·doi:10.1137/S1064827596304010 [20] R.Díaz-Uriarte和S.Alvares de AndréS。使用随机森林对微阵列数据进行基因选择和分类。BMC生物信息学7(2006)3。 [21] B.Efron、T.Hastie、I.Johnstone和R.Tibshirani。最小角度回归。安。统计师。32 (2004) 407-499. 通过讨论,以及作者的反驳·Zbl 1091.62054号 ·doi:10.1214/009053604000000067 [22] R.Genuer、J.-M.Poggi和C.Tuleau-Malot。使用随机森林进行变量选择。模式识别信。31 (2010) 2225-2236. [23] C.吉拉德。方差未知时混合最小二乘估计。伯努利14(2008)1089-1107·Zbl 1168.62327号 ·doi:10.3150/08-BEJ135 [24] C.Giraud、S.Huet和N.Verzelen。方差未知的高维回归。统计师。科学。27 (2013) 500-518. ·Zbl 1331.62346号 ·doi:10.1214/12-STS398 [25] A.Goldenshluger公司。一种通用的估算程序。安。统计师。37 (2009) 542-568. ·Zbl 1155.62018号 ·doi:10.1214/00-AOS576 [26] A.Goldenshluger和O.Lepski。通过\(\mathbb进行结构调整{左}_{p} \)-范数预言不等式。普罗巴伯。理论相关领域143(2009)41-71·Zbl 1149.62020号 ·doi:10.1007/s00440-007-0119-5 [27] I.希腊。偏最小二乘回归。统计科学百科全书,第2版9 5957-5962。S.Kotz、N.Balakrishnan、C.Read、B.Vidakovic和N.Johnston(编辑)。威利,纽约,2006年·Zbl 0713.62062号 [28] I.希腊。偏最小二乘回归的一些理论方面。化学计量学和智能实验室系统58(2001)97-107。 [29] A.Hoerl和R.Kennard。岭回归:非正交问题的贝叶斯估计。技术计量学12(1970)55-67·Zbl 0202.17205号 ·数字对象标识代码:10.2307/1267351 [30] A.Hoerl和R.Kennard。岭回归。统计科学百科全书,第二版11 7273-7280。S.Kotz、N.Balakrishnan、C.Read、B.Vidakovic和N.Johnston(编辑)。威利,纽约,2006年·Zbl 0202.17206号 [31] J.Huang、S.Ma和C.-H.Zhang。稀疏高维回归模型的自适应拉索。统计师。Sinica 4(2008)1603-1618·Zbl 1255.62198号 [32] A.Juditsky和A.Nemirovski。非参数回归的函数聚集。安。统计师。28 (2000) 681-712. ·Zbl 1105.62338号 ·doi:10.1214/aos/1015951994 [33] O.V.Lepskiĭ。高斯白噪声中的自适应估计问题。特奥。Veroyatnost公司。i Primenen公司。35 (1990) 459-470. ·Zbl 0725.62075号 [34] O.V.Lepskiĭ。渐近极小极大自适应估计。I.上限。最佳自适应估计。特奥。Veroyatnost公司。i Primenen公司。36 (1991) 645-659. ·Zbl 0738.62045号 [35] O.V.Lepskiĭ。渐近极小极大自适应估计。二、。没有最佳自适应的方案。自适应估计。特奥。Veroyatnost公司。i Primenen公司。37 (1992) 468-481. ·Zbl 0761.62115号 [36] O.V.Lepskiĭ。白高斯噪声中的自适应估计问题。非参数估计87-106专题。高级苏联数学。12 . 阿默尔。数学。Soc.,普罗维登斯,RI,1992年·Zbl 0783.62061号 [37] G.Leung和A.R.Barron。信息理论和混合最小二乘回归。IEEE传输。通知。理论52(2006)3396-3410·Zbl 1309.94051号 ·doi:10.1109/TIT.2006.878172 [38] Y.Makovoz(马科沃兹)。随机逼近和神经网络。《近似理论杂志》85(1996)98-109·Zbl 0857.41024号 ·doi:10.1006/jath.1996.0031 [39] E.A.纳达拉亚。关于估计回归。理论概率论。申请。9 (1964) 141-142. ·Zbl 0136.40902号 [40] A.内米洛夫斯基。非参数统计主题。《概率论和统计学讲座》(Saint-Flour,1998)85-277。数学课堂笔记。1738 . 施普林格,柏林,2000年·Zbl 0998.62033号 ·doi:10.1007/BFb0106703 [41] P.Rigollet和A.B.Tsybakov。密度估计量的线性和凸聚合。数学。方法统计。16 (2007) 260-280. ·Zbl 1231.62057号 ·doi:10.3103/S1066530707030052 [42] J.Salmon和A.Dalalyan。仿射估计的最优聚合。J.马赫。学习。第19号决议(2011)635-660。 [43] C.Strobl、A.-L.Boulesteix、T.Kneib、T.Augustin和A.Zeileis。随机森林的条件变量重要性。BMC生物信息学9(2008)307。 [44] C.Strobl、A.-L.Boulesteix、A.Zeileis和T.Hothorn。随机森林变量重要性度量中的偏差:插图、来源和解决方案。BMC生物信息学8(2007)25。 [45] 特内豪斯(M.Tenenhaus)。La régression PLS公司。巴黎,《德希尼布条件》,《巴黎和普拉提》,1998年。【理论与应用】·Zbl 0923.62058号 [46] R.Tibshirani。通过拉索回归收缩和选择。J.罗伊。统计师。Soc.序列号。B 58(1996)267-288·Zbl 0850.62538号 [47] A.B.茨巴科夫。最佳聚合速率。在第16届学习理论年会(COLT)和第7届内核机器年会303-313的会议记录中。人工智能2777课堂讲稿。施普林格,柏林,2003年·Zbl 1208.62073号 [48] G.S.Watson。平滑回归分析。SankhyáSer。A 26(1964)359-372·兹伯利0137.13002 [49] M.韦坎普。非参数回归中的模型选择。安。统计师。31 (2003) 252-273. ·Zbl 1019.62037号 ·doi:10.1214/aos/1046294464 [50] 杨勇。非参数回归的模型选择。统计师。Sinica 9(1999)475-499·Zbl 0921.62051号 [51] 杨勇。结合不同的程序进行自适应回归。《多元分析杂志》。74 (2000) 135-161. ·Zbl 0964.62032号 ·文件编号:10.1006/jmva.1999.1884 [52] 杨勇。密度估计的混合策略。安。统计师。28 (2000) 75-87. ·Zbl 1106.62322号 ·doi:10.1214/aos/1016120365 [53] 杨勇。混合自适应回归。J.Amer。统计师。协会96(2001)574-588·Zbl 1018.62033号 ·doi:10.1198/016214501753168262 [54] T·张。使用有效数据维度学习核回归的边界。神经计算。17 (2005) 2077-2098. ·Zbl 1080.68044号 ·doi:10.1162/0899766054323008 [55] T·张。用于学习稀疏表示的自适应前向支持贪婪算法。技术报告,罗格斯大学,新泽西州,2008年。 [56] P.Zhao和B.Yu。关于拉索模型选择的一致性。J.马赫。学习。第7号决议(2006)2541-2563·Zbl 1222.62008年 [57] H.邹。自适应套索及其预言属性。J.Amer。统计师。协会101(2006)1418-1429·Zbl 1171.62326号 ·doi:10.1198/016214500000735 [58] H.Zou和T.Hastie。通过弹性网进行规则化和变量选择。J.R.Stat.Soc.系列。B统计方法。67 (2005) 301-320. ·兹比尔1069.62054 ·文件编号:10.1111/j.1467-9868.2005.005.x [59] H.Zou、T.Hastie和R.Tibshirani关于拉索的“自由度”。安。统计师。35 (2007) 2173-2192. ·Zbl 1126.62061号 ·doi:10.1214/09053607000000127 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。