×

含有未知链接函数的广义可加模型,包括变量选择。 (英语) Zbl 1516.62630号

摘要:广义加性模型是一个建立良好且强大的工具,可以对预测因子对响应的平滑影响进行建模。然而,如果通常被选为标准链接的链接函数指定错误,估计值可能会有偏差。提出了一种同时估计链接函数形式和未知形式预测函数的方法,包括选择预测因子。该程序基于boosting方法,该方法通过使用一系列弱学习者获得估计值。如果真正的链接功能偏离了固定功能,则它在无法修改给定链接功能的拟合过程中占据主导地位。仿真研究显示了该程序的性能,并通过实际例子进行了说明。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] M.Avalos、Y.Grandvalet和C.Ambroise,简约可加模型,计算。统计师。数据分析。51(2007),第2851-2870页。doi:10.1016/j.csda.2006.10.007·Zbl 1161.62354号 ·doi:10.1016/j.csda.2006.10.007
[2] P.Bühlmann和T.Hothorn,推进算法:正则化、预测和模型拟合(讨论),统计。科学。22(2007),第477-505页。doi:10.1214/07-STS242·Zbl 1246.62163号 ·doi:10.1214/07-STS242
[3] P.Bühlmann和B.Yu,L2损失推动:回归和分类,J.Amer。统计师。《协会》98(2003),第324-339页。doi:10.1198/0162145003000125·Zbl 1041.62029号
[4] G.M.S.Conceicao、S.G.E.K.Miraglia、H.S.Kishi、P.H.N.Saldiva和J.M.Singer,空气污染与儿童死亡率:巴西圣保罗的一项时间序列研究,环境。健康展望。109(2001),第347-350页·doi:10.2307/3434781
[5] X.Cui、W.K.Härdle和L.Zhu,广义单指数模型:efm方法《讨论文件50》,SFB 649,柏林洪堡大学,经济风险,2009年·兹比尔1221.62062
[6] C.Czado和T.J.Santner,链接错误指定对二元回归推理的影响,J.Statist。计划。推论33(1992),第213-231页。doi:10.1016/0378-3758(92)90069-5·Zbl 0781.62037号 ·doi:10.1016/0378-3758(92)90069-5
[7] C.德布尔,花键实用指南1978年,纽约斯普林格·弗拉格出版社·Zbl 0406.41003号 ·doi:10.1007/978-1-4612-6333-3
[8] P.Dierckx,用样条曲线和曲面拟合,牛津科学出版社,牛津,1993年·Zbl 0782.41016号
[9] P.H.C.Eilers和B.D.Marx,使用B样条和惩罚进行灵活平滑,统计。科学。11(1996),第89-121页。doi:10.1214/ss/1038425655·Zbl 0955.62562号 ·doi:10.1214/ss/1038425655
[10] A.Genz、F.Bretz、T.Miwa、X.Mi、F.Leisch、F.Scheipl和T.Hothorn,mvtnorm:多元正态分布和t分布, 2011. 可在http://CRAN.R-project.org/package=mvtnorm,r包版本0.9-999。
[11] J.戈曼,cox比例风险模型中的L1惩罚估计,生物。J.52(2010),第70-84页·Zbl 1207.62185号
[12] W.Härdle、P.Hall和H.Ichimura,单指标模型中的最优平滑Ann.统计师。21(1993),第157-178页。doi:10.1214操作系统/1176349020·兹比尔0770.62049 ·doi:10.1214/aos/1176349020
[13] T.Hastie和R.Tibshirani,广义可加模型查普曼和霍尔出版社,伦敦,1990年·Zbl 0747.62061号
[14] B.Hofner、T.Hothorn、T.Kneib和M.Schmid,基于boosting的无偏模型选择框架,J.计算。图表。统计师。20(2011),第956-971页(即将出版)。doi:10.1198/jcgs.2011.09220
[15] T.Hothorn、P.Buhlmann、T.Kneib、M.Schmid和B.Hofner,mbost:基于模型的增强, 2009. 可在http://CRAN.R-project.org,R软件包版本2.0-0·Zbl 1242.68002号
[16] T.Hothorn、P.Buhlmann、T.Kneib、M.Schmid和B.Hofner,基于模型的增压2.0,J.马赫。学习。第11号决议(2010年),第2109-2113页·Zbl 1242.68002号
[17] E.Kong和Y.Xia,单指标模型的变量选择《生物特征》94(2007),第217-229页。doi:10.1093/biomet/asm008·Zbl 1142.62353号 ·doi:10.1093/biomet/asm008
[18] F.Leitenstorfer和G.Tutz,基于b样条的广义单调回归及其在大气污染数据中的应用《生物统计学》第8卷(2007年),第654-673页。doi:10.1093/biostatistics/kxl036·Zbl 1118.62125号 ·doi:10.1093/biostatistics/kxl036
[19] G.Marra和S.N.Wood,广义可加模型的实用变量选择,计算。统计师。数据分析。55(2011),第2372-2387页。doi:10.1016/j.csda.2011.02.004·Zbl 1328.62475号 ·doi:10.1016/j.csda.2011.02.004
[20] V.M.R.Muggeo和G.Ferrara,用未指定连接函数拟合广义线性模型:p样条方法,计算。统计师。数据分析。52(2008),第2529-2537页。doi:10.1016/j.csda.2007.08.011·Zbl 1452.62541号 ·doi:10.1016/j.csda.2007.08.011
[21] P.A.Naik和C.-L.Tsai,单index模型选择《生物特征88》(2001),第821-832页。doi:10.1093/biomet/88.3.821·Zbl 0988.62042号 ·doi:10.1093/biomet/88.3.821
[22] M.Y.Park和T.Hastie,广义线性模型的L1正则化路径算法,J.R.Stat.Soc.Ser.,《美国国家统计年鉴》。B统计方法。69(2007),第659-677页。文件编号:10.1111/j.1467-9868.2007.00607.x·Zbl 07555370号 ·文件编号:10.1111/j.1467-9868.2007.00607.x
[23] K.W.Penrose、A.G.Nelson和A.G.Fisher,使用简单测量技术的男性广义身体成分预测方程,医学科学。体育锻炼。17(1985),第189页。doi:10.1249/00005768-198504000-00037·doi:10.1249/00005768-198504000-00037
[24] J.O.Ramsay和B.W.Silverman,功能数据分析2005年,纽约施普林格·Zbl 1079.62006号 ·doi:10.1007/b98888
[25] J.O.Ramsay、H.Wickham、S.Graves和G.Hooker,fda:功能数据分析,2010年。可在http://www.functionaldata.org网站,R包版本2.2.5。
[26] A.Ruckstuhl和A.Welsh,非参数估计链接函数的参考带,J.计算。图表。统计师。8(1999),第699-714页。
[27] M.Schmid和T.Hothorn,使用组件式p样条函数增强可加模型,计算。统计与数据分析。53(2008),第298-311页。doi:10.1016/j.csda.2008.09.009·兹比尔1231.62071 ·doi:10.1016/j.csda.2008.09.009
[28] R.E.夏皮雷,弱可学性的力量,马赫。学习。5(1990年),第197-227页。
[29] W.B.Siri,身体的总成分,高级生物学。医学物理。4(1956年),第239-280页。doi:10.1016/B978-1-4832-3110-5.50011-X·doi:10.1016/B978-1-4832-3110-5.50011-X
[30] R.Tibshirani,通过套索回归收缩和选择《J.R.Stat.Soc.B 58》(1996年),第267-288页·Zbl 0850.62538号
[31] B.A.Turlach,quadprog:解决二次编程问题的函数, 2009. 可在http://CRAN.R-project.org,R包版本1.4-11,S原件,作者:Berwin A.Turlach,R portby Andreas Weingessel。
[32] G.Tutz和H.Binder,基于似然boosting的隐式变量选择广义可加建模《生物统计学》第62卷(2006年),第961-971页。doi:10.1111/j.1541-0420.2006.00578.x·Zbl 1116.62075号 ·doi:10.1111/j.1541-0420.2006.00578.x
[33] G.Tutz和S.Petry,包含变量选择的链接函数的非参数估计,统计计算。21(2012),第545-561页。doi:10.1007/s11222-011-9246-z·Zbl 1322.62003年 ·doi:10.1007/s11222-011-9246-z
[34] S.Weisberg和A.H.Welsh,适应缺失的链接Ann.统计师。22(1994),第1674-1700页。doi:10.1214/aos/1176325749·Zbl 0828.62059号 ·doi:10.1214操作系统/1176325749
[35] S.N.伍德,广义可加模型:R引言查普曼和霍尔/CRC,伦敦,2006年·Zbl 1087.62082号 ·doi:10.1201/9781420010404
[36] S.N.伍德,mgcv:具有GCV/AIC/REML平滑度估计的GAM和通过PQL的GAMM, 2011. 可在http://CRAN.R-project.org,R包版本1.7-2。
[37] Y.Yu和D.Ruppert,部分线性单指标模型的惩罚样条估计,J.Amer。统计师。协会97(2002),第1042-1054页。doi:10.1198/016214502388618861·Zbl 1045.62035号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。