×

具有层次结构的函数线性回归的模型选择。 (英语) Zbl 1503.62110号

总结:标量-函数回归允许标量响应依赖于函数预测;然而,当功能预测因子之间的相互作用被包括在内时,还没有做太多的工作。本文介绍了一个带交互项的多元函数线性回归模型。同时,我们对模型实施了层次结构约束,即只有当相关的主效应在模型中时,才能在模型中选择交互项。基于函数主成分分析和组平滑剪裁绝对偏差(SCAD)惩罚,我们提出了一种新的惩罚估计方法,在自动遵循层次结构的同时,选择重要的函数预测因子和交互作用。通过适当选择参数,在一定的正则性条件下,建立了所提出估计量的收敛速度和模型选择过程的一致性。最后,我们通过一些仿真研究和实际数据应用来说明我们提出的方法的有限样本性能。

MSC公司:

62升10 功能数据分析
62J05型 线性回归;混合模型
62G08号 非参数回归和分位数回归
62H25个 因子分析和主成分;对应分析
6220国集团 非参数推理的渐近性质
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Bien,J.、Taylor,J.和Tibshirani,R.(2013)。用于层次交互的套索。统计学年鉴41, 1111-1141. ·Zbl 1292.62109号 ·doi:10.1214/13-AOS1096
[2] Cai,T.和Hall,P.(2006)。函数线性回归中的预测。统计学年鉴34, 2159-2179. ·兹比尔1106.62036 ·doi:10.1214/009053600000830
[3] Cardot,H.、Ferraty,F.和Sarda,P.(1999)。功能线性模型。统计与概率信件45, 11-22. ·Zbl 0962.62081号 ·doi:10.1016/S0167-7152(99)00036-X
[4] Choi,N.H.、Li,W.和Zhu,J.(2010)。具有强遗传约束的变量选择及其预言性质。美国统计协会杂志105, 354-364. ·Zbl 1320.62171号 ·doi:10.1198/jasa.2010.tm08281
[5] Collazos,J.A.、Dias,R.和Zambom,A.Z.(2016)。函数回归模型的一致变量选择。多变量分析杂志146, 63-71. ·Zbl 1334.62056号 ·doi:10.1016/j.jmva.2015.06.007
[6] Cox,D.R.(1984)。互动。国际统计评论52, 1-31. ·Zbl 0562.62061号 ·doi:10.2307/1403235
[7] 范建清、李瑞珍(2001)。通过非冲突惩罚似然及其oracle属性进行变量选择。美国统计协会杂志96, 1348-1360. ·Zbl 1073.62547号 ·doi:10.1198/016214501753382273
[8] Ferraty,F.和Vieu,P.(2006年)。非参数函数数据分析纽约:Springer·Zbl 1119.62046号
[9] Fuchs,K.、Scheipl,F.和Greven,S.(2015)。带交互项的惩罚标度函数回归。计算统计与数据分析81, 38-51. ·Zbl 1507.62055号 ·doi:10.1016/j.csda.2014.07.001
[10] Gerthiss,J.、Maity,A.和Staicu,A.M.(2013)。广义函数线性模型中的变量选择。斯达2, 86-101. ·Zbl 07847473号 ·doi:10.1002/sta4.20
[11] Hall,P.和Hooker,G.(2016)。功能数据的截断线性模型。英国皇家统计学会杂志B辑78, 637-653. ·Zbl 1414.62181号 ·doi:10.1111/rssb.12125
[12] Hall,P.和Horowitz,J.L.(2007)。函数线性回归的方法和收敛速度。统计学年鉴35, 70-91. ·Zbl 1114.62048号 ·doi:10.1214/009053600000957
[13] Hao,N.、Feng,Y.和Zhang,H.H.(2018)。基于正则化的高维二次回归模型选择。美国统计协会杂志113, 615-625. ·Zbl 1398.62176号 ·doi:10.1080/01621459.2016.1264956
[14] Haris,A.、Witten,D.和Simon,N.(2016年)。强遗传相互作用的凸模型。计算与图形统计杂志25, 981-1004. ·doi:10.1080/10618600.2015.067217
[15] Horvath,L.和Kokoszka,P.(2012)。函数数据推理及其应用纽约:Springer·Zbl 1279.62017号 ·doi:10.1007/978-1-4614-3655-3
[16] Huang,L.、Zhao,J.、Wang,H.和Wang,S.(2016)。通过LAD损失对函数多重线性模型进行稳健收缩估计和选择。计算统计与数据分析103, 384-400. ·Zbl 1466.62103号 ·doi:10.1016/j.csda.2016.05.017
[17] Kong,E.、Tong,H.和Xia,Y.(2010)。非线性长期累积效应的统计建模。中国统计局20, 1097-1123. ·Zbl 1507.62287号
[18] Kong,Y.、Li,D.、Fan,Y.和Lv,J.(2017)。基于距离相关的高维多响应回归中的交互追踪。统计学年鉴45, 897-922. ·兹比尔1368.62140 ·doi:10.1214/16-AOS1474
[19] Lian,H.(2013)。多元函数回归的收缩率估计和选择。中国统计局23, 51-74. ·Zbl 1257.62041号
[20] Lim,M.和Hastie,T.(2015)。通过分层群套索正则化学习交互。计算与图形统计杂志24, 627-654. ·doi:10.1080/10618600.2014.938812
[21] Luo,R.和Qi,X.(2019)。函数对函数回归的交互模型和模型选择。计算与图形统计杂志28, 309-322. ·Zbl 07499055号 ·doi:10.1080/10618600.2018.1514310
[22] Matsui,H.和Konishi,K.(2011年)。通过\[{L_1}\]正则化选择函数回归模型的变量。计算统计与数据分析55, 3304-3310. ·Zbl 1271.62140号 ·doi:10.1016/j.csda.2011.06.016
[23] McCullagh,P.(1984)。广义线性模型。欧洲运筹学杂志16, 285-292. ·Zbl 0556.62041号 ·doi:10.1016/0377-2217(84)90282-0
[24] Pannu,J.和Billor,N.(2017年)。函数回归模型的鲁棒群L asso。统计模拟与计算中的通信46, 3356-3374. ·Zbl 1422.62260号 ·doi:10.1080/03610918.2015.1096375
[25] Radchenko,P.和James,G.M.(2010年)。高维自适应非线性相互作用结构的变量选择。美国统计协会杂志105, 1541-1553. ·Zbl 1388.62212号 ·doi:10.1198/jasa.2010.tm10130
[26] Ramsay,J.O.和Silverman,B.W.(2005)。功能数据分析第二版,纽约:施普林格出版社·Zbl 1079.62006号
[27] She,Y.,Wang,Z.和Jiang,H.(2018)。结构层次下的群正则估计。美国统计协会杂志113, 445-454. ·Zbl 1398.62138号 ·doi:10.1080/01621459.2016.1260470
[28] Tibshirani,R.(1996)。通过LASSO进行回归收缩和选择。英国皇家统计学会杂志B辑58, 267-288. ·Zbl 0850.62538号
[29] Usset,J.、Staicu,A.M.和Maity,A.(2016)。函数回归的交互模型。计算统计与数据分析94, 317-329. ·Zbl 1468.62201号 ·doi:10.1016/j.csda.2015.08.020
[30] Wang,H.,Li,R.和Tsai,C.(2007)。调整平滑剪裁绝对偏差方法的参数选择器。生物特征94, 553-568. ·Zbl 1135.62058号 ·doi:10.1093/biomet/asm053
[31] Wong,C.M.、Atkinson,R.W.、Anderson,H.R.、Hedley,A.J.、Ma,S.、Chau,P.Y.K.和Lam,T.H.(2002)。两个城市的故事:比较香港和伦敦空气污染对住院人数的影响。环境健康观点110, 67-77.
[32] Wong,H.、Shao,Q.和Ip,W.(2013)。用变化点模拟呼吸道疾病:香港SARS疫情的教训。计算统计与数据分析57, 589-599. ·doi:10.1016/j.csda.2012.07.029
[33] Wong,R.K.W.,Li,Y.和Zhu,Z.(2019年)。多元函数数据的部分线性函数加性模型。美国统计协会杂志114, 406-418. ·Zbl 1478.62125号 ·doi:10.1080/01621459.2017.1411268
[34] Xia,Y.和Tong,H.(2006)。空气污染对公众健康的累积影响。医学统计学25, 3548-3559. ·数字对象标识代码:10.1002/sim.2446
[35] Xia,Y.,Zhang,W.和Tong,H.(2004)。半变系数模型的有效估计。生物特征91, 661-681. ·Zbl 1108.62019号 ·doi:10.1093/biomet/91.3.661
[36] Xue,K.和Yao,F.(2021)。大规模函数线性回归中的假设检验。中国统计局31, 1101-1123. ·兹比尔1470.62108 ·doi:10.5705/ss.20
[37] Yao,F.和Muller,H.G.(2010年)。函数二次回归。生物特征97, 49-64. ·Zbl 1183.62113号 ·doi:10.1093/biomet/asp069
[38] Yuan,M.和Lin,Y.(2006)。分组变量回归中的模型选择和估计。英国皇家统计学会杂志B辑68, 49-67. ·Zbl 1141.62030号 ·doi:10.1111/j.1467-9868.2005302.x
[39] Zhang,C.H.(2010)。极小极大凹罚下的近似无偏变量选择。统计学年鉴38, 894-942. ·Zbl 1183.62120号 ·doi:10.1214/09-AOS729
[40] Zhao,P.、Rocha,G.和Yu,B.(2009年)。用于分组和分层变量选择的复合绝对惩罚系列。统计学年鉴37, 3468-3497. ·Zbl 1369.62164号 ·doi:10.1214/07-AOS584
[41] 邹华(2006)。自适应Lasso及其oracle属性。美国统计协会杂志101, 1418-1429 ·Zbl 1171.62326号 ·doi:10.1198/016214500000735
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。