×

极端分位数回归的梯度增强。 (英语) Zbl 07784960号

摘要:极端分位数回归提供了数据范围之外的条件分位数估计。经典分位数回归在这种情况下表现不佳,因为尾部区域的数据太少。极值理论用于超出观测值范围的外推和条件极值分位数的估计。基于峰值-阈值方法,将高阈值以上的条件分布近似为具有协变量相关参数的广义Pareto分布。我们提出了一种梯度推进方法,通过最小化偏差来估计条件广义Pareto分布。交叉验证用于选择调整参数,如树的数量和树的深度。我们讨论了诊断图,如变量重要性图和部分相关图,这些图有助于解释拟合模型。在仿真研究中,我们表明我们的梯度增强方法优于分位数回归和极值理论中的经典方法,特别是对于高维预测空间和复杂参数响应面。提出了一种应用于荷兰降水数据天气预报的统计后处理的方法。

MSC公司:

60克70 极值理论;极值随机过程
62G08号 非参数回归和分位数回归
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Athey,S。;Tibshirani,J。;Wager,S.,广义随机森林,《统计年鉴》,47,2,1148-1178(2019)·Zbl 1418.62102号 ·doi:10.1214/18-AOS1709
[2] 巴克马,AA;de Haan,L.,《大年龄剩余寿命》,《概率年鉴》,2,5,792-804(1974)·Zbl 0295.60014号 ·doi:10.1214/aop/1176996548
[3] Biau,G.,Cadre,B.:通过梯度提升进行优化。编辑A.Daouia和A.Ruiz-Gazen,《当代统计和计量经济学进展:纪念克里斯汀·托马斯·阿格南的节日》,第23-44页。施普林格国际出版公司(2021)·Zbl 07645393号
[4] Breiman,L.,《随机森林》。机器学习,45,1,5-32(2001)·Zbl 1007.68152号 ·doi:10.1023/A:1010933404324
[5] Breiman,L.、Friedman,J.、Stone,C.J.、Olsen,R.A.:分类和回归树。泰勒和弗朗西斯(1984)·Zbl 0541.62042号
[6] Chavez-Demoulin,V.,Davison,A.:样本极值的广义加性建模。J.R.统计社会服务。C.54(2005年)·Zbl 1490.62194号
[7] Chernozhukov,V.,极值分位数回归,《统计年鉴》。,33, 2, 806-839 (2005) ·Zbl 1068.62063号 ·doi:10.1214/09053604000001165
[8] 达乌亚,A。;Gardes,L。;Girard,S.,《关于极值分位数回归的核平滑》,Bernoulli,19,5,2557-2589(2013)·Zbl 1281.62097号 ·doi:10.3150/12-BEJ466
[9] Davison,A.、Smith,R.:高阈值超标模型。J.R.Stat.Soc.Ser C.52(1990年)·Zbl 0706.62039号
[10] Drees,H。;简ßen,A。;Resnick,S。;Wang,T.,关于尾部分析中阈值选择的最小距离程序,SIAM数据科学数学杂志,2,1,75-102(2020)·Zbl 1484.62057号 ·doi:10.1137/19M1260463
[11] Dupuis,DJ,《超越高阈值:阈值选择指南》,《极限》,1,3,251-261(1999)·Zbl 0921.62030号 ·doi:10.1023/A:1009914915709
[12] Farkas,S.、Lopez,O.、Thomas,M.:使用广义帕累托回归树进行网络索赔分析,并将其应用于保险业。保险数学。经济。98:92-105 (2021) ·兹比尔1466.91255
[13] Friedman,J.H.:贪婪函数近似:梯度提升机。Ann.Stat.第1189-1232页(2001年)·Zbl 1043.62034号
[14] Friedman,JH,随机梯度增强,计算。统计数据分析。,38, 4, 367-378 (2002) ·Zbl 1072.65502号 ·doi:10.1016/S0167-9473(01)00065-2
[15] Gardes,L.,极值分位数估计的尾维数缩减,极值,21,1,57-95(2018)·Zbl 1396.62097号 ·数字对象标识代码:10.1007/s10687-017-0300-x
[16] Gardes,L。;Stupfler,G.,条件极值分位数的集成函数Weissman估计,REVSTAT,17,1,109-144(2019)·Zbl 1428.62129号
[17] Gnecco,N.、Terefe,E.M.、Engelke,S.:极端随机森林(2022)。https://arxiv.org/abs/2201.12865
[18] Pasche,O.C.,Engelke,S.:极端分位数回归神经网络及其在洪水风险预测中的应用(2022年)。https://arxiv.org/abs/2208.07590
[19] Richard,J.,Huser,R.:基于神经网络的极端分位数回归的统一部分可解释框架(2022)。https://arxiv.org/abs/2208.07581
[20] 德哈恩,L。;费雷拉,A.,《极值理论:导论》(2006),纽约:施普林格出版社,纽约·Zbl 1101.62002号 ·数字对象标识代码:10.1007/0-387-34471-3
[21] Hastie,T.、Tibshirani,R.、Friedman,J.H.:统计学习的要素。统计学中的斯普林格系列。施普林格,纽约,第二版(2009年)。数据挖掘、推理和预测·Zbl 1273.62005年
[22] Koenker,R.,Bassett Jr G.:回归分位数。《计量经济学:计量经济学社会杂志》第33-50页(1978年)·Zbl 0373.62038号
[23] Mai,V.,Johansson,M.:随机梯度剪裁的稳定性和收敛性:超越Lipschitz连续性和光滑性。第38届机器学习国际会议论文集139(7月):7325-7335(2021)
[24] Meinshausen,N.:分位数回归森林。J.马赫。学习。第7号决议(6月):983-999(2006年)·Zbl 1222.68262号
[25] Niederreiter,H.:随机数生成和准蒙特卡罗方法,CBMS-NSF应用数学区域会议系列第63卷。工业和应用数学学会(SIAM),宾夕法尼亚州费城(1992)·Zbl 0761.65002号
[26] Pickands III,J.:使用极值顺序统计的统计推断。安。统计师。3(1):119-131, 01 (1975) ·Zbl 0312.62038号
[27] Qian,J.,Wu,Y.,Zhuang,B.,Wang,S.,Xiao,J.:理解增量梯度方法中的梯度裁剪。第38届机器学习国际会议论文集130(4月):1504-1512(2021)
[28] 里奇韦,G.:《广义增压模型:gbm包指南》(2007年)。https://cran.r-project.org/web/packages/gbm/vignettes/gbm.pdf
[29] 史密斯,RL,《概率分布尾部估计》,《Ann.Stat.》,第15期,第1174-1207页(1987年)·Zbl 0642.62022号 ·doi:10.1214/aos/1176350499
[30] Velthoen,J。;蔡,JJ;Jongbloed,G。;Schmeits,M.,使用极值分位数回归改进降水预测,极值,22,4,599-622(2019)·Zbl 1434.62058号 ·doi:10.1007/s10687-019-00355-1
[31] Wager,S。;Athey,S.,《使用随机森林评估和推断异质处理效应》,美国统计协会,113,523,1228-1242(2018)·Zbl 1402.62056号 ·doi:10.1080/016214592017.1319839
[32] Wang,H。;Tsai,CL,Tail指数回归,J.Am.Stat.Assoc.,104,487,1233-1240(2009)·Zbl 1388.62145号 ·doi:10.1198/jasa.2009.tm08458
[33] Youngman,BD,《应用于美国阵风回归水平估计的高阈值超标广义加性模型》,美国统计协会,114,528,1865-1879(2019)·Zbl 1428.62202号 ·doi:10.1080/01621459.2018.1529596
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。