×

一种统计和机器学习相结合的方法,用于极端野火频率和规模的空间预测。 (英语) Zbl 07685222号

摘要:受2021年极值分析(EVA 2021)数据挑战的启发,我们提出了一种基于统计和机器学习的方法,用于极端野火频率和规模的空间预测。此方法专门用于处理大型数据集,包括丢失的观测值。我们的方法依赖于高维零膨胀数据的四阶段、双变量、稀疏空间模型,该模型是我们使用随机偏微分方程(SPDE)开发的,允许潜在过程的稀疏精度矩阵。在第1阶段,将观测值分为零/非零类别,并使用双层分层贝叶斯稀疏空间模型进行建模,以估计这两类的概率。在第二阶段,我们首先获得正观测值在空间位置上的空间变异均值和方差分布的经验估计,并使用固定秩克里金对这些估计进行平滑处理。该近似贝叶斯推理方法用于避免使用空间变异系数进行大型空间数据建模的高计算负担。在第三阶段,我们使用稀疏的二元空间高斯过程进一步对第二阶段的标准化对数转换正观测值进行建模。第三阶段开发的野火数量的高斯分布假设在计算上是有效的,但存在错误。因此,在第4阶段,使用随机森林对预测的超越概率进行后处理。我们使用马尔可夫链蒙特卡罗(MCMC)抽样对阶段1和阶段3进行后验推断。然后,我们为人工生成的差距创建了一个交叉验证方案,并将该模型的EVA 2021预测分数与使用一些竞争对手获得的预测分数进行比较。

MSC公司:

62G32型 极值统计;尾部推理
62H11型 定向数据;空间统计学
62J05型 线性回归;混合模型
62J12型 广义线性模型(逻辑模型)
62页第12页 统计在环境和相关主题中的应用
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Abatzoglou,JT;Williams,AP,《人为气候变化对美国西部森林野火的影响》,Proc。国家。阿卡德。科学。,113, 42, 11770-11775 (2016) ·doi:10.1073/pnas.1607171113
[2] Abdelfatah,K.,Bao,J.,Terejanu,G.:使用叠加高斯过程的环境建模框架。预打印时间https://arxiv.org/abs/1612.02897 (2016)
[3] Agarwal,G.,Sun,Y.,Wang,H.J.:非高斯随机场的基于Copula的多指标kriging。小争吵。统计100524(2021)
[4] Bakka,H.、Rue,H.,Fuglstad,G.A.、Riebler,A.、Bolin,D.、Illian,J.、Krainski,E.、Simpson,D.、Lindgren,F.:R-INLA空间建模:综述。威利跨学科。版次计算。第10(6)条,e1443(2018)
[5] Banerjee,S.:使用共轭贝叶斯线性建模框架建模大规模空间数据集。Spat。Stat.37,100417(2020年)
[6] Bivand,R。;Gómez-Rubio,V。;Rue,H.,《使用R-INLA进行空间数据分析及一些扩展》,J.Stat.Softw。,63, 20, 1-31 (2015) ·doi:10.18637/jss.v063.i20
[7] Breiman,L.,《随机森林》,马赫。学习。,45,1,5-32(2001年)·Zbl 1007.68152号 ·doi:10.1023/A:1010933404324
[8] Brown,E.K.,Wang,J.,Feng,Y.:美国野火潜在危险:利用高分辨率气候数据的历史观点和未来预测。环境。Res.Lett公司。16(3), 034060 (2021)
[9] 北卡罗来纳州克雷西。;Johannesson,G.,《超大空间数据集的固定秩克里金法》,J.R.Stat.Soc.Series B Stat.Methodol。,70, 1, 209-226 (2008) ·Zbl 05563351号 ·文件编号:10.1111/j.1467-9868.2007.00633.x
[10] Cumming,S.,火灾规模分布的参数模型,加拿大。J.对于。决议,31,8,1297-1303(2001)·数字对象标识代码:10.1139/x01-032
[11] AC戴维森;Huser,R。;Thibaud,E.,相依和渐近独立极值的地质统计学,数学。地质科学。,45, 5, 511-529 (2013) ·Zbl 1321.86016号 ·doi:10.1007/s11004-013-9469-y
[12] Diggle,PJ;莫拉加,P。;罗林森,B。;Taylor,BM,《空间和时空log-Gaussian Cox过程:扩展地质统计学范式》,《统计科学》。,28, 4, 542-563 (2013) ·Zbl 1331.86027号 ·doi:10.1214/13-STS441
[13] 杜塔,S。;Bhattacharya,S.,基于确定性变换的马尔可夫链蒙特卡罗,统计方法。,16, 100-116 (2014) ·兹比尔1486.62004 ·doi:10.1016/j.stamet.2013.08.06
[14] 富斯科,EJ;Finn,JT;Balch,JK;RC Nagy;Bradley,BA,入侵草增加了美国生态区火灾的发生和频率,Proc。国家。阿卡德。科学。,116, 47, 23594-23599 (2019) ·doi:10.1073/pnas.1908253116
[15] 加布里埃尔,E。;Opitz,T。;Bonneu,F.,《探测和建模多尺度时空结构:野火发生案例》,J.Soc.Fr.Stat.,158,3,86-105(2017)·Zbl 1375.86015号
[16] 盖尔芬德,AE;班纳吉,S。;Gamerman,D.,单变量和多变量动态空间数据的空间过程建模,环境计量学,16,5,465-479(2005)·doi:10.1002/env.715
[17] 盖尔芬德,AE;Schliep,EM,《空间统计和高斯过程:美好的婚姻》,Spat。统计,18,86-104(2016)·doi:10.1016/j.spasta.2016.03.006
[18] Genton,M.G.,Butry,D.T.,Gumpertz,M.L.,Prestemon,J.P.:佛罗里达州圣约翰河水管理区野火点燃的时空分析。国际野火杂志15(1),87-97(2006)
[19] 哈兹拉,A。;Huser,R.,使用低阶半参数空间模型估算高分辨率红海表面温度热点,Ann.Appl。统计,15,2,572-596(2021)·Zbl 1478.62355号 ·doi:10.1214/20-AOAS1418
[20] Hazra,A.,Huser,R.,Bolin,D.:一种用于短期极值依赖和长期独立的稀疏高斯混合过程。预打印时间http://arxiv.org/abs/2112.10248 (2021)
[21] 哈兹拉,A.,胡塞尔,R.,约汉内松,A。高维空间极值的潜在高斯模型。预打印时间http://arxiv.org/abs/2110.02680 (2021)
[22] 哈兹拉,A。;赖希,印度人民党;Reich,DS;信原,RT;Staicu,AM,纵向图像回归的时空模型,Stat.Biosci。,11, 1, 22-46 (2019) ·doi:10.1007/s12561-017-9206-z
[23] Hazra,A.,Reich,B.J.,Shaby,B.A.,Staicu,A.M.:福斯堡火灾天气指数的整体和极值的半参数时空贝叶斯模型。预打印时间http://arxiv.org/abs/1812.11699 (2018)
[24] 赫林,AS;贝尔,CL;MG Genton,《时空野火燃点模式建模》,环境。经济。《统计》,第16、2、225-250页(2009年)·doi:10.1007/s10651-007-0080-6
[25] 拉夫肯尔森,B。;Siegert,S。;Huser,R。;Bakka,H。;Jóhannesson,a V,Max-and-soolth:潜在高斯模型中近似贝叶斯推断的两步方法,贝叶斯分析。,16, 2, 611-638 (2021) ·Zbl 1480.62056号 ·doi:10.1214/20-BA1219
[26] Huser,R。;Opitz,T。;Thibaud,E.,使用高斯尺度混合桥接空间极值中的渐近独立性和依赖性,Spat。Stat.,21,166-186(2017)·doi:10.1016/j.spasta.2017.06.004
[27] Huser,R.,Wadsworth,J.L.:空间极值统计建模进展。威利跨学科。版次计算。统计数据14,e1537(2022)
[28] Jain,P。;南卡罗来纳州库根;苏布拉曼尼亚语,SG;克劳利,M。;泰勒,S。;Flannigan,MD,《机器学习在野火科学和管理中的应用综述》,环境。修订版,28,478-505(2020)·doi:10.1139/er-2020-0019
[29] 约翰·内森,阿尔五世;Siegert,S。;Huser,R。;Bakka,H。;Hrafnkelsson,B.,用于分析时空洪水频率数据的近似贝叶斯推断,Ann.Appl。统计,16,2,905-935(2022)·Zbl 1498.62285号 ·doi:10.1214/21-AOAS1525
[30] Joseph,M.B.,Rossi,M.W.,Mietkiewicz,N.P.,Mahood,A.L.,Cattau,M.E.,St,L.A.,Denis,R.C.,Nagy,V.,Iglesias,J.T.Abatzoglou。,Balch,J.K.:利用贝叶斯有限样本最大值对野火规模极值进行时空预测。经济。申请。29(6),e01898(2019)
[31] 胡安,P。;马图,J。;Saez,M.,《精确定位野火模式中的时空相互作用》,斯托克。环境。Res.风险评估。,26, 8, 1131-1150 (2012) ·doi:10.1007/s00477-012-0568-y
[32] Katzfush,M.,《超大数据集的贝叶斯非平稳空间建模》,环境计量学,24,3,189-200(2013)·Zbl 1525.62153号 ·doi:10.1002/env.2200
[33] Koh,J.、Pimont,F.、Dupuy,J.L.、Opitz,T.:通过具有中等和极端标记的点过程进行时空野火建模。预打印时间https://arxiv.org/abs/2105.08004 (2021) ·Zbl 07656989号
[34] 林格伦,F。;H街。;Lindström,J.,《高斯场和高斯-马尔可夫随机场之间的明确联系:随机偏微分方程方法》,J.R.Stat.Soc.B系列Stat.Methodol。,73, 4, 423-498 (2011) ·Zbl 1274.62360号 ·文件编号:10.1111/j.1467-9868.2011.00777.x
[35] 波黑门泽;凯尔姆,BM;R.Masuch。;美国Himmelreich。;巴切特,P。;Petrich,W。;Hamprecht,FA,《随机森林及其基尼重要性与标准化学计量学方法在光谱数据特征选择和分类中的比较》,BMC Bioinf。,10, 1, 1-16 (2009) ·doi:10.1186/1471-2105-10-213
[36] 莫勒,J。;Díaz-Avalos,C.,结构化时空噪声考克斯点过程模型,旨在模拟森林火灾,Scand。《统计杂志》,37,1,2-25(2010)·Zbl 1224.62093号 ·doi:10.1111/j.1467-9469.2009.00670.x
[37] 莫勒,J。;Syversveen,AR;Waagepetersen,RP,Log-Gaussian Cox过程,扫描。J.Stat.,25,3,451-482(1998)·Zbl 0931.60038号 ·doi:10.1111/1467-9469.00115
[38] Nadeem,K。;泰勒,S。;伍尔福德,DG;Dean,C.,《不列颠哥伦比亚省日常人类和闪电引起的野火发生的中尺度时空预测模型》,《国际野火杂志》,29,1,11-27(2020)·doi:10.1071/WF19058
[39] Opitz,T.:编辑:美国野火活动时空预测EVA 2021数据竞争。极端(出现)。(2022)
[40] Penttinen,A。;Stoyan,D。;Henttonen,HM,森林统计中的标记点过程,森林科学。,38, 4, 806-824 (1992)
[41] Pereira,J.,Turkman,K.:植被火灾的统计模型:空间和时间模式。《环境与生态统计手册》,第401-420页。Taylor&Francis:查普曼和霍尔/CRC(2019)
[42] Pimont,F.、Fargeon,H.、Opitz,T.、Ruffault,J.、Barbero,R.、Martin-StPaul,N.、Rigolot,E.、Rivière,M.、Dupuy,J.L.:火灾概率贝叶斯框架中区域野火活动的预测。经济。申请。31(5),e02316(2021)
[43] Preisler,H。;Ager,A.,《森林火灾模型》,《环境》。附件。,3, 2181-2185 (2013)
[44] Preisler,香港;Brillinger博士;布尔根,RE;Benoit,J.,野火风险评估的概率模型,国际野火杂志,13,2,133-142(2004)·doi:10.1071/WF02061
[45] Preisler,香港;Westerling,AL,预测美国西部每月大型野火事件的统计模型,J.Appl。美托洛尔。气候。,46, 7, 1020-1030 (2007) ·doi:10.1175/JAM2513.1
[46] 派恩,S。;安德鲁·P。;Laven,R.,《荒地和农村火灾导论》(1996),新泽西州普林斯顿:普林斯顿大学出版社,新泽西普林斯顿
[47] 里奥斯·佩纳,L。;Kneib,T。;卡达索·苏亚雷斯,C。;克莱因,N。;Marey-Pérez,M.,使用零膨胀结构化加性β回归研究野火的发生和燃烧面积,环境。模型。软件,110,107-118(2018)·doi:10.1016/j.envsoft.2018.03.008
[48] Rue,H.,Held,L.:高斯马尔可夫随机场:理论与应用。泰勒和弗朗西斯:查普曼和霍尔/CRC(2005)·邮编1093.60003
[49] Saha,A.、Basu,S.、Datta,A.:空间相关数据的随机森林。《美国法律总汇汇编》第1-19卷(2021年)。doi:10.1080/01621459.2021.1950003
[50] 斯科特,AC,《第四纪前火灾史》,古地理。古气候。古生态。,164, 1-4, 281-329 (2000) ·doi:10.1016/S0031-0182(00)00192-9
[51] Serra,L.、Saez,M.、Varga,D.、Tobías,A.、Juan,P.、Mateu,J.:通过对数高斯-考克斯过程对西班牙加泰罗尼亚野火进行时空建模,1994-2008年。森林火灾建模、监测和管理III,第11139页。(2012)
[52] Trucchia,A.、Egorova,V.、Pagnini,G.、Rochou,M.C.:区域尺度野地火灾建模中湍流和火灾探测效应的基于替代的全局敏感性分析。预打印时间https://arxiv.org/abs/1809.05430 (2018)
[53] Welling,M.,Teh,Y.W.:通过随机梯度Langevin动力学进行贝叶斯学习。摘自:第28届国际机器学习会议记录(ICML-11),第681-688页。(2011年)
[54] Wikle,C.K.:空间过程的低秩表示法。《空间统计手册》,第114-125页。泰勒和弗朗西斯:CRC出版社(2010)
[55] Wuebbles,D.J.,Fahey,D.W.,Hibbard,K.A.,Arnold,J.R.,DeAngelo,B.,Doherty,S.,Easterling,D.R.,Edmonds,J.,Edmonds,T.,Hall,T.等人:气候科学特别报告:第四次国家气候评估(NCA4),第一卷(2017)
[56] Xi,DD;Taylor,SW;伍尔福德,DG;Dean,C.,《野火风险关键组成部分的统计模型》,年。修订状态申请。,6, 197-222 (2019) ·doi:10.1146/annurev-statistics-031017-100450
[57] Yadav,R.、Huser,R.和Opitz,T.:一种灵活的贝叶斯分层建模框架,用于阈值数据上的空间相关峰值。小争吵。统计51,100672(2022)
[58] Zammit-Mangion,A。;Cressie,N.,FRK:大型数据集空间和时空预测的R包,J.Stat.Softw。,98, 4, 1-48 (2021) ·doi:10.18637/jss.v098.i04
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。