×

空间数据的多尺度过程建模和分布式计算。 (英文) Zbl 1452.62364号

摘要:近年来,受远程数据可用性增加和分布式处理技术成本降低的推动,空间建模和预测方法取得了巨大发展。众所周知,使用无限维过程模型进行建模和预测对于大型数据集是不可能的,并且需要近似模型和近似推理方法。通过多分辨率近似和最近邻技术等解决了将简单的全局空间模型拟合到大数据集的问题。在这里,我们解决了下一个挑战,即将复杂的、非平稳的多尺度模型拟合到大型数据集。我们建议通过使用空间尺度增加和非平稳程度增加的空间过程的叠加来实现这一点。通过使用高斯马尔可夫随机场和基于图着色的并行马尔可夫链蒙特卡罗,简化了计算。得到的模型允许分布式计算和分布式数据。重要的是,它为真正的模型和数据可扩展性提供了机会,但仍然能够在大空间范围内借力。我们展示了一个包含100万个观测值的海面温度数据集的双尺度版本,并将我们的方法与最先进的空间建模和预测方法进行了比较。

MSC公司:

62H11型 定向数据;空间统计学
05C15号 图和超图的着色
62-08 统计问题的计算方法
62M20型 随机过程推断和预测
62页第12页 统计在环境和相关主题中的应用
65二氧化碳 蒙特卡罗方法
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Aune,E。;Simpson,DP;Eidsvik,J.,高维高斯分布中的参数估计,统计计算。,24, 247-263 (2014) ·Zbl 1325.62006号 ·doi:10.1007/s11222-012-9368-y
[2] 班纳吉,S。;盖尔芬德,AE;AO芬利;Sang,H.,大型空间数据集的高斯预测过程模型,J.R.Stat.Soc.B,70,825-848(2008)·Zbl 05563371号 ·文件编号:10.1111/j.1467-9868.2008.00663.x
[3] EA本德;Wilf,HS,图着色问题中回溯的理论分析,J.算法,6275-282(1985)·Zbl 0601.68039号 ·doi:10.1016/0196-6774(85)90044-6
[4] 柏林,LM;Hanson,KM;Silver,RN,层次贝叶斯时间序列模型,最大熵和贝叶斯方法,15-22(1996),纽约:Springer,纽约·Zbl 0886.62080号
[5] 贝萨格,J。;绿色,P。;希格顿,D。;Mengersen,K.,贝叶斯计算和随机系统,统计科学。,10, 3-41 (1995) ·Zbl 0955.6252号 ·doi:10.1214/ss/1177010123
[6] 布朗,DA;CS麦克马汉;Self,SW,高斯马尔可夫随机场快速更新的抽样策略,美国统计局(2019)·Zbl 07632834号 ·doi:10.1080/00031305.2019.1595144
[7] 曹,C。;熊,J。;布隆斯基,S。;刘,Q。;Uprety,S。;邵,X。;Bai,Y。;Weng,F.,Suomi NPP VIIRS传感器数据记录验证、验证和长期性能监测,J.Geophys。Res.大气。,118, 11664-11678 (2013) ·doi:10.1002/2013JD020418
[8] 北卡罗来纳州克雷西。;Johannesson,G.,《超大空间数据集的固定秩克里金法》,J.R.Stat.Soc.B,70,209-226(2008)·Zbl 05563351号 ·文件编号:10.1111/j.1467-9868.2007.00633.x
[9] 北卡罗来纳州克雷西。;Wikle,CK,《时空数据统计》(2011),霍博肯:Wiley,Hoboken·Zbl 1273.62017年
[10] 杜瓦,M。;斯克里,K。;Kadirkamanathan,V.,使用积分-差分方程的数据驱动时空建模,IEEE Trans。信号处理。,57, 83-91 (2009) ·Zbl 1391.45010号 ·doi:10.1109/TSP.2008.2005091
[11] 埃伯里,LE;卡林,英国石油公司,《空间模型马尔可夫链蒙特卡罗拟合的可识别性和收敛性问题》,《统计医学》,192279-2294(2000)·doi:10.1002/1097-0258(20000915/30)19:17/18<2279::AID-SIM569>3.0.CO;2-右
[12] AO芬利;Datta,A。;库克,不列颠哥伦比亚省;哥伦比亚特区莫顿;安徒生,HE;Banerjee,S.,《贝叶斯最近邻高斯过程的高效算法》,J.Compute。图表。统计,28,401-414(2019)·Zbl 07499062号 ·doi:10.1080/101816600.2018.1537924
[13] 盖尔芬德,AE;英国石油公司卡林;Trevisani,M.,《关于使用吉布斯抽样进行多级模型计算》,Stat.Sin。,11, 981-1003 (2001) ·Zbl 0988.62016号
[14] 盖尔曼,A。;卡林,JB;斯特恩,HS;邓森,DB;Vehtari,A。;罗宾,DB,贝叶斯数据分析(2013),博卡拉顿:查普曼和霍尔/CRC出版社,博卡拉顿
[15] Gneiting,T。;Raftery,AE,《严格正确的评分规则、预测和估计》,《美国统计协会期刊》,第102期,第359-378页(2007年)·Zbl 1284.62093号 ·doi:10.1198/0162145000001437
[16] Gonthier,G.,《四色定理的形式证明》,AMS注意事项,551382-1393(2008)·Zbl 1195.05026号
[17] Gonzalez,J.,Low,Y.,Gretton,A.,Guestrin,C.:平行吉布斯采样:从彩色田野到薄连接树。摘自:《第十四届国际人工智能与统计会议记录》,第324-332页(2011年)
[18] CS Jensen;Kjrulff,美国。;Kong,A.,《超大概率专家系统中的Blocking Gibbs抽样》,国际J·休姆计算。螺柱,42,647-666(1995)·文件编号:10.1006/ijhc.1995.1029
[19] Katzfush,M.,《海量空间数据集的多分辨率近似》,美国统计协会,112,201-214(2017)·doi:10.1080/01621459.2015.1123632
[20] Katzfuss,M。;Hammerling,D.,使用低秩模型对大规模分布式空间数据进行并行推理,统计计算。,27, 363-375 (2017) ·Zbl 1505.62217号 ·doi:10.1007/s11222-016-9627-4
[21] Knorr-Held,L。;Rue,H.,疾病映射的马尔可夫随机场模型中的块更新,Scand。《统计杂志》,29,597-614(2002)·Zbl 1039.62092号 ·doi:10.1111/1467-9469.00308
[22] Lauritzen,SL,《图形模型》(1996),牛津:克拉伦登出版社,牛津·Zbl 0907.62001
[23] 林格伦,F。;Rue,H.,贝叶斯空间建模与R-INLA,J.Stat.Softw。,63, 19, 1-25 (2015) ·doi:10.18637/jss.v063.i19
[24] 林格伦,F。;H街。;Lindström,J.,《高斯场和高斯-马尔可夫随机场之间的明确联系:随机偏微分方程方法》,J.R.Stat.Soc.B,73423-498(2011)·Zbl 1274.62360号 ·文件编号:10.1111/j.1467-9868.2011.00777.x
[25] Monterrubio-Gómez,K。;罗伊宁,L。;韦德,S。;Damoulas,T。;Girolami,M.,稀疏分层非平稳模型的后验推理,计算机。统计数据分析。,148, 106954 (2020) ·Zbl 1510.62068号 ·doi:10.1016/j.csda.2020.106954
[26] 诺德豪森,K。;Oja,H。;菲尔兹莫瑟,P。;Reimann,C.,空间成分数据的盲源分离,数学。地质科学。,47, 753-770 (2015) ·兹比尔1323.86031 ·doi:10.1007/s11004-014-9559-5
[27] Nychka,D。;Bandyopadhyay,S。;哈姆林,D。;林格伦,F。;Sain,S.,用于分析大型空间数据集的多分辨率高斯过程模型,J.Compute。图表。Stat.,24,579-599(2015)·doi:10.1080/10618600.2014.914946
[28] R核心团队:R:统计计算语言和环境。R统计计算基金会,维也纳(2019年)
[29] H街。;Held,L.,《高斯马尔可夫随机场:理论与应用》(2005),博卡拉顿:查普曼和霍尔/CRC出版社,博卡拉通·邮编1093.60003
[30] H街。;Tjelmeland,H.,将高斯马尔可夫随机场拟合为高斯场,Scand。《统计杂志》,29,31-49(2002)·Zbl 1017.62088号 ·doi:10.1111/1467-9469.00058
[31] Sahr,K.,二十面体孔径3六边形离散全局网格上的位置编码,计算。环境。城市系统。,32, 174-187 (2008) ·doi:10.1016/j.com.penvurbsys.2007.11.005
[32] 萨胡,斯洛伐克;Mardia,KV,《空气污染水平短期预测的贝叶斯-克里格德-卡尔曼模型》,J.R.Stat.Soc.Ser。C、 54、223-244(2005)·Zbl 1490.62397号 ·文件编号:10.1111/j.1467-9876.2005.00480.x
[33] Sang,H。;Huang,JZ,大型空间数据集协方差函数的全尺度近似,J.R.Stat.Soc.B,74,111-132(2012)·Zbl 1411.62274号 ·文件编号:10.1111/j.1467-9868.2011.01007.x
[34] Scherer,POJ,《计算物理:经典和量子系统的模拟》(2017),Cham:Springer,Cham·Zbl 1419.82002号
[35] D.辛普森。;伊利安,JB;林格伦,F。;瑟比,SH;Rue,H.,Going off grid:log-Gaussian Cox过程的计算效率推断,Biometrika,103,49-70(2016)·Zbl 1452.62704号 ·doi:10.1093/biomet/asv064
[36] 范戴克,DA;Park,T.,《部分坍塌吉布斯采样器:理论和方法》,美国统计协会,103,790-796(2008)·Zbl 1471.62198号 ·doi:10.1198/0162145000000409
[37] 威克尔,CK;Zammit-Mangion,A。;Cressie,N.,《时空统计与R》(2019),博卡拉顿:查普曼和霍尔/CRC,博卡拉顿
[38] DJ威尔金森;Kontoghiorghes,EJ,并行贝叶斯计算,并行计算和统计手册,477-508(2006),博卡拉顿:CRC出版社,博卡拉顿
[39] Zammit-Magion A,Cressie N(2020)FRK:利用大型数据集进行空间和时空预测的R包。J.统计软件。https://arxiv.org/pdf/1705.08105.pdf
[40] Zammit-Mangion,A。;Sanguinetti,G。;Kadirkamanathan,V.,《从连续观测和点过程观测中对时空系统进行变分估计》,IEEE Trans。信号处理。,60, 3449-3459 (2012) ·Zbl 1391.62186号 ·doi:10.1109/TSP.2012.2191966
[41] Zammit-Mangion,A。;北卡罗来纳州克雷西。;Shumack,C.,《从卫星遥感检索中生成三级产品的统计方法》,《遥感》,第10期,第155页(2018年)·doi:10.3390/rs10010155
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。