×

几种kriging子模型聚合方法的性质和比较。 (英语) Zbl 1495.86009号

摘要:克里格是一种广泛应用于计算机实验、机器学习和地质统计学的技术。kriging面临的一个重要挑战是处理大型数据集时的高成本。本文重点介绍了一类旨在通过基于较小数据子集聚合kriging预测因子来减少这种计算负担的方法。更准确地说,它表明忽略子模型之间协方差的聚合方法通常会产生不一致的预测,而嵌套克里金方法具有几个吸引人的特性:它是一致的,可以解释为修正先验的精确条件分布,并且可以有效地计算给定观测值的条件协方差。本文还对子模型的观测点分配如何影响聚合模型的预测能力进行了理论和数值分析。最后,将嵌套克立格方法推广到测量误差和普适克立格。

MSC公司:

86A32型 地理统计学
86-08 地球物理问题的计算方法
62兰特 大数据和数据科学的统计方面
62H11型 定向数据;空间统计学
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Abrahamsen P(1997)高斯随机场和相关函数综述。挪威计算中心技术报告
[2] Allard,D。;Comunian,A。;Renard,P.,《地球科学中的概率聚合方法》,《数学地球科学》,44,5,545-581(2012)·Zbl 1256.86006号 ·doi:10.1007/s11004-012-9396-3
[3] 巴基,V。;Jomard,H。;斯科特,O。;Antoshchenkova,E。;Bardet,L。;杜卢克,CM;Hebert,H.,《使用元模型进行海啸危险分析:法国大西洋海岸应用实例》,《前地球科学》,第8、41、1-17页(2020年)
[4] Bachoc,F.,高斯过程超参数的交叉验证和最大似然估计,模型误判,计算统计数据分析,66,55-69(2013)·Zbl 1471.62021号 ·doi:10.1016/j.csda.2013.03.016
[5] Bachoc,F。;阿马尔,K。;Martinez,JM,通过元建模改进实验设计中的代码行为,Nucl Sci Eng,183,3,387-406(2016)·doi:10.13182/NSE15-108
[6] Bachoc,F。;拉格努克斯,A。;Nguyen,TMN,固定域渐近下协方差参数的交叉验证估计,J Multivar Ana,160,42-67(2017)·Zbl 1378.6206号 ·doi:10.1016/j.jmva.2017.06.003
[7] 班纳吉,S。;盖尔芬德,AE;AO芬利;Sang,H.,大型空间数据集的高斯预测过程模型,J R Stat Soc Ser B(Stat Methodol),70,4,825-848(2008)·Zbl 1533.62065号 ·文件编号:10.1111/j.1467-9868.2008.00663.x
[8] Cao Y,Fleet DJ(2014)用于高斯过程预测的自动和原则性融合的专家广义产品。收录:蒙特利尔NIPS现代非参数3:自动化学习管道研讨会,第1-5页
[9] Chevalier C,Ginsbourger D(2013),快速计算多点预期改进,并应用于批量选择。In:学习和智能优化。柏林施普林格,第59-69页
[10] 奇利斯,JP;Delfiner,P.,《地理统计学:建模空间不确定性》(2012),纽约:威利,纽约·Zbl 1256.86007号 ·doi:10.1002/9781118136188
[11] 奇利斯,JP;北卡罗来纳州德萨西斯,克里格五十年。数学地球科学手册,589-612(2018),Cham:Springer,Cham·doi:10.1007/978-3319-78999-6_29
[12] 克雷西,N.,《克里格的起源》,《数学地质学》,22,3,239-252(1990)·Zbl 0964.86511号 ·doi:10.1007/BF00889887文件
[13] Cressie,N.,《空间数据统计》(1993),纽约:威利,纽约·Zbl 1347.62005年 ·doi:10.1002/97811191151
[14] 北卡罗来纳州克雷西。;Johannesson,G.,《超大空间数据集的固定秩克里金法》,J R Stat Soc Ser B(Stat Methodol),70,1,209-226(2008)·Zbl 05563351号 ·文件编号:10.1111/j.1467-9868.2007.00633.x
[15] Datta,A。;班纳吉,S。;AO芬利;Gelfand,AE,大型地质统计数据集的层次最近邻高斯过程模型,美国统计协会,111,514,800-812(2016)·doi:10.1080/01621459.2015.1044091
[16] 印度人民党戴维斯;Curriero,FC,基于非欧几里德空间协方差矩阵的地质统计学方法的开发和评估,《数学地质科学》,51,6,767-791(2019)·Zbl 1421.86017号 ·doi:10.1007/s11004-019-09791-y
[17] Deisenroth MP,Ng JW(2015)分布式高斯过程。摘自:第32届国际机器学习会议记录,法国里尔JMLR:W&CP,第37卷
[18] AO芬利;Sang,H。;班纳吉,S。;Gelfand,AE,《提高大型数据集预测过程建模的性能》,《计算统计数据分析》,53,8,2873-2884(2009)·兹比尔1453.62090 ·doi:10.1016/j.csda.2008.09.008
[19] 富勒,R。;MG杰顿;Nychka,D.,大型空间数据集插值的协方差锥化,《计算图形统计杂志》,15,3,502-523(2006)·doi:10.1198/106186006X132178
[20] He J,Qi J,Ramamohanarao K(2019)可扩展高斯过程回归的查询软件贝叶斯委员会机器。摘自:2019年SIAM数据挖掘国际会议记录。SIAM,第208-216页
[21] 希顿,MJ;Datta,A。;AO芬利;富勒,R。;吉尼斯,J。;Guhaniyogi,R。;格贝尔,F。;格莱美,RB;哈姆林,D。;Katzfuss,M。;林格伦,F。;Nychka,D。;Sun,F。;Zammit-Mangion,A.,《分析大型空间数据方法之间的案例研究竞争》,《农业生物环境统计杂志》,24,3,398-425(2019)·Zbl 1426.62345号 ·doi:10.1007/s13253-018-00348-w
[22] Hensman J、Fusi N、Lawrence ND(2013)《大数据的高斯过程》。In:人工智能中的不确定性,第282-290页
[23] GE Hinton,《通过最小化对比差异来培训专家产品》,《神经计算》,第14、8、1771-1800页(2002年)·兹比尔1010.68111 ·网址:10.1162/089976602760128018
[24] Jones博士;Schonlau,M。;Welch,WJ,昂贵黑盒函数的高效全局优化,J global Optim,13455-492(1998)·Zbl 0917.90270号 ·doi:10.1023/A:1008306431147
[25] 考夫曼,CG;MJ Schervish;Nychka,DW,大型空间数据集中基于相似性估计的协方差减缩,美国统计协会期刊,103,484,1545-1555(2008)·兹比尔1286.62072 ·doi:10.1198/016214500000959
[26] Krige,DG,《威特沃特斯兰德一些基本矿山估价问题的统计方法》,南非金属研究所杂志,52,6,119-139(1951)
[27] Krityakierne,T。;Baowan,D.,基于聚合GP的污染源定位优化,Oper Res Perspect,7100151(2020)
[28] Liu H,Cai J,Wang Y,Ong Y S(2018)大规模高斯过程回归的广义稳健贝叶斯委员会机器。In:机器学习研究论文集,第80卷,第3131-3140页,2018年国际机器学习会议
[29] 刘,H。;Ong,Y。;沈,X。;Cai,J.,《当高斯过程遇到大数据:可伸缩GP的回顾》,IEEE Trans Neural Netw Learn System,314405-4423(2020)·doi:10.1109/TNNLS.2019.2957109
[30] Marrel,A。;Iooss,B。;Laurent,B。;Roustant,O.,高斯过程元模型的Sobol指数计算,Reliab Eng Syst Saf,94,3,742-751(2009)·doi:10.1016/j.ress.2008.07.008
[31] Matheron G(1970)《区域变量及其应用》。巴黎国家矿山学院枫丹白露数学形态学中心分册5
[32] H·推杆。;Young,A.,关于协方差函数估计对Kriging预测精度的影响,Bernoulli,7,3,421-438(2001)·Zbl 0987.62061号 ·doi:10.2307/3318494
[33] 基诺内罗·坎德拉,J。;拉斯穆森,CE,稀疏近似高斯过程回归的统一观点,J Mach Learn Res,61939-1959(2005)·Zbl 1222.68282号
[34] 拉斯穆森,CE;Williams,CKI,机器学习的高斯过程(2006),剑桥:麻省理工学院出版社,剑桥·Zbl 1177.68165号
[35] Roustant O,Ginsbourger D,Deville Y(2012)DiceKriging,DiceOptim:使用基于Kriging-based元建模和优化的计算机实验分析的两个R包。J Stat Softw杂志51(1):1-55
[36] H街。;Held,L.,高斯马尔可夫随机场,理论与应用(2005),博卡拉顿:查普曼和霍尔,博卡拉顿·邮编1093.60003 ·doi:10.1201/9780203492024
[37] Rullière,D。;北卡罗来纳州杜兰德。;Bachoc,F。;Chevalier,C.,《大量观测数据集的嵌套克里金预测》,《统计计算》,28,4,849-867(2018)·Zbl 1384.62246号 ·doi:10.1007/s11222-017-9766-2
[38] Sacks,J。;韦尔奇,WJ;TJ米切尔;Wynn,HP,《计算机实验的设计与分析》,《统计科学》,第4期,第409-423页(1989年)
[39] 桑特纳,TJ;威廉姆斯,BJ;威斯康星州诺茨,《计算机实验的设计与分析》(2013),柏林:施普林格出版社,柏林
[40] Stein,ML,《空间数据插值:克里格的一些理论》(2012),柏林:施普林格出版社,柏林
[41] Stein,ML,空间数据协方差矩阵低秩近似的限制,空间统计,8,1-19(2014)·doi:10.1016/j.spasta.2013.06.003
[42] 太阳,X。;罗,XS;徐,J。;赵,Z。;陈,Y。;Wu,L。;陈,Q。;Zhang,D.,2013-2017年中国东部地区省级pm2.5污染的时空变化和因素,地质统计学,科学代表,9,1,1-10(2019)·doi:10.1038/s41598-018-37186-2
[43] Tresp,V.,贝叶斯委员会机器,神经计算,12,11,2719-2741(2000)·doi:10.1162/089976600300014908
[44] van Stein B,Wang H,Kowalczyk W,Bäck T,Emmerich M(2015)大数据回归的最优加权聚类Kriging。在:智能数据分析国际研讨会。施普林格,第310-321页
[45] van Stein,B。;Wang,H。;科瓦尔奇克,W。;艾默里奇,M。;Bäck,T.,用于降低复杂性的基于聚类的克里格近似算法,应用智能,50,3,778-791(2020)·doi:10.1007/s10489-019-01549-7
[46] 巴斯克斯,E。;Bect,J.,具有固定均值和协方差函数的预期改进算法的收敛性,J Stat Plann推断,140,11,3088-3095(2010)·Zbl 1419.62200号 ·doi:10.1016/j.jspi.2010.04.018
[47] Vazquez E,Bect J(2010b)克立格预估器与已知均值和协方差函数的点态一致性。收录:Giovagnoli A,Atkinson AC,Torsney B,May C(编辑)mODa 9-面向模型的设计和分析进展。Physica Verlag HD,海德堡,第221-228页。国际标准图书编号978-3-7908-2410-0
[48] Ying,Z.,高斯过程数据下最大似然估计量的渐近性质,J Multivar Ana,36280-296(1991)·Zbl 0733.62091号 ·doi:10.1016/0047-259X(91)90062-7
[49] 张,H。;Wang,Y.,《海量空间数据的克里格和交叉验证》,环境计量学,21,290-304(2010)·doi:10.1002/env.1023
[50] 朱,Z。;Zhang,H.,填充渐进框架下的空间抽样设计,环境计量学,17,4,323-337(2006)·doi:10.1002/env.772
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。