×

稀疏观测空间数据分析中的贝叶斯加性回归树。 (英语) Zbl 07602441号

摘要:贝叶斯加性回归树(BART)模型是近年来贝叶斯非参数领域应用最广泛的方法之一。2007年提出了空间调整的BART模型;然而,它在空间数据分析中的应用数量有限。我们提出了一种新版本的BART模型,用于空间数据分析,该模型适用于具有稀疏空间观测值和高维预测值的环境。具体地说,条件自回归先验中基于邻接的权重矩阵被反映任何类型空间结构的权重矩阵的新定义所取代,模型中预测器的选择概率采用新的稀疏诱导先验。通过一系列仿真研究,检验了该模型的适用性。我们应用所提出的模型预测马萨诸塞州、康涅狄格州和罗德岛邮政编码地区的年环境颗粒物(PM)浓度。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 奇普曼,HA;乔治,EI;McCulloch,RE,BART:贝叶斯加性回归树,Ann Appl Stat,4,1266-298(2010)·Zbl 1189.62066号
[2] Breiman,L.,《随机森林》,《马赫学习》,第45、1、5-32页(2001年)·Zbl 1007.68152号
[3] 椋鸟,JE;默里,JS;Carvalho,CM,BART与目标平滑:患者特定死产风险分析,Ann Appl Stat,14,1,28-50(2020)·Zbl 1439.62228号
[4] Nalenz,M。;Villani,M.,《规则结构马蹄铁规则化的树形合奏》,《Ann Appl Stat》,第12、4、2379-2408页(2018年)·Zbl 1412.62169号
[5] 北卡罗来纳州Quadrianto。;Z.Ghahramani,《一个非常简单的安全贝叶斯随机森林》,IEEE Trans-Pattern Ana Mach Intell,37,6,1297-1303(2014)
[6] Kapelner,A,Bleich,J.bartMachine:使用贝叶斯加性回归树进行机器学习。arXiv预印arXiv:1312.21712013。
[7] 希尔,JL。,因果推理的贝叶斯非参数建模,J Comput Graph Stat,20,1,217-240(2011)
[8] Hahn,PR,Murray,JS,Carvalho,C.因果推断的贝叶斯回归树模型:正则化、混杂和异质效应。arXiv预印arXiv:1706.095232017·Zbl 1475.62102号
[9] Linero,AR,《用于高维预测和变量选择的贝叶斯回归树》,美国统计协会期刊,113,522,626-636(2018)·兹比尔1398.62065
[10] 斯帕帕尼,RA;罗根,BR;McCulloch,RE,使用贝叶斯加性回归树(BART)进行非参数生存分析,Stat Med,35,16,2741-2753(2016)
[11] 缪勒,P。;Shih,Y-CT;Zhang,S.,用于合并两个数据集的空间调整贝叶斯加性回归树模型,贝叶斯分析,2,3,611-633(2007)·Zbl 1331.62170号
[12] Krueger,R。;Bansal,P。;Buddhavarapu,P.,用于事故热点识别的贝叶斯加性回归树新空间计数数据模型,Accid Ana Prev,144205623,1-10(2020)
[13] 贝萨格,J。;约克·J。;Mollié,A.,《贝叶斯图像恢复及其在空间统计中的两个应用》,《Ann Inst Stat Math》,43,1,1-20(1991)·Zbl 0760.62029号
[14] Cressie,N.,空间数据统计(1993),纽约:John Wiley&Sons,纽约
[15] 班纳吉,S。;卡林,B。;Bradley,P.,空间数据的层次建模和分析(2014),佛罗里达州博卡拉顿:CRC出版社,佛罗里达州波卡拉顿
[16] Leroux,BG,Lei,X,Breslow,N。小地区疾病发病率的估计:一种新的空间依赖混合模型。流行病学、环境和临床试验的统计模型;纽约州纽约市:施普林格;2000年,第179-191页·Zbl 0957.62095号
[17] 哈斯蒂,T。;Tibshirani,R.,《贝叶斯反制》(附有作者的评论和反驳),《统计科学》,15,3,196-223(2000)·兹比尔1059.62524
[18] Geman,S。;Geman,D.,随机松弛,Gibbs分布和图像的贝叶斯恢复,应用统计杂志,20,5-6,25-62(1993)
[19] 马里兰州普拉托拉;奇普曼,HA;Gattiker,JR,并行贝叶斯加性回归树,J Comput Graph Stat,23,3,830-852(2014)
[20] McCord,SE;Buenemann,M。;Karl,JW,《综合遥感图像和现有多尺度实地数据得出牧场指标:贝叶斯加性回归树的应用》,《牧场生态管理》,70,5,644-655(2017)
[21] Sun,D。;RK筑川;Speckman,PL.,使用CAR(1)分布的层次模型的后验分布,生物统计学,86,2,341-350(1999)·Zbl 0931.62081号
[22] Wilson,A。;BJ Reich,《通过受惩罚的可信区域进行混淆选择》,《生物计量学》,70,4,852-861(2014)·Zbl 1393.62107号
[23] 刘,Y。;Wang,Y。;Feng,Y.,不完全高维数据的变量选择和预测,Ann Appl Stat,10,1,418(2016)·兹比尔1454.62028
[24] Bernadinelli,L。;帕斯卡托,C。;Best,NG,共变变量中有误差的疾病绘图,Stat Med,16,7,741-752(1997)
[25] 夏,H。;英国石油公司卡林。,协变量中有误差的时空模型:绘制俄亥俄州肺癌死亡率,统计医学,17,18,2025-2043(1998)
[26] 厄内斯特,A。;摩根(Morgan,G.)。;Mengersen,K.,评估邻域权重矩阵对条件自回归(car)模型平滑特性的影响,国际卫生地理杂志,6,1,54(2007)
[27] 邓肯,EW;白色,NM;Mengersen,K.,《贝叶斯模型中的空间平滑:权重矩阵规范的比较及其对推理的影响》,《国际健康地理杂志》,16,1,1-16(2017)
[28] Congdon,PD,《应用贝叶斯分层方法》(2010),纽约州纽约市:CRC出版社·Zbl 1216.62036号
[29] Fahrmeir,L。;Kneib,T.,《纵向、空间和事件历史数据的贝叶斯平滑和回归》(2011),牛津:牛津大学出版社·兹比尔1249.62003
[30] Anselin,L.,《空间计量经济学:方法和模型》(1988),多德雷赫特:施普林格科学与商业媒体
[31] 海宁,RP;Haining,R.,《空间数据分析:理论与实践》(2003),剑桥:剑桥大学出版社
[32] Getis,A.,《空间权重矩阵》,《地理分析》,第41、4、404-410页(2009年)
[33] 哈里斯,R。;莫法特,J。;Kravtsova,V.,《寻找‘W’》,《Spat Econ Ana》,第6、3、249-270页(2011年)
[34] 明吉恩,M。;宾夕法尼亚州迪洛罗;Farcomeni,A.,《利用Richards曲线对新型冠状病毒肺炎疫情进行时空建模:意大利地区的应用》,Spat Stat,49(2022)
[35] 父母,O。;LeSage,JP.,使用条件自回归空间规范的方差结构来建模知识溢出,《应用经济学杂志》,23,2,235-256(2008)
[36] 陈,X。;Ye,J.,《风起时:中国城市空气污染的空间溢出效应》,《环境规划管理杂志》,62,81359-1376(2019)
[37] Lee,D.,Carbayes:带条件自回归先验的贝叶斯空间建模r包,J Stat Softw,55,13,1-24(2013)
[38] 男孩,BL;马丁,RV;Van Donkelaar,A.,《卫星衍生细颗粒物的十五年全球时间序列》,《环境科学技术》,48,19,11109-11118(2014)
[39] Kim,C。;丹尼尔斯,MJ;Hogan,JW,《多重中介的贝叶斯方法:电厂排放控制分析中的相关主要分层和因果中介》,《Ann Appl Stat》,第13、3、1927(2019)页·兹比尔1433.62324
[40] 萨胡,斯洛伐克;盖尔芬德,AE;Holland,DM,《细颗粒物的时空建模》,《农业生物环境统计杂志》,11,1,61-86(2006)
[41] 贝罗卡尔,VJ;盖尔芬德,AE;Holland,DM,《空间和时间不一致情况下的双变量时空降尺度器》,《Ann Appl Stat》,第4期,1942-1975(2010)·Zbl 1220.62148号
[42] 贝尔,马里兰州;Dominici,F。;Ebisu,K.,PM2的时空变化。5《美国健康影响研究中的化学成分》,《环境健康展望》,115,7,989-995(2007)
[43] EM Schliep;盖尔芬德,AE;Holland,DM,使用VIIRS卫星AOT预测每日PM 2.5的自回归空间变化系数模型,Adv Stat Climatol Meteorol Oceanogr,1,1,59-74(2015)
[44] Di,Q。;库特拉基斯,P。;Schwartz,J.,pm2混合预测模型。5使用化学运输模型和土地利用回归的质量和成分,大气环境,131390-399(2016)
[45] Gately,C,Hutyra,LR,Wing,IS。DARTE在1km电网上的年度公路CO2排放量,相邻美国,1980-2017年第2版。ORNL DAAC,2019年。
[46] Di,Q。;罗兰,S。;Koutrakis,P.,美国大陆空间和时间分辨臭氧暴露的混合模型,《空气废物管理协会杂志》,67,1,39-52(2017)
[47] Thornton,PE,Thornton,MM,Mayer,BW等。Daymet:北美1公里网格上的每日地表天气数据,橡树岭国家实验室(ORNL):田纳西州橡树岭;2014年(技术报告;第2版)。
[48] Schaaf,C,Wang,Z.MCD43A4 MODIS/Terra+Aqua BRDF/Albedo Nadir BRDF调整RefDaily L3 Global 500 m V006,NASA EOSDIS Land Processes DAAC。美国地质勘探局地球资源观测与科学中心:南达科他州苏福尔斯(https://lpdaac.usgs.gov); 2015
[49] X·冯。;李强。;朱毅,PM2的人工神经网络预测。5使用基于空气质量轨迹的地理模型和小波变换的污染,Atmos Environ,107,118-128(2015)
[50] 宾夕法尼亚州莫兰。,关于连续随机现象的注释,生物统计学,37,1-2,17-23(1950)·Zbl 0041.45702号
[51] Celeux,G。;福布斯,F。;Robert,CP,缺失数据模型的偏差信息标准,贝叶斯分析,1,4,651-673(2006)·Zbl 1331.62329号
[52] Knorr-Held,L.,疾病风险中不可分割时空变化的贝叶斯模型,《统计医学》,19,17-18,2555-2567(2000)
[53] Kalisch,M。;Bühlman,P.,用pc算法估计高维有向无环图,J Mach Learn Res,8,3613-636(2007)·Zbl 1222.68229号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。