×

地面二氧化氮的可扩展惩罚时空土地利用回归。 (英语) Zbl 1478.62356号

总结:二氧化氮{否}_2)\)是与交通有关的空气污染的主要组成部分,对环境和人类健康造成了公认的有害影响。了解\(\mathrm的时空分布{否}_2\)对暴露和风险评估至关重要。评估空气污染暴露的一种常见方法是涉及空间参考协变量的线性回归,称为土地利用回归(LUR)。通过将广义Vecchia Gaussian过程近似与LUR系数惩罚相结合,我们开发了一种可扩展的方法,用于同时选择变量和估计具有时空相关误差的LUR模型。与使用模拟数据的现有方法相比,我们的方法具有更高的模型选择特异性和敏感性,并且在广泛的相关设置下,在校准和清晰度方面具有更好的预测能力。在我们的日常、美国范围、地面的时空分析中{否}_2\)数据表明,我们的方法更加准确,并且生成了一个更稀疏、更可解释的模型。我们的每日预测阐明了(\mathrm)的时空模式{否}_2\)美国各地的浓度,包括城市之间的显著差异和城市内部的差异。因此,我们的预测将有助于流行病学和风险评估研究,以寻求每日、全国范围的预测,并可用于急性结果健康风险评估。

MSC公司:

62页第12页 统计在环境和相关主题中的应用
62页第10页 统计学在生物学和医学中的应用;元分析
62H11型 定向数据;空间统计学
62J02型 一般非线性回归
60G15年 高斯过程
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Abatzoglou,J.T.、Rupp,D.E.和Mote,P.W.(2014)。美国西北太平洋地区的季节性气候变化。J.气候27 2125-2142.
[2] Alexeeff,S.E.、Roy,A.、Shan,J.、Liu,X.、Messier,K.、Apte,J.S.、Portier,C.、Sidney,S.和Van Den Eeden,S.K.(2018年)。使用谷歌街景汽车高分辨率绘制交通相关空气污染地图,以及加利福尼亚州奥克兰社区内心血管事件的发生率。环境。健康17 1-13·doi:10.1186/s12940-018-0382-1
[3] Apte,J.S.、Messier,K.P.、Gani,S.、Brauer,M.、Kirchstetter,T.W.、Lunden,M.M.、Marshall,J.D.、Portier,C.J.、Vermeulen,R.C.等人(2017年)。使用谷歌街景汽车绘制高分辨率空气污染地图:利用大数据。环境。科学。Technol公司。51 6999-7008.
[4] Apte,J.、Gani,S.、Chambliss,S.,Messier,K.、Lunden,M.等人(2019年)。使用代理污染物时对超细颗粒暴露的潜在低估:来自固定地点长期测量和移动监测的教训。环境。流行病。3 13-14.
[5] Banerjee,M.、Capozzoli,M.,McSweeney,L.和Sinha,D.(1999)。《超越卡帕:评测者间协议措施》。加拿大。J.统计。27 3-23. ·Zbl 0929.62117号 ·doi:10.2307/315487
[6] Beckerman,B.S.、Jerrett,M.、Serre,M.L.、Martin,R.V.、Lee,S.、Donkelaar,A.V.、Ross,Z.、Su,J.和Burnett,R.T.(2013)。估计国家尺度时空变异性的混合方法{下午}_{2.5}}\]在毗连的美国。环境。科学。Technol公司。47 7233-7241. ·doi:10.1021/es400039u。一个
[7] Boersma,K.F.、Eskes,H.J.、Veefkind,J.P.、Brinksma,E.J.、Van Der A,R.J.,Sneep,M.、Van Den Oord,G.H.J..、Levet,P.F.、Stammes,P.等人(2007年)。对流层近实时反演{否}_2}\]来自OMI。大气。化学。物理学。7 2103-2118.
[8] Breheny,P.和Huang,J.(2011)。非凸惩罚回归的坐标下降算法及其在生物特征选择中的应用。附录申请。统计。5 232-253. ·Zbl 1220.62095号 ·doi:10.1214/10-AOAS388
[9] Briggs,D.J.,Collins,S.,Elliott,P.,Fischer,P.、Kingham,S.、Lebret,E.、Pryl,K.、Van Reeuwijk,H.、Smallbone,K.等人(1997年)。使用GIS绘制城市空气污染图:基于回归的方法。国际地质杂志。信息科学。11 699-718. ·doi:10.1080/136588197242158
[10] 哥伦比亚大学国际地球科学信息网络中心(2018年)。世界网格人口,第4版(GPWv4):人口密度,第11版[数据集]。 ·数字对象标识码:10.7927/H49C6VHW
[11] Chatterjee,A.和Lahiri,S.N.(2011年)。自举套索估计器。J.Amer。统计师。协会。106 608-625. ·Zbl 1232.62088号 ·doi:10.198/jasa.2011.tm10159
[12] Coulliette,A.D.,Money,E.S.,Serre,M.L.和Noble,R.T.(2009年)。北卡罗来纳州东部河口粪便污染和降雨的时空分析。环境。科学。Technol公司。43 3728-35.
[13] Datta,A.、Banerjee,S.、Finley,A.O.和Gelfand,A.E.(2016a)。大型地质统计数据集的层次最近邻高斯过程模型。J.Amer。统计师。协会。111 800-812. ·doi:10.1080/01621459.2015.1044091
[14] Datta,A.、Banerjee,S.、Finley,A.O.、Hamm,N.A.S.和Schaap,M.(2016b)。用于大时空数据的不可分离动态最近邻高斯过程模型及其在颗粒物分析中的应用。附录申请。统计。10 1286-1316. ·Zbl 1391.62269号 ·doi:10.1214/16-AOAS931
[15] de Hoogh,K.、Chen,J.、Gulliver,J.,Hoffmann,B.、Hertel,O.、Ketzel,M.、Bauwelinck,M.,van Donkelaar,A.、Hvidtfeldt,U.A.等人(2018年)。空间\[{\text{下午}_{2.5}},{\text{否}_2},{\text{O} _3个}以及西欧时空稳定性评估的BC模型。环境。国际。120 81-92. ·doi:10.1016/j.envint.2018年7月36日
[16] de Hoogh,K.、Saucy,A.、Shtein,A.、Schwartz,J.、West,E.A.、Strassmann,A.、Puhan,M.、Roosli,M.和Stafoggia,M.等人(2019年)。结合瑞士OMI卫星数据,预测2005-2016年精细尺度NO2日变化。环境。科学。Technol公司。53 10279-10287.
[17] Efron,B.、Hastie,T.、Johnstone,I.和Tibshirani,R.(2004)。最小角度回归。安。统计师。32 407-499. 通过讨论,以及作者的反驳·Zbl 1091.62054号 ·doi:10.1214/009053604000000067
[18] Fan,J.和Li,R.(2001)。通过非洞穴惩罚似然的变量选择及其预言性质。J.Amer。统计师。协会。96 1348-1360. ·Zbl 1073.62547号 ·doi:10.1198/016214501753382273
[19] Finley,A.O.、Sang,H.、Banerjee,S.和Gelfand,A.E.(2009年)。提高大型数据集预测过程建模的性能。计算。统计师。数据分析。53 2873-2884. ·Zbl 1453.62090号 ·doi:10.1016/j.csda.2008.09.008
[20] Friedman,J.、Hastie,T.和Tibshirani,R.(2010)。广义线性模型通过坐标下降的正则化路径。J.统计软件。33 1-22.
[21] Gauderman,W.J.、Avol,E.、Lurmann,F.、Kuenzli,N.、Gilliland,F.、Peters,J.和McConnell,R.(2005年)。儿童哮喘与交通和二氧化氮接触。流行病学737-743.
[22] Gneiting,T.和Katzfuss,M.(2014)。概率预测。每年。修订状态申请。1 125-151. ·doi:10.1146/annurev-statistics-062713-085831
[23] Grundström,m.、Hak,C.、Chen,D.、Hallquist,m.和Pleijel,H.(2015)。\[{text的变化和共同变化{下午}_{10} }\],粒子数浓度,\[{\text{否}_x}\]和\[{\text{否}_2}\]在城市空气中与风速、垂直温度梯度和天气类型的关系。大气。环境。120 317-327.
[24] Guan,Y.、Johnson,M.C.、Katzfuss,M.、Mannshardt,E.、Messier,K.P.、Reich,B.J.和Song,J.J.(2020年)。使用谷歌街景车辆上的移动监测器进行精细时空空气污染分析。J.Amer。统计师。协会。115 1111-1124. ·Zbl 1441.62564号 ·doi:10.1080/01621459.2019.1665526
[25] 吉尼斯·J(2018)。用于锐化高斯过程近似的置换和分组方法。技术计量学60 415-429. ·doi:10.1080/00401706.2018.1437476
[26] Hastie,T.、Tibshirani,R.和Tibshilani,R.J.(2017)。最佳子集选择、正向逐步选择和套索的扩展比较。arXiv预印本。可从arXiv:1707.08692获得·Zbl 07307193号
[27] Heaton,M.J.、Datta,A.、Finley,A.O.等人(2019年)。一个案例研究大型空间数据分析方法之间的竞争。《农业杂志》。生物与环境。统计。24 398-425. ·Zbl 1426.62345号 ·doi:10.1007/s13253-018-00348-w
[28] Henderson,S.B.、Beckerman,B.、Jerrett,M.和Brauer,M.(2007年)。应用土地利用回归估算交通相关氮氧化物和细颗粒物的长期浓度。环境。科学。Technol公司。41 2422-2428. ·doi:10.1021/es0606780
[29] Hoek,G.,Beelen,R.,de Hoogh,K.,Vienneau,D.,Gulliver,J.,Fischer,P.和Briggs,D.(2008)。评估室外空气污染空间变化的土地利用回归模型综述。大气。环境。42 7561-7578. ·doi:10.1016/j.atmosenv.2008.05.057
[30] Hoek,G.、Krishnan,R.M.、Beelen,R.、Peters,A.、Ostro,B.、Brunekreef,B.和Kaufman,J.D.(2013)。长期空气污染暴露与心脏再呼吸死亡率:综述。环境。健康12 43.
[31] Holcomb,D.A.、Messier,K.P.、Serre,M.L.、Rowny,J.G.和Stewart,J.R.(2018)。使用气象学、土地覆盖和时空自相关对整个河流网络中的微生物水质进行地理统计预测。环境。科学。Technol公司。52. ·doi:10.1021/acs.est.8b01178
[32] Homer,C.、Dewitz,J.、Yang,L.、Jin,S.、Danielson,P.、Xian,G.、Coulston,J.,Herold,N.、Wickham,J.等人(2015年)。完成2011年相邻美国国家土地覆盖数据库,代表了十年的土地覆盖变化信息。照片。工程师远程传感器。81 345-354.
[33] Hughes,J.和Haran,M.(2013)。空间广义线性混合模型的降维和消除混淆。J.R.统计社会服务。B.统计方法。75 139-159. ·Zbl 07555442号 ·doi:10.1111/j.1467-9868.2012.01041.x
[34] Jurek,M.和Katzfuss,M.(2018年)。海量时空数据的多分辨率过滤器。可从arXiv:1810.04200获得。
[35] Katzfuss,M.(2017年)。海量空间数据集的多分辨率近似。J.Amer。统计师。协会。112 201-214. ·doi:10.1080/01621459.2015.1123632
[36] Katzfuss,M.和Gong,W.(2020年)。一类用于大型空间数据集的多分辨率近似。统计师。西尼卡30 2203-2226. ·Zbl 1464.62400号 ·doi:10.1007/s13253-020-00401-7
[37] Katzfuss,M.和Guinness,J.(2021)。高斯过程Vecchia近似的一般框架。统计师。科学。36 124-141. ·Zbl 07368223号 ·doi:10.1214/19-STS755
[38] Katzfuss,M.、Guinness,J.、Gong,W.和Zilber,D.(2020a)。高斯过程预测的Vecchia近似。《农业杂志》。生物与环境。统计。25 383-414·doi:10.1007/s13253-020-00401-7
[39] Katzfush,M.、Jurek,M.,Zilber,D.、Gong,W.、Guinness,J.、Zhang,J.和Schaefer,F.(2020b)。GPvecchia:使用维奇近似的快速高斯过程推理。R包版本0.1.3。
[40] Kerckhoff,J.、Hoek,G.、Portengen,L.、Brunekreef,B.和Vermeulen,R.C.(2019年)。室外空气污染空间表面建模预测算法的性能。环境。科学。Technol公司。53 1413-1421.
[41] Knibbs,L.D.、Hewson,M.G.、Bechle,M.J.、Marshall,J.D.和Barnett,A.G.(2014)。澳大利亚基于国家卫星的土地利用回归模型,用于空气污染暴露评估。环境。物件。135 204-211. ·doi:10.1016/j.envres.2014.09.011
[42] Larkin,A.、Geddes,J.A.、Martin,R.V.、Xiao,Q.、Liu,Y.、Marshall,J.D.、Brauer,M.和Hystad,P.(2017)。二氧化氮空气污染的全球土地利用回归模型。环境。科学。Technol公司。51 6957-6964.
[43] Li,R.和Sudjianto,A.(2005)。在高斯克里金模型中使用惩罚似然分析计算机实验。技术计量学47 111-120. ·doi:10.1198/00401700400000671
[44] Li,J.J.、Faltings,B.、Saukh,O.、Hasenfratz,D.和Beutel,J.(2012)。感知我们呼吸的空气——OpenSense苏黎世数据集。第26届AAAI人工智能会议.
[45] Liu,H.、Ong,Y.S.、Shen,X.和Cai,J.(2020年)。当高斯过程遇到大数据时:可扩展GP的回顾。IEEE传输。神经网络。学习。系统。31 4405-4423.
[46] Mauzerall,D.L.、Sultan,B.、Kim,N.和Bradford,D.F.(2005)。大型点源氮氧化物排放:臭氧生产的可变性,造成的健康损害和经济成本。大气。环境。39 2851-2866.
[47] Meinshausen,N.、Meier,L.和Bühlmann,P.(2009)\高维回归的(p\)-值。J.Amer。统计师。协会。104 1671-1681. ·Zbl 1205.62089号 ·doi:10.1198/jasa.2009.tm08647
[48] Messier,K.P.、Akita,Y.和Serre,M.L.(2012)。整合地址地理编码、土地利用回归和地下水四氯乙烯时空地质统计估计。环境。科学。Technol公司。46 2772-80. ·doi:10.1021/es203152a
[49] 梅西耶,K.P.和卡茨福斯,M.(2021a)。补充地面二氧化氮的可扩展惩罚时空土地利用回归。附录申请。统计。·Zbl 1478.62356号 ·doi:10.1214/20-AOAS1422补充
[50] Messier,K.P.和Katzfuss,M.(2021b)。地面二氧化氮的可扩展惩罚时空土地利用回归的R代码。附录申请。统计。·Zbl 1478.62356号 ·doi:10.1214/20-AOAS1422SUPB
[51] Messier,K.P.、Kane,E.、Bolich,R.和Serre,M.L.(2014)。使用监测和私人水井数据模型研究北卡罗来纳州地下水中的硝酸盐变化。环境。科学。Technol公司。48. ·doi:10.1021/es502725f
[52] Messier,K.P.、Campbell,T.、Bradley,P.J.和Serre,M.L.(2015)。使用土地利用回归和贝叶斯最大熵估计北卡罗来纳州地下水氡。环境。科学。Technol公司。49 9817-9825. ·doi:10.1021/acs.est.5b01503
[53] Miller,D.J.、Actkinson,B.、Padilla,L.、Griffin,R.J.、Moore,K.、Lewis,P.G.T.、Gardner-Forick,R.、Craft,E.、Portier,C.J.等人(2020年)。在德克萨斯州休斯顿,通过移动监测表征升高的城市空气污染物空间模式。环境。科学。Technol公司。.
[54] Mills,I.C.、Atkinson,R.W.、Kang,S.、Walton,H.和Anderson,H.R.(2015)。对短期接触二氧化氮与死亡率和入院率之间的关系进行定量系统审查。英国医学杂志5电子006946·doi:10.1136/bmjopen-2014-006946
[55] Moore,D.K.、Jerrett,M.、Mack,W.J.和Künzli,N.(2007年)。预测加利福尼亚州洛杉矶市周围细颗粒物的土地利用回归模型。J.环境。莫尼特。9 246-252. ·doi:10.1039/b615795e
[56] NASA/METI/AIST/日本空间系统和美国/日本ASTER科学团队(2019年)。ASTER全球数字高程模型V003[数据集]。 ·doi:10.5067/ASTER/ASTGTM.003
[57] Novotny,E.V.、Bechle,M.J.、Millet,D.B.和Marshall,J.D.(2011)。基于国家卫星的土地利用回归:\[{\text{否}_2}\]在美国。环境。科学。Technol公司。45 4407-4414.
[58] Padró-Martínez,L.T.、Patton,A.P.、Trull,J.B.、Zamore,W.、Brugge,D.和Durant,J.L.(2012)。在一年内,对附近高速公路附近的颗粒物浓度和其他与交通有关的空气污染物进行移动监测。大气。环境。61 253-264.
[59] Reyes,J.M.和Serre,M.L.(2014)。评估\[{\text的LUR/BME框架{下午}_{2.5}}\]由公路、移动和固定源解释。环境。科学。Technol公司。48 1736-44·doi:10.1021/es4040528
[60] Rosenlund,M.、Berglind,N.、Pershagen,G.、Hallqvist,J.、Jonson,T.和Bellander,T.(2006)。长期暴露于城市空气污染和心肌梗死。流行病学383-390.
[61] Rosenlund,M.、Picciotto,S.、Forastiere,F.、Stafoggia,M.和Perucci,C.A.(2008)。交通相关空气污染与冠心病发病率和预后的关系。流行病学121-128.
[62] Rosenlund,M.、Bellander,T.、Nordquist,T.和Alfredsson,L.(2009)。交通造成了空气污染和心肌梗死。流行病学265-271.
[63] Ross,Z.、Ito,K.、Johnson,S.、Yee,M.、Pezeshki,G.、Clougherty,J.E.、Savitz,D.和Matte,T.(2013)。纽约市空气污染物的时空估算:出生结局研究中使用的暴露分配。环境。健康12 51.
[64] Sampson,P.D.、Richards,M.、Szpiro,A.A.、Bergen,S.、Sheppard,L.、Larson,T.V.和Kaufman,J.D.(2013)。使用偏最小二乘回归估计年度的区域化国家通用克里金模型{下午}_流行病学中的浓度。大气。环境。75 383-392. ·doi:10.1016/j.atmosenv.2013.04.015
[65] Sang,H.、Jun,M.和Huang,J.Z.(2011)。大型多元空间数据集的协方差近似及其在多气候模型误差中的应用。附录申请。统计。5 2519-2548. ·Zbl 1234.62071号 ·doi:10.1214/11-AOAS478
[66] Schäfer,F.、Katzfuss,M.和Owhadi,H.(2020年)。Kullback-Leibler最小化稀疏Cholesky因子分解。网址:arXiv:2004.14455·Zbl 07364386号
[67] 辛德勒,D.W.(1988)。酸雨对淡水生态系统的影响。科学类239 149-157.
[68] Seinfeld,J.H.和Pandis,S.N.(2016年)。大气化学与物理:从空气污染到气候变化.威利,纽约。
[69] Snelson,E.和Ghahramani,Z(2007)。局部和全局稀疏高斯过程近似。人工智能与统计11个(AISTATS公司)。
[70] Su,J.G.、Jerrett,M.和Beckerman,B.(2009年)。环境空气污染暴露的土地利用回归模型的距离衰减变量选择策略。科学。总环境。407 3890-3898. ·doi:10.1016/j.scitotenv.2009.01.061
[71] Tadono,T.、Ishida,H.、Oda,F.、Naito,S.、Minakawa,K.和Iwamoto,H.(2014)。ALOS PRISM精确生成全球DEM。ISPRS Ann.照片。遥感空间信息科学。2 71.
[72] Tang,W.,Zhang,L.和Banerjee,S.(2019)。高斯空间过程模型中熔核的可识别性和一致性。可从arXiv:1908.05726获取。
[73] Tibshirani,R.(1996)。通过套索回归收缩和选择。J.罗伊。统计师。Soc.序列号。B类58 267-288. ·Zbl 0850.62538号
[74] 美国环境保护署(1999)。美国环保局技术公告:氮氧化物\[({\text{否}_x})、原因和控制方式。
[75] 美国环境保护署(2016)。氮氧化物综合科学评估(最终报告)。技术报告,EPA/600/R-15/068,美国环境保护署,北卡罗来纳州三角研究公园国家环境评估研究中心。
[76] 美国环境保护署(2017)。2017年国家排放清单。
[77] 美国环境保护署(2019)。空气质量系统预先生成的数据文件。可在https://www.epa.gov/outdoor-air-quality-data/download-daily-data。
[78] Vecchia,A.V.(1988)。连续空间过程的估计和模型识别。J.罗伊。统计师。Soc.序列号。B类50 297-312.
[79] Volk,H.E.、Lurmann,F.、Penfold,B.、Hertz-Picciotto,I.和McConnell,R.(2013)。与交通有关的空气污染、颗粒物和自闭症。JAMA精神病学。70 71-77. ·doi:10.1001/牙买加精神病学2013.266
[80] Weiss,D.J.、Nelson,A.、Gibson,H.S.、Temperey,W.、Peedell,S.、Lieber,A.、Hancher,M.、Poyart,E.、Belchior,S.等人(2018年)。2015年,一张前往城市的旅行时间全球地图,用于评估无障碍方面的不平等。自然553 333.
[81] Wu,H.,Wang,C.和Wu,Z.(2013)。一种新的离散收缩估计器改进了RNA-seq数据中的差异表达检测。生物统计学14 232-243·doi:10.1093/biostatistics/kxs033
[82] Xie,Y.,Xu,L.,Deng,X.,Hong,Y.、Kolivras,K.和Gaines,D.N.(2019年)。空间变量选择及其在弗吉尼亚莱姆病发生中的应用。J.Amer。统计师。协会。114 1466-1480. ·Zbl 1428.62484号 ·doi:10.1080/01621459.2018.1564670
[83] Xu,X.,Ha,S.U.和Basnet,R.(2016)。环境空气污染对神经系统有害影响的流行病学研究综述。前线公共卫生4 157·doi:10.3389/fpubh.2016.0157
[84] Young,M.T.、Bechle,M.J.、Sampson,P.D.、Szpiro,A.A.、Marshall,J.D.、Sheppard,L.和Kaufman,J.D(2016)。基于卫星\[{\text{否}_2}\]并在基于普适克里金和土地利用回归的国家预测模型中进行模型验证。环境。科学。Technol公司。50 3686-3694. ·doi:10.1021/acs.est.5b05099
[85] 张华(2004)。基于模型的地质统计学中的不一致估计和渐近相等插值。J.Amer。统计师。协会。99 250-261. ·Zbl 1089.62538号 ·doi:10.1198/016214500000241
[86] Zilber,D.和Katzfuss,M.(2021年)。大非高斯空间数据广义高斯过程的Vecchia-Laplace近似。计算。统计师。数据分析。153 107081. ·Zbl 1510.62384号 ·doi:10.1016/j.csda.2020.107081
[87] Zou,H.和Hastie,T.(2005)。通过弹性网进行规则化和变量选择。J.R.统计社会服务。B.统计方法。67 301-320 ·Zbl 1069.62054号 ·数字对象标识代码:10.1111/j.1467-9868.2005.0050.x
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。