×

使用基本图形Lasso对海量高多元非平稳空间数据进行建模。 (英语) Zbl 07792631号

摘要:我们提出了一个新的高度多元空间过程建模框架,该框架综合了近期多尺度和光谱方法的思想,并使用图形模型。基本图形套索将一个单变量高斯过程写成一个基函数的线性组合,基函数与高斯图形向量的条目加权,该图形是通过优化一个(ell_1)惩罚似然来估计的。本文将此设置扩展到多元高斯过程,其中基函数用高斯图形向量加权。我们建立了一个模型,其中基函数表示不同的分辨率级别,并且假设每个级别的图形向量是独立的。使用正交基在空间位置的数量、基函数的数量和实现的数量方面赋予线性复杂性和内存使用。额外的融合惩罚鼓励在多级图形模型中使用简约的条件独立结构。我们在国家大气研究中心的社区大气模型的大型气候集合上说明了我们的方法,该模型涉及40个空间过程。本文的补充材料可在网上获得。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Alegria,A。;波丘,E。;富勒,R。;Mateu,J.,“地球上方多元高斯场随时间演化的协方差函数”,《随机环境研究与风险评估》,第33期,第1593-1608页(2019年)·doi:10.1007/s00477-019-01707-w
[2] 阿帕纳索维奇,T。;Genton,M.G.,“基于潜在维度的多元随机场的交叉协方差函数”,《生物特征》,97,15-30(2010)·Zbl 1183.62164号 ·doi:10.1093/biomet/asp078
[3] 阿帕纳索维奇,T.V。;Genton,M.G。;Sun,Y.,“具有任意分量的多元随机场的交叉协方差函数的有效Matérn类”,美国统计协会杂志,107,180-193(2012)·Zbl 1261.62087号 ·doi:10.1080/01621459.2011.643197
[4] 贝克,A.H。;哈姆林,D.M。;利维,M.N。;Xu,H。;丹尼斯·J·M。;伊顿,B.E。;J.爱德华兹。;Hannay,C。;Mickelson,S.A。;Neale,R.B。;Nychka,D。;肖伦伯格,J。;Tribbia,J。;Vertenstein,M。;Williamson,D.,“社区地球系统模型新的基于集合的一致性测试(pyCECT v1.0)”,地球科学模型开发,2829-2840(2015)·doi:10.5194/gmd-8-2829-2015年
[5] 布拉德利,J.R。;Holan,S.H。;Wikle,C.K.,“应用于纵向雇主-家庭动态的高维区域数据的多维时空模型”,《应用统计年鉴》,91761-1791(2015)·Zbl 1397.62356号 ·doi:10.1214/15-AOAS862
[6] 布拉德利,J.R。;霍兰,S.H。;Wikle,C.K.,“高维数值数据的计算效率多元时空模型”(含讨论),贝叶斯分析,13,253-310(2018)·Zbl 1392.62148号 ·doi:10.1214/17-BA1069
[7] 布鲁因斯马,W.P。;佩里姆,E。;Tebbutt,W。;霍斯金,J.S。;索林,A。;Turner,R.E.,“多输出高斯过程中的可缩放精确推断”(2020)
[8] Calder,C.A.,“多变量时空数据的动态因子过程卷积模型及其在空气质量评估中的应用,环境和生态统计,14,229-247(2007)·doi:10.1007/s10651-007-0019-y
[9] Chen,W。;Genton,M.G。;Sun,Y.,“时空协方差结构与模型”,《统计及其应用年鉴》,第8期,第191-215页(2021年)·doi:10.1146/annurev-statistics-042720-115603
[10] 北卡罗来纳州克雷西。;Zammit-Mangion,A.,“多元空间协方差模型:条件方法”,《生物统计学》,103,915-935(2016)·Zbl 1506.62297号 ·doi:10.1093/biomet/asw045
[11] Danaher,P。;王,P。;Witten,D.M.,“多类逆协方差估计的联合图形Lasso”,《皇家统计学会杂志》,B辑,76,373-397(2014)·Zbl 07555455号 ·doi:10.1111/rssb.12033
[12] Datta,A。;班纳吉,S。;芬利,A.O。;Gelfand,A.E.,“大型地质统计数据集的层次最近邻高斯过程模型”,美国统计协会杂志,111800-812(2016)·doi:10.1080/01621459.2015.1044091
[13] 戴伊·D。;Datta,A。;Banerjee,S.,“高多元空间数据的图形高斯过程模型”,Biometrika,109993-1014(2021)·Zbl 07638097号 ·doi:10.1093/biomet/asab061
[14] 戴伊·D。;Datta,A。;Banerjee,S.,“关于图形高斯过程和函数高斯图形模型之间的关系”,(2022)
[15] Ekanayaka,A。;Kang,E。;Kalmus,P。;Braverman,A.,“利用多元基图形拉索对模型投影进行统计降尺度”(2022)
[16] 伊林,V。;Bony,S。;Meehl,G.A。;高级,C.A。;史蒂文斯,B。;斯托弗·R·J。;Taylor,K.E.,“耦合模型相互比较项目第6阶段(CMIP6)实验设计和组织概述,地球科学模型开发,1937-1958年9月(2016年)·doi:10.5194/gmd-9-1937-2016年
[17] Fattahi,S。;张瑞云。;Sojoudi,S.,“学习大型稀疏图形模型的线性时间算法”,IEEE Access,712658-12672(2019)·doi:10.1109/ACCESS.2018.2890583
[18] Fontanella,L。;Fontanella,S。;伊格纳科洛,R。;伊波利蒂,L。;瓦伦蒂尼,P。;Aneiros,G。;霍洛娃,I。;胡什科娃,M。;Vieu,P.,功能和高维统计及相关领域,功能数据的G-Lasso网络分析,91-98(2020),Cham:Springer,Cham·Zbl 1444.62152号
[19] 弗里德曼,J。;哈斯蒂,T。;Tibshirani,R.,“用图形拉索进行稀疏逆协方差估计”,生物统计学,9,432-441(2008)·Zbl 1143.62076号 ·doi:10.1093/biostatistics/kxm045
[20] 富勒,R。;Genton,M.G.,“高多元空间数据的聚合-编译”,《生物统计》,98,615-631(2011)·Zbl 1230.62127号 ·doi:10.1093/biomet/asr029
[21] Gaspari,G。;Cohn,S.E.,“二维和三维相关函数的构建”,《皇家气象学会季刊》,125723-757(1999)·doi:10.1002/qj.49712555417
[22] Gelfand,A.E。;施密特,A.M。;班纳吉,S。;Sirmans,C.F.,“通过空间变化的区域化进行非平稳多变量过程建模”,《测试》,第13期,第263-312页(2004年)·Zbl 1069.62074号 ·doi:10.1007/BF02595775
[23] Genton,M.G。;Kleiber,W.,“多元地质统计学的交叉协方差函数”,《统计科学》,第30期,第147-163页(2015年)·Zbl 1332.86010号 ·doi:10.1214/14-STS487
[24] Gneiting,T。;克莱伯,W。;Schlather,M.,“多变量随机场的Matérn交叉协方差函数”,《美国统计协会杂志》,1051167-1177(2010)·Zbl 1390.62194号 ·doi:10.1198/jasa.2010.tm09420
[25] 戈拉德,M。;Voltz,M.,“线性区域化模型:估计和选择交叉向量矩阵的工具”,《数学地质学》,24269-286(1992)·doi:10.1007/BF00893750
[26] 吉尼斯,J.,“多元时空数据的非参数谱方法”,《多元分析杂志》,187104823(2022)·兹比尔1480.62097 ·doi:10.1016/j.jmv.2021.104823
[27] Harville,D.A.,《统计学家视角下的矩阵代数》(1997),纽约:Springer-Verlag出版社,纽约·Zbl 0881.15001号 ·数字对象标识代码:10.1007/b98818
[28] 谢长杰。;迪伦,I.S。;Ravikumar,P.K。;贝克尔,S。;Olsen,P.A.,“QUIC&DIRTY:脏统计模型的二次近似方法,神经信息处理系统进展,272006-2014(2014)
[29] 谢长杰。;Sustik,硕士。;迪伦,I.S。;Ravikumar,P.,“QUIC:稀疏逆协方差估计的二次近似”,《机器学习研究杂志》,第15期,第2911-2947页(2014年)·Zbl 1319.65048号
[30] 伊波利蒂,L。;瓦伦蒂尼,P。;Gamerman,D.,“耦合时空环境变量的时空建模”,《皇家统计学会杂志》,C辑,61175-200(2012)·文件编号:10.1111/j.1467-9876.2011.01011.x
[31] Jun,M.,“全球多元过程的非平稳交叉协方差模型”,《斯堪的纳维亚统计杂志》,38,726-747(2011)·Zbl 1246.91113号 ·doi:10.1111/j.1467-9469.2011.00751.x
[32] Kleiber,W.,“多元随机场的相干性”,《统计学》,27,1675-1697(2017)·Zbl 1392.62285号 ·doi:10.5705/ss.202015.0309
[33] 克莱伯,W。;Genton,M.G.,“存在掘金效应时的空间变化交叉相关系数”,《生物统计学》,100213-220(2013)·Zbl 1284.62591号 ·doi:10.1093/biomet/ass057
[34] 克莱伯,W。;Nychka,D.,“多元空间过程的非平稳建模”,《多元分析杂志》,112,76-91(2012)·Zbl 1273.62235号 ·doi:10.1016/j.jmva.2012.05.011
[35] 克莱伯,W。;Nychka,D。;Bandyopadhyay,S.,“大型多元空间数据集的模型”,《中国统计》,第29期,第1085-1104页(2019年)·Zbl 1421.62063号 ·doi:10.5705/ss.202017.0365
[36] 克莱伯,W。;Porcu,E.,“非平稳矩阵协方差:紧支持、长程依赖和准算术构造”,《随机环境研究与风险评估》,29,193-204(2014)·doi:10.1007/s00477-014-0867-6
[37] Krock,M。;克莱伯,W。;Becker,S.,“通过基本图形套索对空间数据进行稀疏性非平稳建模”,《计算与图形统计杂志》,30,375-389(2021)·Zbl 07499873号 ·doi:10.1080/10618600.2020.1811103
[38] Le,N.D。;Zidek,J.V.,《环境时空过程的统计分析》(2006年),《斯普林格:斯普林格,统计学丛书》,纽约:斯普林格,斯普林格·兹比尔1102.62126
[39] 刘,H。;丁,J。;谢,X。;蒋,X。;Zhao,Y。;Wang,X.,“具有核心区域化神经嵌入的可扩展多任务高斯过程”,(2021)
[40] Majumdar,A。;Gelfand,A.E.,“使用卷积协方差函数对地质统计数据进行多元空间建模”,《数学地球科学》,39,225-245(2007)·Zbl 1126.86007号 ·doi:10.1007/s11004-006-9072-6
[41] Majumdar,A。;保罗·D。;Bautista,D.,“多元非平稳空间过程的广义卷积模型”,《统计学》,20675-695(2010)·Zbl 1187.62153号
[42] 孟·R。;Lee,H。;Bouchard,K.,结构化高斯过程回归网络的随机坍塌变分推断,arXiv:机器学习(2021)
[43] 孟·R。;索珀,B。;香港李。;刘五星。;Greene,J.D。;Ray,P.,“电子健康记录的非平稳多元高斯过程”,《生物医学信息学杂志》,117103698(2021)·doi:10.1016/j.jbi.2021.103698
[44] Nychka,D。;Bandyopadhyay,S。;哈姆林,D。;林格伦,F。;Sain,S.,“分析大型空间数据集的多分辨率高斯过程模型”,《计算与图形统计杂志》,24579-599(2015)·doi:10.1080/10618600.2014.914946
[45] Pollice,A。;Jona Lasinio,G.,“高环境风险地区空气质量分析的多元方法”,环境计量学,21741-754(2010)·doi:10.1002/env.1059
[46] 波丘,E。;富勒,R。;Nychka,D.,“时空协方差函数的30年”,《威利跨学科评论:计算统计学》,13,e1512(2020)
[47] 卡迪尔,G.A。;尤安,C。;Sun,Y.,“多元随机场交叉协方差函数中变量非对称性的灵活建模”,《农业、生物和环境统计杂志》,26,1-22(2021)·Zbl 07603051号 ·doi:10.1007/s13253-020-00414-2
[48] 卡迪尔,G.A。;Sun,Y.,“多元随机场交叉协方差函数的半参数估计”,《生物统计学》,77,547-560(2020)·Zbl 1520.62309号 ·doi:10.1111/biom.13323
[49] 乔,X。;郭,S。;James,G.M.,“函数图形模型”,《美国统计协会杂志》,114,211-222(2019)·Zbl 1478.62123号 ·doi:10.1080/01621459.2017.1390466
[50] H街。;Held,L.,《高斯马尔可夫随机场:理论与应用》(统计学和应用概率专著)(2005年),纽约:查普曼和霍尔/CRC,纽约·邮编1093.60003
[51] Salvaña,M。;阿卜杜拉,S。;黄,H。;Ltaief,H。;孙,Y。;根顿,M.M。;Keyes,D.,“Manycore系统的高性能多变量地理空间统计”,IEEE并行和分布式系统汇刊,327719-2733(2021)·doi:10.1109/TPDS.2021.3071423
[52] Salvaña,M.L.O。;Genton,M.G.,“多元时空随机场的非平稳交叉协方差函数”,《空间统计》,37,100411(2020)·doi:10.1016/j.spasta.2020.100411
[53] 施密特,A.M。;Gelfand,A.E.,“多元污染物数据的贝叶斯区域化方法”,《地球物理研究杂志:大气》,108(2003)·doi:10.1029/2002JD002905
[54] 沙迪克,G。;Wakefield,J.,“多站点每日多变量污染物数据建模”,《皇家统计学会期刊》,C辑,51,351-372(2002)·Zbl 1111.62376号 ·数字对象标识代码:10.1111/1467-9876.00273
[55] Stein,M.L.,《空间数据插值:克里金的一些理论》(1999),纽约:Springer-Verlag出版社,纽约·Zbl 0924.62100号
[56] Stein,M.L.,“空间数据协方差矩阵低秩近似的限制”,《空间统计》,8,1-19(2014)·doi:10.1016/j.spasta.2013.06.003
[57] 泰勒-罗德里格斯,D。;芬利,A。;Datta,A。;Babcock,C。;Andersen,H。;库克,B。;莫顿,D。;Banerjee,S.,“高维和大空间数据的空间因子模型:在森林变量制图中的应用”,《统计》,29,1155-1180(2019)·Zbl 1421.62161号 ·doi:10.5705/ss.202018.0005
[58] Teh,Y.、Seeger,M.W.和Jordan,M.I.(2005),《半参数潜在因素模型》,AISTATS。
[59] Titsias,M.,“稀疏高斯过程中诱导变量的变分学习,5567-574(2009)
[60] 提提亚斯,M。;劳伦斯,N.D。;Teh,Y.W。;Titterington,M.,《第十三届国际人工智能与统计会议论文集》,9,贝叶斯-高斯过程潜在变量模型,844-851(2010),撒丁岛恰拉古纳度假村:意大利:PMLR,恰拉古那度假村,撒丁
[61] Ver Hoef,J.M。;Barry,R.P.,“协方差和多变量空间预测模型的构建与拟合”,《统计规划与推断杂志》,69,275-294(1998)·兹伯利0935.62110 ·doi:10.1016/S0378-3758(97)00162-6
[62] Vu,Q。;Zammit-Mangion,A。;Cressie,N.,《通过变形建模非平稳和非对称多元空间协方差》,arXiv:统计学(2020)·Zbl 07601229号
[63] Wackernagel,H.,《多元地质统计学:应用简介》(2003),柏林-海德堡:施普林格出版社·兹比尔1015.62128
[64] Wikle,C.K.,《空间统计学手册》,空间过程的低秩表示,107-118(2010),博卡拉顿:Chapman&Hall/CRC,博卡拉顿
[65] Yang,S。;卢,Z。;沈,X。;Wonka,P。;Ye,J.,“融合多个图形套索”,SIAM优化杂志,25,916-943(2015)·Zbl 1320.90055 ·数字对象标识代码:10.1137/130936397
[66] 扎帕塔,J。;哦,S.Y。;Petersen,A.,“多元高斯过程的部分可分性和函数图形模型”,Biometrika,109665-681(2021)·Zbl 07582645号 ·doi:10.1093/biomet/asab046
[67] 张,L。;Banerjee,S.,“空间因素建模:错位数据的贝叶斯矩阵正态方法”,生物计量学,109665-681(2021)·Zbl 1520.62400 ·doi:10.1111/biom.13452
[68] 张,L。;班纳吉,S。;Finley,A.O.,“高维多元地质统计学:贝叶斯矩阵正态方法”,环境计量,32,e2675(2021)·doi:10.1002/env.2675
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。