×

空间计数数据模型的快速贝叶斯估计。 (英语) Zbl 1510.62017年

摘要:空间计数数据模型用于解释和预测不同地理实体(如人口普查区域或路段)中的交通事故等现象的频率。这些模型通常使用贝叶斯-马尔可夫链蒙特卡罗(MCMC)模拟方法进行估计,然而,这些方法计算量大,无法很好地扩展到大型数据集。变分贝叶斯(VB)是一种来自机器学习的方法,它通过将贝叶斯估计转化为优化问题而不是模拟问题来解决MCMC的缺点。考虑到VB的所有这些优点,本文导出了一种VB方法,用于具有不可观测参数异质性和空间相关性的负二项模型的后验推断。采用Pólya-Gamma增强处理负二项似然的非共轭性,并采用变分分布的综合非因式规范捕获后验相关性。蒙特卡洛研究和在纽约市人口普查区估算青年行人伤害人数的实证应用证明了所建议方法的益处。在模拟和实证研究中,VB方法比常规八核处理器上的MCMC快大约45到50倍,同时提供类似的估计和预测精度。在计算资源可用的条件下,可以利用所提出的VB方法令人尴尬的并行体系结构,将其估计速度进一步提高20倍。

MSC公司:

62-08 统计问题的计算方法
2015年1月62日 贝叶斯推断
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 阿布拉莫维茨,M。;Stegun,I.A.,《带公式、图形和数学表的数学函数手册》,第55卷(1948年),美国政府印刷局
[2] Acs,Z.J。;Anselin,L。;Varga,A.,《专利和创新被视为区域新知识生产的衡量标准》,《Res.Policy》,31,7,1069-1085(2002)
[3] Al Mohy,A.H.(阿尔·莫希,A.H.)。;Higham,N.J.,矩阵指数的一种新的缩放和平方算法,SIAM J.矩阵分析。申请。,31, 3, 970-989 (2010) ·兹比尔1194.15021
[4] Anselin,L.,《空间计量经济学:方法和模型》,第4卷(2013年),Springer Science&Business Media
[5] 班纳吉,S。;卡林,B.P。;Gelfand,A.E.,《空间数据的层次建模与分析》(2014),CRC出版社
[6] Bansal,P。;Krueger,R。;比尔莱尔,M。;达齐亚诺,R.A。;Rashidi,T.H.,混合多项式logit模型的贝叶斯估计:进展和基于模拟的评估,Transp。B号决议,131124-142(2020年)
[7] Besag,J.,《晶格系统的空间相互作用和统计分析》,J.R.Stat.Soc.Ser。B统计方法。,36, 2, 192-225 (1974) ·Zbl 0327.60067号
[8] Bivand,R.S。;Gómez-Rubio,V。;Rue,H.,空间计量经济学模型的近似贝叶斯推断,Spat。统计,9,146-165(2014)
[9] 布莱,D.M。;Kucukelbir,A。;McAuliffe,J.D.,《变分推断:统计学家评论》,J.Am.Stat.Assoc.,112,518,859-877(2017)
[10] 布朗,M。;McAuliffe,J.,离散选择大规模模型的变分推理,J.Amer。统计师。协会,105,489,324-335(2010)·Zbl 1397.62103号
[11] 卡斯特罗,M。;巴列蒂,R。;Bhat,C.R.,计数数据模型的潜在变量表示法,以适应空间和时间相关性:应用于预测十字路口的交通事故频率。决议B,46,1,253-272(2012)
[12] Dawid,A.P。;Sebastiani,P.,最佳实验设计的相干色散准则,Ann.Statist。,65-81 (1999) ·Zbl 0948.62057号
[13] Dormann,C.F.,《将空间自相关纳入物种分布数据分析的影响》,全球。经济。生物地理学。,16, 2, 129-138 (2007)
[14] 多尔曼,C.F。;麦克弗森,J.M。;Araújo,M.B。;Bivand,R。;Bolliger,J。;卡尔·G。;戴维斯,R.G。;Hirzel,A。;Jetz,W。;Kissling,D.W。;库恩,I。;奥勒米勒,R。;佩雷斯-内托,P.R。;Reineking,B。;施罗德,B。;舒尔,F.M。;Wilson,R.,《物种分布数据分析中空间自相关的解释方法:综述》,《生态地理学》,30,5,609-628(2007)
[15] 杜兰特,D。;Rigon,T.,逻辑模型的条件共轭平均场变分Bayes,Statist。科学。,34, 3, 472-485 (2019) ·Zbl 1429.62318号
[16] Gelman,A。;Rubin,D.B.,《使用多序列的迭代模拟推断》,《统计科学》。,7, 4, 457-472 (1992) ·Zbl 1386.65060号
[17] 佐丹奴,R。;布罗德里克,T。;Jordan,M.I.,协方差、稳健性和变分贝叶斯,J.Mach。学习。1981-2029年第19号决议(2018年)·Zbl 1467.62043号
[18] Glaser,S.,《计数数据的空间计量模型评论技术报告》(2017年),霍亨海姆商业、经济和社会科学讨论论文
[19] Gneiting,T。;Raftery,A.E.,《严格正确的评分规则、预测和估计》,《美国统计协会期刊》,第102、477、359-378页(2007年)·Zbl 1284.62093号
[20] R.P.海宁。;Li,G.,《利用时空数据进行回归建模:贝叶斯方法》(2020),CRC出版社·Zbl 1446.62002号
[21] 韩,S。;廖,X。;Carin,L.,集成非因式变分推理,(神经信息处理系统进展(2013)),2481-2489
[22] 医学博士霍夫曼。;布莱,D.M。;王,C。;佩斯利,J.,《随机变分推断》,J.马赫。学习。研究,14,1,1303-1347(2013)·兹伯利1317.68163
[23] 黄,A。;Wand,M.P.,协方差矩阵的简单非信息先验分布,贝叶斯分析。,8, 2, 439-452 (2013) ·Zbl 1329.62135号
[24] M.I.乔丹。;加赫拉马尼,Z。;Jaakkola,T.S。;Saul,L.K.,图形模型变分方法简介,马赫。学习。,37, 2, 183-233 (1999) ·Zbl 0945.68164号
[25] 约旦,A。;Krüger,F。;Lerch,S.,用评分规则评估概率预测,J.Stat.Softw。,90,1,1-37(2019)
[26] 卡比萨,S。;邓森,D.B。;Morris,J.S.,高维相关数据的在线变分贝叶斯推断,J.Compute。图表。统计人员。,25, 2, 426-444 (2016)
[27] Klami,A.,2015年。因子模型的Polya-gamma增强。参加:亚洲机器学习会议。第112-128页。
[28] Knowles,D.A。;Minka,T.,多项式和二元回归的非共轭变分信息传递,(神经信息处理系统进展(2011)),1701-1709
[29] LeSage,J.P。;Pace,R.K.,《矩阵指数空间规范》,《计量经济学杂志》,140,1,190-214(2007)·Zbl 1418.62295号
[30] Linderman,S。;亚当斯·R·P。;Pillow,J.W.,从多神经元记录中发现贝叶斯潜伏结构,(神经信息处理系统进展(2016)),2002-2010
[31] Linderman,S。;约翰逊,M.J。;Adams,R.P.,《依赖多项式模型变得容易:通过Pólya-Gamma增强实现突破》,(神经信息处理系统进展(2015)),3456-3464
[32] Linderman,S.W。;Miller,A.C。;亚当斯·R·P。;布莱,D.M。;帕宁斯基,L。;Johnson,M.J.,递归切换线性动力系统(2016),arXiv预印本arXiv:1610.08466
[33] Luts,J。;Wand,M.P.,计数响应半参数回归的变分推断,贝叶斯分析。,10, 4, 991-1023 (2015) ·Zbl 1335.62054号
[34] 礼仪,F.L。;Shankar,V。;Bhat,C.R.,《未观察到的异质性和公路事故数据的统计分析》,Ana。方法Accid。第11号决议,第1-16号决议(2016年)
[35] Marshall,R.J.,《疾病空间模式统计分析方法综述》,J.R.Stat.Soc.A,154,32421-441(1991)·Zbl 1002.62512号
[36] Matheson,J.E。;Winkler,R.L.,《连续概率分布的评分规则》,管理。科学。,22, 10, 1087-1096 (1976) ·兹伯利0349.62080
[37] 莫里斯,M。;惠勒-马丁,K。;D.辛普森。;穆尼,S.J。;Gelman,A。;DiMaggio,C.,《贝叶斯层次空间模型:在斯坦·斯帕特实施贝萨格-约克-莫利模型》。斯帕特-流行病温度。,31,第100301条pp.(2019)
[38] Narayanamoorthy,S。;巴列蒂,R。;Bhat,C.R.,《关于自行车和行人伤害的空间依赖性(按严重程度计算)》,交通部。决议B,55,245-264(2013)
[39] Ormerod,J.T。;Wand,M.P.,解释变分近似,Amer。统计人员。,64, 2, 140-153 (2010) ·Zbl 1200.65007号
[40] 帕克,M。;Foulds,J。;乔杜里,K。;Welling,M.,《私人环境中的变异贝叶斯(vips)》(2016),arXiv预印本arXiv:1611.00340·Zbl 1452.62986号
[41] 新几内亚波尔森。;斯科特·J·G。;Windle,J.,使用Pólya-Gamma潜在变量对逻辑模型进行贝叶斯推断,美国统计协会,108,504,1339-1349(2013)·Zbl 1283.62055号
[42] 任奇。;班纳吉,S。;芬利,A.O。;Hodges,J.S.,空间数据分析的变分贝叶斯方法,计算。统计数据分析。,55, 12, 3197-3217 (2011) ·Zbl 1271.62113号
[43] Rey,S.J。;Anselin,L.,PySAL:空间分析方法的python库,(应用空间分析手册(2010),Springer),175-193
[44] Roberts,G.O。;Gelman,A。;Gilks,W.R.,随机游走Metropolis算法的弱收敛性和最优缩放,Ann.Appl。概率。,7, 1, 110-120 (1997) ·Zbl 0876.60015号
[45] 罗西,体育。;艾伦比,G.M。;McCulloch,R.,《贝叶斯统计与营销》(2012),John Wiley&Sons
[46] Salimans,T。;Knowles,D.A.,通过随机线性回归的固定形式变分后验近似,贝叶斯分析。,8, 4, 837-882 (2013) ·兹比尔1329.62142
[47] 西蒙斯,P。;Natário,I.,《计数数据的空间经济计量方法:概述和新方向》,《国际经济杂志》。管理。工程,10,1,348-357(2016)
[48] 施特劳斯,M.E。;Mezzetti,M。;Leorato,S.,矩阵指数规范是否适用于空间相关结构的建模?,小争吵。Stat.,20,221-243(2017)
[49] Tan,L.S。;Nott,D.J.,使用部分非中心参数化的广义线性混合模型的变分推理,Statist。科学。,28, 2, 168-188 (2013) ·Zbl 1331.62167号
[50] 美国人口普查局,L.S.,2012-2016年美国社区调查五年预测(2020年)
[51] Ver Hoef,J.M。;彼得森,E.E。;Hooten,M.B。;Hanks,E.M。;Fortin,M.-J.,《生态数据统计推断的空间自回归模型》,Ecol。专著,88,1,36-59(2018)
[52] Wakefield,J.,疾病绘图和计数数据的空间回归,生物统计学,8,2,158-183(2007)·Zbl 1213.62178号
[53] 王,C。;Blei,D.M.,非共轭模型中的变分推理,J.Mach。学习。决议,1005-1031年4月14日(2013年)·Zbl 1320.62057号
[54] 魏伟(Wei,W.)。;Held,L.,计数数据校准测试,Test,23,4,787-805(2014)·Zbl 1312.62119号
[55] Wenzel,F.、Galy-Fajou,T.、Donner,C.、Kloft,M.、Opper,M.,2019年。使用Pólya-Gamma数据增强的高效高斯过程分类。摘自:AAAI人工智能会议记录,第33卷。第5417-5424页。
[56] Whittle,P.,《论飞机的静止过程》,《生物统计学》,434-449(1954)·Zbl 0058.35601号
[57] 温德尔,J。;新几内亚波尔森。;Scott,J.G.,《抽样Pólya-Gamma随机变量:替代和近似技术》(2014),arXiv预印本arXiv:1405.0506
[58] Wu,G.,高斯数据空间经济计量模型的快速可扩展变分贝叶斯估计,Spat。统计,24,32-53(2018)
[59] 周,M。;李,L。;邓森,D。;Carin,L.,Lognormal和gamma混合负二项回归,(机器学习国际会议论文集,2012年(2012年),NIH公共访问),1343
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。