×

高维计值数据的计算效率多元时空模型(与讨论)。 (英语) Zbl 1392.62148号

摘要:我们介绍了一种计算效率高的贝叶斯模型,用于预测高维相关的计值数据。在这种情况下,带有潜在高斯过程模型的泊松数据模型已成为事实模型。然而,此模型在高维设置中很难使用,因为在高维环境中,数据可能会根据不同的变量、地理区域和时间制成表格。这些计算上的困难进一步加剧了,因为人们认识到,计数值数据本质上是非高斯的。因此,在贝叶斯推断中,当前的许多方法都需要仔细校准马尔可夫链蒙特卡罗(MCMC)技术。我们通过开发新的共轭多元分布来避免需要调整的MCMC方法。具体来说,我们引入了多元对数伽马分布,并提供了独立感兴趣的大量方法学发展,包括:关于条件分布的结果、边缘分布、与多元正态分布的渐近关系,以及吉布斯采样器的全条件分布。为了合并变量、区域和时间点之间的相关性,使用了多元时空混合效应模型(MSTM)。为了证明我们的方法,我们使用了从美国人口普查局的纵向雇主-家庭动态(LEHD)计划中获得的数据。特别是,我们的方法是由LEHD的季度劳动力指标(QWI)推动的,该指标是对美国重要经济变量的当前估计。

理学硕士:

62H11型 定向数据;空间统计学
62页第12页 统计在环境和相关主题中的应用
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Abowd,J.、Schneider,M.和Vilhuber,L.(2013)。“贝叶斯和线性混合模型估计的差异隐私应用”,《隐私与保密杂志》,5:73-105。
[2] Abowd,J.、Stephens,B.、Vilhuber,L.、Andersson,F.、McKinney,K.、Roemer,M.和Woodcock,S.(2009年)。“LEHD基础设施文件和季度劳动力指标的创建”,摘自Dunne,T.、Jensen,J.和Roberts,M.(编辑),《生产者动态:微观数据的新证据》,149-230。芝加哥:芝加哥大学国家经济研究局出版社。
[3] Anderson,T.(1958)。多元统计分析导论。加拿大:威利父子公司·Zbl 0083.14601号
[4] Bernardoff,P.(2006年)。“哪些多元伽马分布是无限可分的?”伯努利,12:169-189·Zbl 1101.60008号
[5] Bradley,J.R.、Cressie,N.和Shi,T.(2014)。“当数据集可能非常大时,空间预测因子的比较”,《统计调查》,10:100-131·Zbl 1347.62083号
[6] Bradley,J.R.、Holan,S.H.和Wikle,C.K.(2015)。“高维区域数据的多元时空模型及其在纵向雇主-家庭动态中的应用”,《应用统计年鉴》,9:1761-1791·兹比尔1397.62356
[7] Bradley,J.R.、Holan,S.H.和Wikle,C.K.(2017年)。“补充材料:高维数值数据的计算效率多维时空模型”,贝叶斯分析·Zbl 1392.62148号
[8] Clayton,D.、Bernardinelli,L.和Montomoli,C.(1993)。“生态分析中的空间相关性”,《国际流行病学杂志》,6:1193-1202。
[9] Cressie,N.和Johannesson,G.(2008年)。“超大空间数据集的固定秩克里金法”,《皇家统计学会期刊》,B辑,70:209-226·Zbl 05563351号
[10] Cressie,N.和Wikle,C.K.(2011年)。时空数据统计。新泽西州霍博肯:威利·Zbl 1273.62017年
[11] Crooks,G.(2015)。《阿莫罗索分布》,arXiv预印本:1005.3274·Zbl 1338.22005年
[12] Daniels,M.、Zhou,Z.和Zou,H.(2006)。“多元过程的条件指定时空模型”,《计算与图形统计杂志》,15:157-177。
[13] De Oliveira,V.(2003)。“关于变换高斯随机场相关结构的注记”,《澳大利亚和新西兰统计杂志》,45:353-66·Zbl 1064.62100号
[14] De Oliveira,V.(2013年)。“空间计数数据的层次泊松模型”,《多元分析杂志》,122:393-408·Zbl 1354.60036号
[15] Demirhan,H.和Hamurkaroglu,C.(2011年)。“关于多元log-gamma分布及其在贝叶斯分析中的应用”,《统计规划与推断杂志》,141:1141-1152·Zbl 1206.62098号
[16] Diggle,P.J.、Tawn,J.A.和Moyeed,R.A.(1998年)。“基于模型的地质统计学”,《皇家统计学会杂志》,C辑,47:299-350·Zbl 0904.62119号
[17] Garg,S.、Singh,A.和Ramos,F.(2012年)。《学习环境监测的非平稳时空模型》,载于第二十六届AAAI人工智能会议论文集。
[18] Gelfand,A.和Vounatsou,P.(2003)。“空间数据分析的适当多元条件自回归模型”,《生物统计学》,4:11-15·兹比尔1142.62393
[19] Gelfand,A.E.和Schliep,E.M.(2016)。“空间统计和高斯过程:美好的婚姻”,《空间统计》,18:86-104。
[20] Gelfand,A.E.和Smith,A.(2007年)。《疾病绘图和计数数据的空间回归》,《生物统计学》,8:158-183·Zbl 1213.62178号
[21] Gelman,A.和Rubin,D.(1992年)。“使用多序列的迭代模拟推断”,《统计科学》,7:473-511·Zbl 1386.65060号
[22] Gong,L.和Flegal,J.M.(2016)。“高维马尔可夫链蒙特卡罗的实用顺序停止规则”,《计算与图形统计杂志》,25:684-700。
[23] Griffith,D.(2000)。“空间自相关问题的线性回归解决方案”,《地理系统杂志》,2:141-156。
[24] Griffith,D.(2002)。“自动泊松模型的空间滤波规范”,《统计与概率快报》,58:245-251·Zbl 1045.62050号
[25] Griffith,D.(2004)。“自动逻辑模型的空间滤波规范”,《环境与规划A》,36:1791-1811。
[26] Griffiths,R.C.(1984年)。“无限可分多元伽马分布的特征”,《多元分析杂志》,15:13-20·Zbl 0549.60017号
[27] Hodges,J.S.和Reich,B.J.(2011)。“添加空间相关的错误会破坏你喜欢的固定效果。”《美国统计学家》,64:325-334·Zbl 1217.62095号
[28] Holan,S.H.和Wikle,C.K.(2016)。“离散值时空数据的分层动态广义线性混合模型”,摘自《离散值时间序列手册》。R.A.Davis、S.H.Holan、R.Lund和N.Ravishanker(编辑)。CRC出版社。
[29] Huang,H.C.和Hsu,N.J.(2004)。“使用非平稳时空模型模拟地面臭氧的传输效应”,《环境计量学》,15:251-268。
[30] Hughes,J.和Haran,M.(2013)。“空间广义线性混合模型的降维和混淆缓解”,《皇家统计学会杂志》,B辑,75:139-159·Zbl 07555442号
[31] Jin,X.、Banerjee,S.和Carlin,B.(2007年)。“应用于多种疾病绘图的无序共区域化晶格模型”,《皇家统计学会期刊》B辑,69:817-838·Zbl 07555376号
[32] Johnson,R.和Wichern,D.(1999)。应用多元统计分析,第三版。新泽西州恩格尔伍德克利夫斯:普伦蒂斯·霍尔公司·Zbl 1269.62044号
[33] Jones,G.、Haran,M.、Caffe,B.和Neath,R.(2006年)。“马尔可夫链蒙特卡罗固定宽度输出分析”,《美国统计协会期刊》,101:1537-1547·Zbl 1171.62316号
[34] Kass,R.E.、Carlin,B.P.和Neal,R.M.(2016)。“实践中的马尔可夫链蒙特卡罗:圆桌讨论”,《美国统计学家》,52:93-100。
[35] Kotz,S.、Balakrishnan,N.和Johnson,N.(2000年)。连续多元分布,第1卷:模型与应用。纽约州纽约市:Wiley·Zbl 0946.62001号
[36] Lawson,A.B.(2006年)。空间流行病学统计方法,第2版。。纽约州纽约市:Wiley·Zbl 1096.62118号
[37] Lee,Y.和Nelder,J.(1974)。“带讨论的双层广义线性模型”,《应用统计学》,55:129-185·Zbl 1490.62198号
[38] Lee,Y.和Nelder,J.A.(2000年)。“用于分析相关非正态数据的HGLMs”。在伯利恒,J.G.和van der Heijden,P.G.M.(编辑),COMPSTAT:计算统计学论文集,第14届研讨会,荷兰乌得勒支,2000年,97-107。荷兰乌得勒支·Zbl 1455.62146号
[39] Lee,Y.和Nelder,J.A.(2001)。“建模和分析相关非正态数据”,《统计建模》,1:3-16·Zbl 1004.62080号
[40] Liu,J.S.(2008)。科学计算中的蒙特卡罗策略。纽约州纽约市:斯普林格·兹比尔1132.65003
[41] Lohr,S.(1999)。取样设计和分析。美国加利福尼亚州太平洋格罗夫:布鲁克斯/科尔出版公司·Zbl 0967.62005年
[42] Ma,C.(2002)。“混合物生成的时空协方差函数”,《数学地质学》,34:965-975·Zbl 1032.86006号
[43] Moran,P.A.P.(1950)。“连续随机现象的注释”,《生物特征》,37:17-23·Zbl 0041.45702号
[44] Moran,P.A.P.和Vere-Jones,D.(1969年)。“多元伽马分布的无限可分性”,Sankhya著。A系列,40:393-398·Zbl 0186.51602号
[45] Neal,R.M.(2011)。“使用哈密顿动力学的MCMC”,Brooks,S.,Gelman,A.,Jones,G.L.和Meng,X.(编辑),《马尔可夫链蒙特卡罗手册》,113-160。查普曼和霍尔·Zbl 1229.65018号
[46] Nieto-Barajas,L.E.和Huerta,G.(2017年)。“重尾数据的时空帕累托模型”,《空间统计》,20:92-109。
[47] Prentice,R.(1974)。“对数-伽马模型及其最大似然估计”,《生物统计学》,61:539-544·Zbl 0295.62034号
[48] Quick,H.、Holan,S.H.和Wikle,C.K.(2015)。“零和一:在中风死亡率应用程序中抑制敏感计数数据中的零的案例。”统计,4:227-234。
[49] Reich,B.J.、Hodges,J.S.和Zadnik,V.(2006)。“残余平滑对疾病映射模型中固定效应后验的影响”,《生物统计学》,62:1197-1206·Zbl 1114.62124号
[50] Robert,C.P.和Casella,G.(2013)。蒙特卡洛统计方法。纽约州纽约市:斯普林格·Zbl 1096.62003年
[51] Roberts,G.(1996)。“与抽样算法相关的马尔可夫链概念。”Gilks,W.,Richardson,S.和Spiegelhalter,D.(编辑),《马尔可夫链蒙特卡罗实践》,45-57。查普曼和霍尔,博卡拉顿·Zbl 0839.62078号
[52] Royle,J.A.和Wikle,C.K.(2005)。“鸟类计数数据的有效统计制图”,《环境与生态统计》,12:225-243。
[53] Rue,H.、Martino,S.和Chopin,N.(2009年)。“使用集成嵌套拉普拉斯近似对潜在高斯模型进行近似贝叶斯推断”,《皇家统计学会杂志》,B辑,71:319-392·Zbl 1248.62156号 ·doi:10.1111/j.1467-9868.2008.00700.x
[54] Sigrist,F.、Kunsch,H.R.和Stehel,W.A.(2011年)。“短期降水预测的动态非平稳时空模型”,《应用统计年鉴》,6:1452-1477·Zbl 1257.62121号
[55] Spiegelhalter,D.J.、Best,N.G.、Carlin,B.P.和Van Der Linde,A.(2002)。“模型复杂度和拟合度的贝叶斯度量”,《皇家统计学会期刊》,B辑,64:583-616·Zbl 1067.62010年
[56] Vats,D.、Flegal,J.M.和Jones,G.L.(2016)。《马尔可夫链蒙特卡罗的多元输出分析》,arXiv预印本:1512.07713·Zbl 1434.62100号
[57] Vere-Jones,D.(1967年)。“二元伽马分布的无限可分性。”Sankhya。系列A,29:421-422·Zbl 1204.60023号
[58] Wikle,C.K.和Anderson,C.J.(2003年)。“使用分层贝叶斯时空模型对龙卷风报告计数的血清学分析”,《地球物理研究与大气杂志》,108:9005。
[59] Wikle,C.K.、Milliff,R.F.、Nychka,D.和Berliner,L.M.(2001)。《热带海面风时空分层贝叶斯建模》,美国统计协会期刊(理论与方法),96:382-397·Zbl 1022.62117号
[60] Wolpert,R.和Ickstadt,K.(1998年)。“空间统计的泊松/伽马随机场模型”,《生物统计学》,85:251-267·Zbl 0951.62082号
[61] Wu,G.、Holan,S.H.和Wikle,C.K.(2013)。“具有动态分散的分层贝叶斯时空康威-麦克斯韦-泊松模型”,《农业、生物和环境统计杂志》,18:335-356·Zbl 1303.62100号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。