×

自然指数族相依数据的共轭全条件分布贝叶斯层次模型。 (英语) 兹比尔1453.62411

摘要:我们介绍了一种贝叶斯方法,用于分析(可能)根据自然指数分布族的成员分布的高维相关数据。这个问题需要广泛的方法改进,因为联合建模高维相关数据会导致所谓的“大问题”。当考虑到非高斯数据模型时,“大问题”的计算复杂性会进一步加剧,就像这里的情况一样。因此,我们为这种设置开发了新的计算效率高的分布理论。特别地,我们引入了“共轭多元分布”,它是由Diaconis和Ylvisaker分布驱动的。此外,我们提供了大量的理论和方法发展,包括:关于条件分布的结果,与多元正态分布的渐近关系,共轭先验分布,以及吉布斯采样器的全条件分布。为了证明该方法的广泛适用性,我们分别基于流行病学数据集、联邦统计数据集和环境数据集提供了两个模拟研究和三个应用程序。

理学硕士:

2015年1月62日 贝叶斯推断
62兰特 大数据和数据科学的统计方面
60J22型 马尔可夫链中的计算方法
62E20型 统计学中的渐近分布理论
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 班纳吉,S。;卡林,B.P。;Gelfand,A.E.,《空间数据的层次建模与分析》(2015),英国伦敦:查普曼和霍尔出版社,英国伦敦·Zbl 1358.62009号
[2] 班纳吉,S。;Gelfand,A.E。;芬利,A.O。;Sang,H.,“大型空间数据集的高斯预测过程模型”,《皇家统计学会杂志》,B辑,70825-848(2008)·兹伯利05563371 ·文件编号:10.1111/j.1467-9868.2008.00663.x
[3] 贝茨,D。;Maechler,M。;Bolker,B。;Walker,S。;Christensen,R.H.B。;辛格曼,G。;戴,B。;格罗森迪克,G。;Green,P.,“包‘lme4’”(2017)
[4] 布拉德利,J.R。;北卡罗来纳州克雷西。;Shi,T.,2011年联合统计会议记录,“空间随机效应模型中秩和基函数的选择”,3393-3406(2011),弗吉尼亚州亚历山大市:美国统计协会,弗吉尼亚州亚历山德里亚
[5] 布拉德利,J.R。;北卡罗来纳州克雷西。;Shi,T.,“数据集可能非常大时空间预测值的比较”,《统计调查》,第10期,第100-131页(2016年)·Zbl 1347.62083号 ·doi:10.1214/16-SS115
[6] 布拉德利,J。;霍兰,S。;Wikle,C.,“应用于纵向雇主-家庭动态的高维区域数据的多维时空模型”,《应用统计年鉴》,91761-1791(2015)·兹比尔1397.62356 ·doi:10.1214/15-AOAS862
[7] 布拉德利,J。;霍兰,S。;Wikle,C.,“高维相关计值数据贝叶斯推断的计算效率分布理论”(含讨论),《贝叶斯分析》,第13期,第253-310页(2018年)·Zbl 1392.62148号 ·doi:10.1214/17-BA1069
[8] 布拉德利,J。;威克尔,C。;Holan,S.,“支持计值调查数据的贝叶斯空间变化”,《美国统计协会杂志》,111472-487(2016)·doi:10.1080/01621459.2015.1117471
[9] 布拉德利,J。;威克尔,C。;Holan,S.,“使用空间聚集误差标准对多尺度空间过程进行区域化”,《皇家统计学会杂志》,B辑,79,815-832(2017)·Zbl 1411.86007号 ·doi:10.1111/rssb.12179
[10] 卡斯特鲁西奥,S。;Ombao,H。;Genton,M.G.,“功能磁共振成像数据中大脑激活和连接的可扩展多分辨率时空模型”,arXiv编号1602.02435(2016)·Zbl 1414.62435号
[11] Chen,M.H。;易卜拉欣,J.G.,“广义线性模型的共轭先验”,《统计学》,第13期,第461-476页(2003年)·Zbl 1015.62074号
[12] 陈,Z。;邓森,D.B.,“线性混合模型中的随机效应选择”,生物计量学,59762-769(2003)·兹比尔1214.62027 ·doi:10.1111/j.0006-341X.2003.0089.x
[13] 康威,R.W。;Maxwell,W.L.,《服务率依赖于州的排队模型》,《美国统计协会杂志》,第12期,第132-136页(1962年)
[14] Cox,T.F.,《多元数据分析导论》(2005),伦敦:Hodder Arnold出版社,伦敦·兹比尔1096.62052
[15] 北卡罗来纳州克雷西。;Johannesson,G.,澳大利亚科学院Elizabeth和Frederick White会议,“海量数据集的空间预测”,1-11(2006),澳大利亚科学学院:澳大利亚科学院,堪培拉
[16] 北卡罗来纳州克雷西。;Johannesson,G.,“超大空间数据集的固定秩克里格”,《皇家统计学会杂志》,B辑,70209-226(2008)·Zbl 05563351号 ·doi:10.1111/j.1467-9868.2007.00633.x
[17] 北卡罗来纳州克雷西。;Shi,T。;Kang,E.L.,“时空数据的固定秩滤波”,《计算与图形统计杂志》,19724-745(2010)·doi:10.1198/jcgs.2010.09051
[18] 北卡罗来纳州克雷西。;Shi,T。;Kang,E.L.,“利用时间变异性改进卫星数据的空间制图”,《加拿大统计杂志》,38,271-289(2010)·兹比尔1349.62568 ·doi:10.1002/cjs.10063
[19] 北卡罗来纳州克雷西。;Wikle,C.K.,《时空数据统计》(2011),新泽西州霍博肯:新泽西州威利·Zbl 1273.62017年
[20] Daniell,P.J.,“无穷维积分”,《数学年鉴》,第20期,第281-288页(1919年)·doi:10.2307/1967122
[21] 丹尼尔斯,M.J。;Pourahmadi,M.,“纵向数据中协方差矩阵的动态模型和贝叶斯分析”,Biometrika,89553-566(2002)·Zbl 1036.62019年 ·doi:10.1093/biomet/89.3.553
[22] De Oliveira,V.,“空间计数数据的层次泊松模型”,《多元分析杂志》,122393-408(2013)·Zbl 1354.60036号 ·doi:10.1016/j.jmva.2013.08.015
[23] Demirhan,H。;Hamurkaroglu,C.,“关于多元对数伽马分布和分布在贝叶斯分析中的应用”,《统计规划与推断杂志》,1411141-1152(2011)·Zbl 1206.62098号 ·doi:10.1016/j.jspi.2010.09.015
[24] Diaconis,P。;Ylvisaker,D.,“指数族的共轭先验”,《统计年鉴》,17,269-281(1979)·Zbl 0405.62011号 ·doi:10.1214/aos/1176344611
[25] Diggle,P.J。;Tawn,J.A。;Moyeed,R.A.,“基于模型的地质统计学”,《皇家统计学会杂志》,C辑,47,299-350(1998)·Zbl 0904.62119号 ·数字对象标识代码:10.1111/1467-9876.00113
[26] 多诺霍,D。;Johnstone,I.,“通过小波收缩实现理想的空间自适应”,《生物统计学》,第81期,第425-455页(1994年)·Zbl 0815.62019号 ·doi:10.1093/biomet/81.3.425
[27] 埃夫隆,B。;哈斯蒂,T。;约翰斯通,I。;Tibshirani,R.,“最小角度回归”,《统计年鉴》,32499(2004)·Zbl 1091.62054号 ·doi:10.1214/009053604000000067
[28] 埃弗里特,B。;Hothorn,T.,《R应用多元分析导论》(2011),纽约:Springer,纽约·Zbl 1306.62010年
[29] 芬利,A.O。;Sang,H。;班纳吉,S。;Gelfand,A.E.,“提高大型数据集预测过程建模的性能”,计算统计学和数据分析,532873-2884(2009)·Zbl 1453.62090号 ·doi:10.1016/j.csda.2008.09.008
[30] Frühwirth-Schnatter,S。;Wagner,H.,“用于参数驱动的计数时间序列模型的辅助混合采样及其在状态空间建模中的应用”,Biometrika,93,827-841(2006)·Zbl 1436.62421号 ·doi:10.1093/biomet/93.4.827
[31] Gelfand,A.E。;Schliep,E.M.,“空间统计和高斯过程:美丽的婚姻”,《空间统计》,第18期,第86-104页(2016年)·doi:10.1016/j.spasta.2016.03.006
[32] Gelman,A.,“层次模型中方差参数的先验分布”,贝叶斯分析,1515-533(2006)·Zbl 1331.62139号 ·doi:10.1214/06-BA117A
[33] 盖尔曼,A。;卡林,J.B。;斯特恩,H.S。;邓森,D.B。;Vehtari,A。;Rubin,D.B.,《贝叶斯数据分析》(2013),佛罗里达州博卡拉顿:查普曼和霍尔/CRC,佛罗里达州波卡拉顿
[34] Hadfield,J.,“‘MCMCglmm’包”(2016)
[35] 哈斯蒂,T。;Tibshirani,R。;Friedman,J.,《统计学习的要素:数据挖掘、推断和预测》(2009),纽约:施普林格出版社,纽约·Zbl 1273.62005年
[36] Henao,R.G.,“功能数据的地质统计分析(2009)
[37] Hodges,J.,《富参数化线性模型:使用随机效应的加法、时间序列和空间模型》(2013),佛罗里达州博卡拉顿:查普曼和霍尔/CRC,佛罗里达州波卡拉顿
[38] Holan,S.H。;Wikle,C.K。;戴维斯,R.A。;Holan,S.H。;伦德,R。;N.,Ravishanker,《离散值时间序列手册》,离散值时空数据的层次动态广义线性混合模型(2016),佛罗里达州博卡拉顿:CRC出版社,佛罗里达州波卡拉顿
[39] Hooten,M.B。;拉森,D.R。;Wikle,C.K.,“使用层次贝叶斯模型预测大区域地面植物的空间分布”,《景观生态学》,18,487-502(2003)
[40] 胡,G。;Bradley,J.R.,“具有潜在多元对数-伽马随机效应的贝叶斯时空模型及其在地震震级中的应用”,Stat,7,e179(2018)·doi:10.1002/sta4.179
[41] 黄,H。;Sun,Y.,“大型空间数据集可能性的层次低秩近似”,《计算与图形统计杂志》,27,110-118(2003)·Zbl 07498971号 ·doi:10.1080/10618600.2017.1356324
[42] Jolliffe,I.T.,主成分分析(2002),纽约:Springer Verlag,纽约·Zbl 1011.62064号
[43] Kang,E.L。;Cressie,N.,“空间随机效应模型的贝叶斯推断”,《美国统计协会杂志》,106972-983(2011)·Zbl 1229.62008号 ·doi:10.1198/jasa.2011.tm09680
[44] Katzfuss,M。;Cressie,N.,“海量遥感数据集的时空平滑和EM估计”,《时间序列分析杂志》,第32期,第430-446页(2011年)·Zbl 1294.62119号 ·doi:10.1111/j.1467-9892.2011-00732.x
[45] Katzfuss,M。;Cressie,N.,“超大数据集的贝叶斯层次时空平滑”,《环境计量》,第23期,第94-107页(2012年)·doi:10.1002/env.1147
[46] 科尔莫戈罗夫,A.N.,《瓦尔申里奇基茨雷克农的格伦德贝格里夫》(1933),柏林:施普林格,柏林
[47] 科茨,S。;Balakrishnan,N。;Johnson,N.,连续多元分布,1(2000),纽约:Wiley,纽约·Zbl 0946.62001号
[48] Lambert,D.,“零膨胀泊松回归,及其在制造缺陷中的应用”,《技术计量学》,34,1-14(2006)·Zbl 0850.62756号 ·doi:10.2307/1269547
[49] 兰格,K。;Papp,J.C。;辛希默,J.S。;Sobel,E.M.,“下一代统计遗传学:高维数据中的建模、惩罚和优化”,《统计学及其应用年度评论》,1279-300(2014)·doi:10.1146/annurev-statistics-022513-115638
[50] Lee,Y。;Nelder,J.A.,“双层次广义线性模型及其讨论”,应用统计学,55129-185(1974)·Zbl 1490.62198号
[51] Lee,Y。;Nelder,J.A.,“层次广义线性模型”(含讨论),《皇家统计学会杂志》,B辑,58619-678(1996)·Zbl 0880.62076号 ·doi:10.1111/j.2517-6161.1996.tb02105.x
[52] Lee,Y。;Nelder,J.A.,97-107(2000)
[53] Lee,Y。;Nelder,J.A.,“相关非正态数据的建模与分析”,《统计建模》,第1期,第3-16页(2001年)·Zbl 1004.62080号 ·doi:10.1177/1471082X0100100102
[54] 莱曼,E。;Casella,G.,《点估计理论》(1998),纽约:Springer,纽约·Zbl 0916.62017号
[55] Lesnoff,M。;拉瓦尔,G。;阀盖,P。;Abdicho,S。;Workalemahu,A。;Kifle,D。;Peyraud,A。;兰斯洛特,R。;Thiaucourt,F.,“埃塞俄比亚高地传染性牛胸膜肺炎的羊群传播”,预防兽医,64,27-40(2004)·doi:10.1016/j.provetmed.2004.03.005
[56] Liu,J.S.,“贝叶斯计算中的坍塌吉布斯采样器及其在基因调控问题中的应用”,美国统计协会杂志,89958-966(1994)·Zbl 0804.62033号 ·doi:10.1080/01621459.1994.10476829
[57] 马特洛夫,N。;Buhlmann,P。;德里尼亚斯,P。;凯恩,M。;van der Laan,M.,《大数据手册》,“大数据中的Big-n与Big-p”,21-31(2016),佛罗里达州博卡拉顿:查普曼和霍尔,佛罗里达州波卡拉顿
[58] 尼尔·R·M。;布鲁克斯,S。;盖尔曼,A。;Jones,G.L。;Meng,X.,《马尔可夫链蒙特卡罗手册》,“使用哈密顿动力学的MCMC,113-160(2011),佛罗里达州博卡拉顿:查普曼和霍尔,佛罗里达州波卡拉顿·Zbl 1218.65001号
[59] 尼托·巴拉哈斯,L.E。;Huerta,G.,“重尾数据的时空帕累托模型”,空间统计,2092-109(2017)·doi:10.1016/j.spasta.2017.02.003
[60] Nychka,D.W。;Schmiek,M.G.,《平滑与回归:方法、计算与应用》(修订版),《空间过程估计作为平滑器》,393-424(2001),纽约:威利出版社,纽约
[61] 奥哈拉,R.B。;Sillanpaa,M.J.,“贝叶斯变量选择方法综述:什么、如何和哪个”,贝叶斯分析,4,85-118(2009)·Zbl 1330.62291号
[62] Pourahmadi,M。;丹尼尔斯,M.J。;Park,T.,“几个协方差矩阵的Cholesky分解的同时建模”,《多元分析杂志》,98,568-587(2007)·Zbl 1107.62043号 ·doi:10.1016/j.jmva.2005.11.002
[63] Ravishanker,N。;Dey,D.K.,线性模型理论第一课程(2002),佛罗里达州博卡拉顿:查普曼和霍尔/CRC,佛罗里达州波卡拉顿·Zbl 1015.62067号
[64] H街。;马蒂诺,S。;肖邦,N.,“使用积分嵌套拉普拉斯近似对潜在高斯模型的近似贝叶斯推断”,《皇家统计学会杂志》,B辑,71,319-392(2009)·Zbl 1248.62156号 ·doi:10.1111/j.1467-9868.2008.00700.x
[65] Sengupta,A。;北卡罗来纳州克雷西。;弗雷,R。;Kahn,B.,联合统计会议记录,“使用空间随机效应模型对MODIS云数据进行统计建模”,3111-3123(2012),弗吉尼亚州亚历山大市:美国统计协会,弗吉尼亚州亚历山德里亚
[66] Shi,T。;Cressie,N.,“MISR气溶胶数据的全球统计分析:来自NASA Terra卫星的海量数据产品”,环境计量学,18665-680(2007)·doi:10.1002/env.864
[67] 孙,Y。;李,B。;波丘,E。;蒙特罗,J.M。;Schlather,M.,与环境问题相关的时空过程和挑战,大型数据集的地统计学,55-77(2012),柏林,海德堡:施普林格,柏林,海德堡
[68] Torrieri,N.,“美国正在变化,人口普查也是如此:美国社区调查”,《美国统计学家》,第61期,第16-21页(2007年)·doi:10.1198/000313007X169037
[69] Wahba,G.,观测数据的样条模型(1990),宾夕法尼亚州费城:工业和应用数学学会,宾夕法尼亚州,费城·Zbl 0813.62001号
[70] Wikle,C.K。;Gelfand,A.E。;Diggle,P.J。;Fuentes,M。;Guttorp,P.,《空间统计手册,空间过程的低秩表示》,107-118(2010),佛罗里达州博卡拉顿:查普曼和霍尔/CRC出版社,佛罗里达州波卡拉顿·Zbl 1188.62284号
[71] Wikle,C.K。;Anderson,C.J.,《使用分层贝叶斯时空模型对龙卷风报告计数的气候学分析》,《地球物理研究杂志-大气》,1089005(2003)
[72] Wikle,C.K。;Cressie,N.,“时空卡尔曼滤波的降维方法”,《生物统计学》,86815-829(1999)·Zbl 0942.62114号 ·doi:10.1093/生物技术/86.4815
[73] Wilson,A。;Reich,B.J.,“通过惩罚可信区域进行混淆选择”,《生物统计学》,70,852-861(2014)·兹比尔1393.62107 ·doi:10.1111/biom.12203
[74] Wolpert,R。;Ickstadt,K.,“空间统计的泊松/伽马随机场模型”,《生物特征》,85,251-267(1998)·Zbl 0951.62082号 ·doi:10.1093/biomet/85.2.251
[75] Wu,G。;Holan,S.H。;Wikle,C.K.,“动态分散的分层贝叶斯时空Conway-Maxwell Poisson模型”,《农业、生物和环境统计杂志》,18,335-356(2013)·Zbl 1303.62100号 ·doi:10.1007/s13253-013-0141-2
[76] Yang,R。;Berger,J.,“使用参考先验估计协方差矩阵”,《统计年鉴》,221195-1211(1994)·Zbl 0819.62013号 ·doi:10.1214/aos/1176325625
[77] 张,L。;Guindani,M。;Vannucci,M.,“功能磁共振成像数据分析的贝叶斯模型”,《威利跨学科评论:计算统计》,7,21-41(2015)·doi:10.1002/wics.1339
[78] 周,M。;Carin,L.,“负二项过程计数和混合建模”,IEEE模式分析和机器智能汇刊,37,307-320(2015)·doi:10.1109/TPAMI.2013.211
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。