×

Bayesian组Lasso用于混淆的空间数据。 (英语) Zbl 1373.62561号

摘要:空间过程的广义线性混合模型在应用统计学中应用广泛。在空间广义线性混合模型(SGLMM)的许多应用中,目标是获得回归系数的推断,同时获得最佳预测能力。在实施SGLMM时,协变量之间的多重共线性和空间随机效应会使计算变得困难,并影响推理。我们提出了一种贝叶斯群套索先验算法,该算法具有一个单一的调整参数,可用于优化SGLMM的预测能力,并联合正则化回归系数和空间随机效应。我们使用高效的马尔可夫链蒙特卡罗(MCMC)算法实现了群套索SGLMM,并演示了如何将协变量之间的多重共线性和空间随机效应监测为导出量。为了测试我们的方法,我们使用模拟数据和来自植物生态学和疾病生态学的两个示例比较了SGLMM的几个参数化。在所有示例中,都会出现问题级别的多重共线性,并影响采样效率和推断。我们发现,组套索先验导致回归系数MCMC样本的有效样本量大约是有效样本量的两倍,并且与标准SGLMM相比,基于样本外数据的变量预测精度可以更高或更低。

MSC公司:

62页第12页 统计学在环境和相关主题中的应用
62H11型 定向数据;空间统计学
2015年1月62日 贝叶斯推断
62J07型 山脊回归;收缩估计器(拉索)

软件:

R(右)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Banerjee,S.、Gelfand,A.、Finley,A.和Sang,H.(2008)。用于大型空间数据集的高斯预测过程模型。《皇家统计学会杂志》,B辑70,825-848·Zbl 05563371号
[2] Bhattacharya,A.、Pati,D.、Pillai,N.S.和Dunson,D.B.(2015)。Dirichlet laplace priors可实现最佳收缩。《美国统计协会杂志》110,1479-1490·Zbl 1373.62368号 ·doi:10.1080/01621459.2014.960967
[3] Clayton,D.G.、Bernardinelli,L.和Montomoli,C.(1993)。生态分析中的空间相关性。《国际流行病学杂志》22,1193-1202·doi:10.1093/ije/22.6.1193
[4] Cressie,N.和Wikle,C.(2011年)。时空数据统计。新泽西州霍博肯:John Wiley&Sons·Zbl 1273.62017年
[5] Diggle,P.J.、Tawn,J.和Moyeed,R.(1998年)。基于模型的地质统计学。英国皇家统计学会杂志,C辑47,299-350·Zbl 0904.62119号 ·数字对象标识代码:10.1111/1467-9876.00113
[6] Evans,T.S.、Kirchgessner,M.S.、Eyler,B.、Ryan,C.W.和Walter,W.D.(2016)。栖息地影响白尾鹿慢性消瘦病的分布。《野生动物管理杂志》80,284-291·doi:10.1002/jwmg.1004
[7] Gelman,A.、Hwang,J.和Vehtari,A.(2014)。了解贝叶斯模型的预测信息标准。统计与计算24997-1016·Zbl 1332.62090号 ·doi:10.1007/s11222-013-9416-2
[8] Givens,G.H.和Hoeting,J.A.(2012年)。计算统计。新泽西州霍博肯:John Wiley&Sons·Zbl 1267.62003号 ·doi:10.1002/9781118555552
[9] Gotway,C.A.和Stroup,W.W.(1997)。空间数据分析和预测的广义线性模型方法。农业、生物和环境统计杂志2,157-178·doi:10.2307/1400401
[10] Gunes,F.和Bondell,H.D.(2012年)。一种用于变量选择调优的置信域方法。《计算与图形统计学杂志》21295-314·doi:10.1080/10618600.2012.679890
[11] Hanks,E.M.、Schliep,E.M..、Hooten,M.B.和Hoeting,J.A.(2015)。实践中的受限空间回归:地质统计模型、混淆和模型错误指定下的稳健性。环境计量26,243-254·Zbl 1525.62132号 ·doi:10.1002/env.2331
[12] Hefley,T.J.、Broms K.M.、Brost B.M.、Buderman,F.E.、Kay,S.L.、Scharf J.R.、Williams,P.J.和Hooten,M.B.(2016)。生态数据自相关建模的基函数方法。生态学。doi:10.1002/ecy.1674
[13] Hefley,T.J.和Hooten,M.B.(2016年)。层次物种分布模型。当前景观生态学报告187-97·Zbl 1172.62032号
[14] Higdon,D.(2002年)。使用过程卷积的空间和时空建模。当前环境问题的定量方法3754·Zbl 1255.86016号 ·doi:10.1007/978-1-4471-0657-9_2
[15] Hodges,J.S.和Reich,B.J.(2010年)。添加空间相关的错误可能会破坏你喜欢的固定效果。美国统计学家64,325-334·Zbl 1217.62095号 ·doi:10.1198/tast.2010.10052
[16] Hoerl,A.E.和Kennard,R.W.(1970年)。岭回归:非正交问题的有偏估计。技术计量学12,55-67·Zbl 0202.17205号 ·doi:10.1080/0401706.1970.10488634
[17] Homer,C.G.,Dewitz,J.A.,Yang,L.,Jin,S.,Danielson,P.,Xian,G.等人(2015)。完成2011年相邻美国国家土地覆盖数据库——代表了十年的土地覆盖变化信息。摄影测量工程和遥感81、345-354。
[18] Hooten,M.B.、Hanks,E.M.、Johnson,D.S.和Alldredge,M.W.(2013年)。协调资源利用和资源选择功能。《动物生态学杂志》82,1146-1154·doi:10.1111/1365-2656.12080
[19] Hooten,M.B.和Hobbs,N.T.(2015)。生态学家贝叶斯模型选择指南。《生态学专著》83,3-28·数字对象标识代码:10.1890/14-0661.1
[20] Hooten,M.B.、Larsen,D.R.和Wikle,C.K.(2003)。使用层次贝叶斯模型预测大区域地面植物的空间分布。景观生态学18,487-502·doi:10.1023/A:1026001008598
[21] Hsu,N.、Chang,Y.和Huang,H.(2012)。非平稳时空协方差估计的群套索方法。环境计量学23,12-23。
[22] Huang,H.、Hsu,N.、Theobald,D.M.和Breidt,F.J.(2010年)。空间套索在GIS模型选择中的应用。计算与图形统计杂志1963-983·doi:10.1198/jcgs.2010.07102
[23] Hughes,J.和Haran,M.(2013)。空间广义线性混合模型的降维和消除混淆。英国皇家统计学会杂志,B辑75,139-159·Zbl 07555442号 ·doi:10.1111/j.1467-9868.2012.01041.x
[24] Hui,F.、Müller,S.和Welsh,A.(2016)。基于正则化PQL的混合模型联合选择。美国统计协会杂志doi:10.1080/01621459.2016.1215989
[25] Kyung,M.、Gill,J.、Ghosh,M.和Casella,G.(2010年)。惩罚回归、标准误差和贝叶斯套索。贝叶斯分析5369-411·Zbl 1330.62289号 ·doi:10.1214/10-BA607
[26] Mallick,H.和Yi,N.(2013年)。高维线性模型的贝叶斯方法。生物计量与生物统计学杂志S1005。
[27] Murakami,D.和Griffith,D.A.(2015)。特征向量空间滤波中的随机效应规范:模拟研究。地理系统杂志17,311-331·doi:10.1007/s10109-015-0213-7
[28] Paciorek,C.(2010年)。尺度对空间混杂偏差和空间回归估计精度的重要性。统计科学25107-125·Zbl 1328.62596号 ·doi:10.1214/10-STS326
[29] Park,T.和Casella,G.(2008年)。贝叶斯套索。《美国统计协会杂志》103,681-686·Zbl 1330.62292号 ·doi:10.1198/016214500000037
[30] R核心团队(2015)。R: 统计计算语言和环境。R统计计算基金会,奥地利维也纳。
[31] Reich,B.J.、Hodges,J.S.和Zadnik,V.(2006)。残差平滑对疾病映射模型中固定效应后验的影响。生物计量学621197-1206·Zbl 1114.62124号 ·文件编号:10.1111/j.1541-0420.2006.00617.x
[32] Schabenberger,O.和Gotway,C.A.(2004)。空间数据分析的统计方法。佛罗里达州博卡拉顿:查普曼和霍尔/CRC出版社·Zbl 1068.6206号
[33] Schmidt,A.M.、Rodríguez,M.A.和Capistrano,E.S.(2015)。椭圆栖息地等高线沿线的人口数量:使用非平稳空间结构的泊松-正态混合进行分层建模。应用统计年鉴9,1372-1393·Zbl 1454.62396号 ·doi:10.1214/15-AOAS838
[34] Stroup,W.W.(2012)。广义线性混合模型:现代概念、方法和应用。佛罗里达州博卡拉顿:CRC出版社·Zbl 1281.62013年
[35] Tibshirani,R.(1996)。通过套索回归收缩和选择。英国皇家统计学会杂志,B辑58,267-288·Zbl 0850.62538号
[36] Waller,L.A.和Gotway,C.A.(2004年)。公共卫生数据应用空间统计。新泽西州霍博肯:John Wiley&Sons·Zbl 1057.62106号 ·doi:10.1002/0471662682
[37] Walter,D.W.、Walsh,D.P.、Farnsworth,M.L.、Winkelman,D.L.和Miller,M.W.(2011)。土壤粘土含量是朊病毒感染几率的基础。《自然通讯》2200。
[38] Wikle,C.K.(2010年)。《空间统计学手册》中空间过程的低秩表示。107-118. 佛罗里达州博卡拉顿:CRC出版社。
[39] Williams,E.S.、Miller,M.W.、Kreeger,T.J.、Kahn,R.H.和Thorne,E.T.(2002)。鹿和麋鹿的慢性消耗性疾病:管理建议综述。《野生动物管理杂志》3,551-563·doi:10.2307/3803123
[40] Zhu,J.、Huang,H.和Reyes,P.(2010)。关于格点数据的空间线性模型的选择。英国皇家统计学会期刊,B系列72,389-402·Zbl 1411.62275号 ·文件编号:10.1111/j.1467-9868.2010.00739.x
[41] Zhu,Z.和Liu,Y.(2009)。使用惩罚似然和加权L1惩罚估计空间协方差。非参数统计杂志21925-942·Zbl 1172.62032号 ·doi:10.1080/10485250903023632
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。