×

高斯copula回归模型的贝叶斯变量选择。 (英语) Zbl 07499903号

摘要:我们开发了一种新的贝叶斯方法,用于在具有不同类型的多重响应的回归模型中选择重要的预测因子。稀疏高斯copula回归模型用于解释离散和/或连续响应的任意组合之间的多元相关性及其与一组预测因子的关联。我们使用数据增强策略的参数扩展来构造马尔可夫链蒙特卡罗算法来估计模型的参数和潜在变量。基于高斯潜在变量的中心参数化,我们设计了一个固定维的建议分布来联合更新重要预测因子的潜在二进制向量和相应的非零回归系数。对于高斯响应和可以建模为高斯响应的依赖版本的结果,该建议导致Metropolis-Hastings步骤,该步骤允许有效探索预测者的模型空间。该策略在模拟数据上进行了测试,并应用于由低强度计数、二进制、有序和连续变量组成的真实数据集。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 艾伯特·J·H。;Chib,S.,“二进制和多光子响应数据的贝叶斯分析”,《美国统计协会杂志》,88,669-679(1993)·Zbl 0774.62031号 ·doi:10.1080/01621459.1993.10476321
[2] Bhadra,A。;Rao,A。;Baladadayuthapani,V.,“非正常和混合离散成分基因组数据中的推断网络结构,生物统计学,74,185-195(2018)·Zbl 1415.62085号 ·doi:10.1111/biom.12711
[3] 伯恩,L。;Caron,F.,“可分解图中的贝叶斯聚类,贝叶斯分析,6829-846(2011)·Zbl 1330.62244号 ·doi:10.1214/11-BA630
[4] Bottolo,L.公司。;Richardson,S.,“贝叶斯模型探索的进化随机搜索,贝叶斯分析,583-618(2010)·兹比尔1330.90042 ·doi:10.1214/10-BA523
[5] 博韦,D.S。;Held,L.,“广义线性模型的超g先验,贝叶斯分析,6387-410(2011)·Zbl 1330.62058号
[6] 布鲁克斯,S.P。;朱迪奇,P。;Roberts,G.O.,“可逆跳马尔可夫链蒙特卡罗建议分布的有效构造”,《皇家统计学会杂志》,B辑,65,3-39(2003)·Zbl 1063.62120号 ·doi:10.1111/1467-9868.03711
[7] Brown,P.J。;Vannucci,M。;Fearn,T.,“多元贝叶斯变量选择和预测,皇家统计学会杂志,B辑,60627-641(1998)·Zbl 0909.62022号 ·doi:10.1111/1467-9868.00144
[8] 卡斯特罗,M。;巴列蒂,R。;Bhat,C.R.,“适应时空相关性的计数数据模型的潜在变量表示:在预测交叉口交通事故频率中的应用,交通研究B-方法,46,253-272(2012)·doi:10.1016/j.trb.2011.09.007
[9] Chib,S。;Greenberg,E.,“多变量Probit模型分析,生物统计学,85,347-361(1998)·Zbl 0938.62020号 ·doi:10.1093/biomet/85.2.347
[10] 戴维斯,G。;Lam,M。;哈里斯·S·E。;Trampush,J.W。;卢西亚诺,M。;Hill,W.,“对300486名个体的研究确定了148个影响一般认知功能的独立遗传位点,自然传播,92098(2018)
[11] Dawid,A.P。;Lauritzen,S.L.,“可分解图形模型统计分析中的超马尔可夫定律,统计年鉴,211272-1317(1993)·Zbl 0815.62038号 ·doi:10.1214/aos/1176349260
[12] Dellaportas,P。;福斯特·J·J。;Ntzoufras,I.,“使用MCMC的贝叶斯模型和变量选择,统计计算,12,27-36(2002)·兹比尔1247.62086
[13] 南卡罗来纳州德斯潘德。;罗奇科娃,V。;George,E.I.,“用多变量尖峰和板拉索同时选择变量和协方差,计算与图形统计杂志,28,1-11(2019)·Zbl 07499036号 ·doi:10.1080/10618600.2019.1593179
[14] 德沃扎克,M。;Wagner,H.,“漏报计数数据的稀疏贝叶斯建模,统计建模,16,24-46(2016)·兹比尔07259008 ·doi:10.1177/1471082X15588398
[15] 福斯特·J·J。;吉尔,R.C。;Overstall,A.M.,“广义线性模型和广义线性混合模型的可逆跳跃方法,统计计算,22,107-120(2012)·兹比尔1322.62195 ·doi:10.1007/s11222-010-9210-3
[16] Frühwirth-Schnatter,S。;Frühwirth,R。;赫尔德,L。;Rue,H.,“非高斯数据层次模型的改进辅助混合抽样,统计计算,19479-492(2009)·数字对象标识代码:10.1007/s11222-008-9109-4
[17] Gehman,L.T。;斯托伊洛夫,P。;马奎尔,J。;Damianov,A。;林,C.-H。;Shiue,L。;阿瑞斯。,小M;莫迪,I。;Black,D.L.,“剪接调节器RBFOX1(A2BP1)控制哺乳动物大脑中的神经元兴奋,自然遗传学,43,706(2011)·doi:10.1038/ng.841
[18] E.I.乔治。;McCulloch,R.E.,“贝叶斯变量选择方法”,《中国统计》,第7339-373页(1997年)·Zbl 0884.62031号
[19] Gneiting,T。;Raftery,A.E.,“严格正确的评分规则、预测和估计”,《美国统计协会杂志》,102,359-378(2007)·Zbl 1284.62093号 ·doi:10.1198/0162145000001437
[20] Green,P.J.,“可逆跳马尔可夫链蒙特卡罗计算和贝叶斯模型确定,生物医学,82111-732(1995)·Zbl 0861.62023号 ·doi:10.1093/biomet/82.4.711
[21] 关,Y。;Stephens,M.,“基因组关联研究和其他大规模问题的贝叶斯变量选择回归,应用统计年鉴,51780-1815(2011)·Zbl 1229.62145号 ·doi:10.1214/11-AOAS455
[22] 汉斯,C。;多布拉,A。;West,M.,“用枪随机搜索“大p”回归,美国统计协会杂志,102507-516(2007)·Zbl 1134.62398号 ·doi:10.1198/0162145000000121
[23] Hoff,P.D.,“扩展半参数Copula估计的秩似然,应用统计学年鉴,1265-283(2007)·邮编1129.62050
[24] 霍姆斯,C。;Denison,D.T。;Mallick,B.,“看似无关回归中模型不确定性的解释”,《计算与图形统计杂志》,第11期,第533-551页(2002年)·doi:10.1198/106186002475
[25] C.C.福尔摩斯。;Held,L.,“二元和多项式回归的贝叶斯辅助变量模型,贝叶斯分析,1145-168(2006)·Zbl 1331.62142号 ·doi:10.1214/06-BA105
[26] 约翰逊,M.R。;Shkura,K。;兰利,S.R。;Delahaye-Duriez,A。;斯利瓦斯塔瓦,P。;David Hill,W.,“系统遗传学确定认知和神经发育疾病的聚合基因网络”,《自然神经科学》,19,223-232(2016)·doi:10.1038/nn.4205
[27] 科恩,R。;史密斯,M。;Chan,D.,“使用基函数线性组合的非参数回归,统计计算,11313-322(2001)
[28] Lamnisos博士。;格里芬,J.E。;Steel,M.F.,“变量多于观测值的分类问题中贝叶斯变量选择的跨维抽样算法”,《计算与图形统计杂志》,18,592-612(2009)·doi:10.1198/jcgs.2009.08027
[29] Lauritzen,S.L.,《图形模型》(1996),牛津:克拉伦登出版社,牛津·Zbl 0907.62001
[30] Lenkoski,A.,“G-Wishart变量的直接采样器,统计学,2119-128(2013)·doi:10.1002/sta4.23
[31] 梁,F。;保罗,R。;莫利纳,G。;克莱德,医学硕士。;Berger,J.O.,“贝叶斯变量选择的g-Priors混合,美国统计协会杂志,103,410-423(2008)·Zbl 1335.62026号 ·doi:10.1198/0162145000001337
[32] Liu,J.S。;Wu,Y.N.,“数据增强的参数扩展”,《美国统计协会杂志》,941264-1274(1999)·Zbl 1069.62514号 ·doi:10.1080/01621459.1999.10473879
[33] McCullagh,P.,“有序数据的回归模型,皇家统计学会期刊,B辑,42,109-142(1980)·Zbl 0483.62056号 ·doi:10.1111/j.2517-6161.1980.tb01109.x
[34] McCullagh,P。;Nelder,J.A.,《广义线性模型》(1989),佛罗里达州博卡拉顿:查普曼和霍尔/CRC,佛罗里达州波卡拉顿·Zbl 0744.62098号
[35] Mohammadi,A。;Wit,E.C.,“BDgraph:图形模型中贝叶斯结构学习的R包,统计软件杂志,89,1-30(2019)·doi:10.18637/jss.v089.i03
[36] J.S.穆雷。;邓森,D.B。;Carin,L。;Lucas,J.E.,“混合数据的贝叶斯-高斯Copula因子模型”,《美国统计协会杂志》,108656-665(2013)·Zbl 06195968号 ·doi:10.1080/01621459.2012.762328
[37] Oliva,C.A。;Vargas,J.Y。;Inestrosa,N.C.,“成人大脑中的Wnts:从突触可塑性到认知缺陷,细胞神经科学前沿,7,224(2013)·doi:10.3389/fncel.2013.00224
[38] 皮特,M。;Chan,D。;Kohn,R.,“高斯Copula回归模型的有效贝叶斯推断,生物特征,93,537-554(2006)·Zbl 1108.62027号 ·doi:10.1093/biomet/93.3537
[39] 理查森,S。;波托洛,L。;罗森塔尔,J.S。;伯纳多,J.M。;巴亚里,M.J。;J.O.伯杰。;Dawid,A.P。;赫克曼,D。;A.F.M.史密斯。;West,M.,贝叶斯统计,9,“高维数据稀疏回归分析的贝叶斯模型”,539-568(2010),纽约:牛津大学出版社,纽约
[40] 罗奇科娃,V。;George,E.I.,“钉板拉索,美国统计协会杂志,113,431-444(2018)·Zbl 1398.62186号 ·doi:10.1080/016214519.2016.1260469
[41] Rothman,A.J。;莱维纳,E。;Zhu,J.,“具有协方差估计的稀疏多元回归,计算图形与统计杂志,19947-962(2010)·doi:10.1198/jcgs.2010.09188
[42] 鲁菲厄,H。;戴维森,A.C。;哈格,J。;英肖,J。;费尔法克斯,B.P。;理查森,S。;Bottolo,L.,“在多响应回归中检测热点的全球方法,应用统计年鉴,14905-928(2020)·Zbl 1446.62288号 ·doi:10.1214/20-AOAS1332
[43] 肖恩(Schon,K.)。;新泽西州van Os。;奥斯克罗夫特,N。;Baxendale,H.,“基因型、锥体外系特征和变异性共济失调-毛细血管扩张症的严重性,神经病学年鉴,85,170-180(2019)
[44] Sklar,M.,“Répartitionán Dimensions et leurs Marges的功能,巴黎大学统计研究所出版物10,8,229-231(1959)·Zbl 0100.14202号
[45] Song,P.X.-K.,“由高斯Copula生成的多元离散模型,斯堪的纳维亚统计杂志,27305-320(2000)·Zbl 0955.62054号
[46] 宋,P.X.-K。;李,M。;Yuan,Y.,“使用高斯Copula对相关数据进行联合回归分析,生物统计学,65,60-68(2009)·Zbl 1159.62049号 ·doi:10.1111/j.1541-0420.2008.01058.x
[47] Talhouk,A。;Doucet,A。;Murphy,K.,“具有稀疏逆相关矩阵的多元概率模型的有效贝叶斯推断,计算与图形统计杂志,21739-757(2012)·doi:10.1080/10618600.2012.679239
[48] 蒂尔,C.M。;奥祖特,J。;诺盖拉,W。;Puschmann,S.,“年龄对退化言语长期记忆的影响,人类神经科学前沿,10473(2016)·doi:10.3389/fnhum.2016.00473
[49] Van Dyk,D.A。;孟晓乐,“数据增强的艺术”,《计算与图形统计杂志》,2001年第10期,第1-50页·doi:10.1198/10618600152418584
[50] Vehtari,A.、Gabri,J.、Yao,Y.和Gelman,A.(2018),“LOO:贝叶斯模型的有效漏失交叉验证和WAIC。R包版本2.0.0·Zbl 1505.62409号
[51] Vehtari,A。;盖尔曼,A。;Gabri,J.,“使用遗漏交叉验证和WAIC的实用贝叶斯模型评估,统计计算,271413-1432(2017)·Zbl 1505.62408号 ·数字标识代码:10.1007/s11222-016-9696-4
[52] Wang,H.,“稀疏看似无关的回归建模:在金融和计量经济学中的应用,计算统计和数据分析,54,2866-2877(2010)·Zbl 1284.91461号 ·doi:10.1016/j.csda.2010.03.028
[53] Wang,H。;Li,S.Z.,“G-Wishart先验分布下的有效高斯图形模型确定”,《电子统计杂志》,第6期,第168-198页(2012年)·Zbl 1335.62069号 ·doi:10.1214/12-EJS669
[54] 韦伯,E.L。;Forster,J.J.,“多元有序和二元数据的贝叶斯模型确定,计算统计学和数据分析,522632-2649(2008)·兹比尔1452.62232 ·doi:10.1016/j.csda.2007.09.008
[55] Yu,Y。;Meng,X.-L.,“到中心还是不到中心:这不是问题——提高MCMC效率的辅助-充分交织策略(ASIS),计算与图形统计杂志,20,531-570(2011)·doi:10.1198/jcgs.2011.203主要
[56] Zellner,A.,“一种有效的估计看似无关回归和检验聚集偏差的方法,美国统计协会杂志,57,348-368(1962)·Zbl 0113.34902号 ·doi:10.1080/01621459.1962.10480664
[57] 张,X。;博斯卡丁,W.J。;Belin,T.R。;万,X。;何毅。;Zhang,K.,“用贝叶斯方法分析缺失值的连续、有序和名义分类数据组合,多元分析杂志,135,43-58(2015)·Zbl 1329.62038号 ·doi:10.1016/j.jmva.2014.11.007
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。