×

HDBRR:无MCMC的高维贝叶斯岭回归的统计包。 (英语) Zbl 07632308号

摘要:岭回归处理同方差线性回归模型中的共线性。当预测器的数量(p)远大于观测值的数量(n)时,它给出了唯一的最小二乘估计。从经典方法和贝叶斯方法来看,参数估计是一项要求很高的计算任务,第一个是优化问题,第二个是通常通过马尔可夫链蒙特卡罗(MCMC)面临的高维积分问题。MCMC的主要缺点是实际上不可能检查后验分布的收敛性,由于回归参数较多,这通常非常缓慢。本文提出了一种计算算法,用于获得传统岭回归模型回归参数、方差分量和预测的后验估计。该算法基于对模型的重新矩阵化,该模型允许我们通过集成一个冗余参数来获得边际后验均值和方差,该参数的边际后验定义在开区间\(0,1)\上。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] R核心团队。R: 用于统计计算的语言和环境。维也纳:R统计计算基金会;2020年。有效期至:https://www.R-project.org/
[2] de los Campos,G,Pérez,P.BGLR:全基因组回归和预测的统计包。R包版本1.0.8;2018年。发布时间:https://CRAN.R-project.org/package=BGLR
[3] Makalic,E,Schmidt,D.具有全局-局部收缩先验的贝叶斯回归模型;2021.可从以下网站获得:https://CRAN.R-project.org/package=bayesreg
[4] Goeman,J,Meijer,R,Chaturvedi,N,et al.惩罚:GLM和Cox模型中L1(拉索和融合拉索)和L2(岭)惩罚估计;2018年。发布时间:https://cran.r-project.org/web/packages/pensipled/index.html
[5] Moritz,S,Cule,E,Frankowski,D.Ridge:自动选择惩罚参数的岭回归;2021.可从以下网站获得:https://CRAN.R-project.org/package=ridge
[6] Rajaratnam,B,Sparks,D.大数据时代基于MCMC的推理:高维链收敛复杂性的基本分析;2015.arXiv预印arXiv:150800947。
[7] 拉希德,F。;阿尔塔夫,S。;Aslam,M.,《岭回归偏倚参数的贝叶斯估计:一种新方法》,《公共统计模拟计算》(2020年)·Zbl 07632263号 ·doi:10.1080/03610918.2020.1827266
[8] Pérez,S,Monroy,B,Pére z,P.HDBRR:无MCMC的高维贝叶斯岭回归。R包版本0.1.8;2021.可从以下网站获得:https://CRAN.R-project.org/package=HDBRR ·Zbl 07632308号
[9] Privé,F,Blum,M,Aschard,H.Bigstatsr:文件备份大矩阵的统计工具;2020年。有效期至:https://CRAN.R-project.org/package=bigstatsr
[10] Privé,F.Bigparaller:简单的并行工具;2021年。可从以下地点购买:https://CRAN.R-project.org/package=bigparaller
[11] Lee,PM,贝叶斯统计介绍(2012),西苏塞克斯:威利,西苏赛克斯·Zbl 1258.62028号
[12] 吉尔克斯,WR;理查森,S。;Spiegelhalter,D.,马尔可夫链蒙特卡洛实践(1996),伦敦:查普曼和霍尔/CRC,伦敦·Zbl 0832.00018号
[13] 斯佩格尔,JS。马尔可夫链蒙特卡罗方法的概念介绍;arXiv公司。2020年。有效期至:
[14] CP罗伯特;Casella,G.,《用R介绍蒙特卡罗方法》(2010),纽约:Springer,纽约·Zbl 1196.65025号
[15] Andrieu,C。;德弗里塔斯,N。;Doucet,A.,机器学习MCMC简介,《马赫学习》,50,1,5-43(2003)·Zbl 1033.68081号
[16] Hoerl,AE.,岭分析在回归问题中的应用,化学工程规划,58,54-59(1962)
[17] 霍尔,AE;Kennard,RW.,《关于回归分析和有偏估计》,《技术计量学》,第10期,第422-423页(1968年)
[18] Cannon,A.,改善多元线性降尺度模型协方差结构的负脊回归参数,国际气候杂志,29,5,761-769(2009)
[19] 霍尔,AE;Kennard,RW.,岭回归:非正交问题的有偏估计,技术计量学,12,1,55-67(1970)·Zbl 0202.17205号
[20] 霍尔,AE;Kennard,RW.,《岭回归:非正交问题的应用》,技术计量学,12,1,69-82(1970)·Zbl 0202.17206号
[21] 霍尔,AE;肯纳德,RW;肯塔基州鲍德温。,岭回归:一些模拟,Commun Stat,4105-123(1975)·Zbl 0296.62062号
[22] 宾夕法尼亚州范维林根。山脊回归讲义;arXiv公司。2015年。可从以下网址获得:·Zbl 1463.62210号
[23] Alheety,M。;Kibria,BMG.,《在具有AR(1)误差的线性回归模型中选择脊参数:比较模拟研究》,《国际统计经济学杂志》,第7期,第11期,第10-26页(2011年)
[24] 叶海亚,WB;JB.奥莱法。,岭回归建模技术注释,《电子应用统计分析》,7,2,343-361(2014)
[25] 赖希,印度人民党;Ghosh,SK.,贝叶斯统计方法(2019),纽约:查普曼和霍尔,纽约·Zbl 1427.62001年
[26] Gelman,A,Carlin,JB,Stern,HS等。贝叶斯数据分析。电子;2021.可从以下网站获得:https://users.aalto.fi/ave/BDA3.pdf
[27] 关,Y。;Stephens,M.,用于全基因组关联研究和其他大规模问题的贝叶斯变量选择回归,Ann Appl Stat,5,31780-1815(2011)·Zbl 1229.62145号
[28] 乔治,EI;McCulloch,RE,《通过吉布斯抽样进行变量选择》,美国统计协会杂志,88,423,881-889(1993)
[29] 卡斯,RE;RaftSery,AE.,Bayes factors,J Am Stat Assoc,90,430,773-795(1995)·Zbl 0846.62028号
[30] SG米尔纳;麦克费里,M。;黄,BE,硬粒小麦(Triticum turgidum ssp durum)农艺性状QTL定位的多交系杂交群体,植物生物技术杂志,14,735-748(2015)
[31] Wang,L。;Tang,H。;Thayanithy,V.,与侵袭性前列腺癌相关的基因网络和微RNA,《癌症研究》,69,24,9490-9497(2009)
[32] 戴维斯,S。;Meltzer,PS.,GEOquery:基因表达总称(GEO)和生物导体之间的桥梁,生物信息学,23,14,1846-1847(2007)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。