×

近似贝叶斯计算的随机森林调整。 (英语) Zbl 07546460号

摘要:我们提出了一种新的近似贝叶斯计算中的回归调整方法,以帮助提高后验推理的准确性和计算效率。该方法使用随机森林回归来建模汇总统计数据和感兴趣参数之间的关系。与现有方法相比,该方法绕过了模型中预选汇总统计量的需要,能够捕获感兴趣参数与汇总统计量之间潜在的非线性关系。我们还引入了一种度量方法来量化模型中使用的每个汇总统计的重要性。我们通过两个仿真例子以及在种群遗传研究中的应用,研究了该估计量的渐近性质,并表明它具有良好的有限样本数值性能。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Arenas,M.,“基因组进化的计算机模拟进展:通过近似贝叶斯计算实现更真实的进化基因组分析”,《分子进化杂志》,80,189-192(2015)
[2] Athey,S。;Tibshirani,J。;Wager,S.,“广义随机森林”,《统计年鉴》,471148-1178(2019)·Zbl 1418.62102号
[3] 博蒙特,医学硕士。;张伟。;Balding,D.J.,“群体遗传学中的近似贝叶斯计算”,遗传学,1622025-2035(2002)
[4] Blum,M.G.,“近似贝叶斯计算:非参数视角”,《美国统计协会杂志》,105,1178-1187(2010)·兹比尔1390.62052
[5] 布鲁姆,M.G。;François,O.,“近似贝叶斯计算的非线性回归模型”,《统计与计算》,20,63-73(2010)
[6] 布鲁姆,M.G。;Nunes,医学硕士。;普兰格尔博士。;Sisson,S.A.,“近似贝叶斯计算中降维方法的比较综述,统计科学,28189-208(2013)·Zbl 1331.62123号
[7] 布鲁姆,M.G。;Tran,V.C.,“HIV与接触追踪:近似贝叶斯计算的案例研究”,生物统计学,11644-660(2010)·Zbl 1437.62399号
[8] Bortot,P。;科尔斯,S.G。;Sisson,S.A.,“刻板印象极值的推断”,《美国统计协会杂志》,10284-92(2007)·Zbl 1284.62795号
[9] Breiman,L.,“随机森林,机器学习,45,5-32(2001)·Zbl 1007.68152号
[10] Chan,Y.L。;Schanzenbach博士。;Hickerson,M.J.,“使用分层近似贝叶斯计算检测社区集合中一致的人口统计学反应”,《分子生物学与进化》,312501-2515(2014)
[11] 科努埃,J.-M。;Pudlo,P。;韦西耶,J。;Dehne-Garcia,A。;戈蒂埃,M。;Leblois,R。;马林·J·M。;Estoup,A.,“DIYABC v2。0:使用单核苷酸多态性、DNA序列和微卫星数据对人口历史进行近似贝叶斯计算推断的软件”,生物信息学,30,1187-1189(2014)
[12] 科努埃,J.-M。;桑托斯,F。;博蒙特,医学硕士。;罗伯特·C·P。;马林·J·M。;巴尔丁,D.J。;吉勒莫德,T。;Estoup,A.,“利用DIYABC推断人口历史:一种面向用户的近似贝叶斯计算方法”,生物信息学,242713-2719(2008)
[13] Csillery,K。;布鲁姆,M.G。;O.E.加吉奥蒂。;François,O.,“实践中的近似贝叶斯计算”,《生态学与进化趋势》,25,410-418(2010)
[14] Csillery,K。;弗朗索瓦,O。;Blum,M.G.,“abc:近似贝叶斯计算的R包”,《生态学与进化方法》,第3475-479页(2012)
[15] 费恩黑德,P。;Prangle,D.,“构建近似贝叶斯计算的汇总统计:半自动近似贝叶斯计算”,《皇家统计学会杂志》,B辑,74419-474(2012)·Zbl 1411.62057号
[16] 弗朗索瓦,O。;布鲁姆,M.G。;雅各布森,M。;Rosenberg,N.A.,“拟南芥欧洲种群的人口统计历史”,《公共科学图书馆·遗传学》,第4期,e1000075(2008)
[17] Gareth,J.,《统计学习导论:R中的应用》(2010),柏林:施普林格出版社,柏林
[18] 哈里奥,H。;Saksman,E。;Tamminen,J.,“随机行走都市算法的自适应建议分布”,计算统计,14,375-396(1999)·Zbl 0941.62036号
[19] Jabot,F。;Chave,J.,“利用系统发育信息推断生物多样性中性理论的参数及其对热带森林的影响,生态学快报,12,239-248(2009)
[20] 江,B。;吴,T.-y。;郑,C。;Wong,W.H.,“通过深度神经网络进行近似贝叶斯计算的学习摘要统计”,《中国统计》,第27期,第1595-1618页(2017年)·Zbl 1392.62073号
[21] 乔伊斯,P。;Marjoram,P.,“近似充分统计学和贝叶斯计算,遗传学和分子生物学中的统计应用,7(2008)·Zbl 1276.62077号
[22] 卡拉巴索斯,G。;Leisen,F.,“ABC方法的近似可能性观点,统计调查,1266-104(2018)·Zbl 1391.60003号
[23] 李,J。;诺特·D·J。;范,Y。;Sisson,S.A.,“通过高斯Copula模型将近似贝叶斯计算方法扩展到高维”,计算统计与数据分析,106,77-89(2017)·Zbl 1466.62136号
[24] 马林·J·M。;Pudlo,P。;罗伯特·C·P。;Ryder,R.J.,“近似贝叶斯计算方法,统计与计算,221167-1180(2012)·Zbl 1252.62022号
[25] 马林·J·M。;Robert,C.P.,《贝叶斯精要与R》,48(2014),纽约:施普林格,纽约·Zbl 1380.62005年
[26] Mengersen,K.L。;Pudlo,P。;Robert,C.P.,《基于经验似然的贝叶斯计算》,美国国家科学院学报,110,1321-1326(2013)
[27] 诺特·D·J。;Ong,V.M.-H。;范,Y。;Sisson,S。;Sisson,S.A。;范,Y。;Beaumont,M.,《近似贝叶斯计算手册》,高维ABC,211-242(2019),佛罗里达州博卡拉顿:佛罗里达州博卡拉顿CRC出版社·Zbl 1416.62005年
[28] Nunes,医学硕士。;Balding,D.J.,“关于近似贝叶斯计算汇总统计的最佳选择,遗传学和分子生物学中的统计应用,9(2010)·Zbl 1304.92047号
[29] Pritchard,J.K。;塞尔斯塔德,麻省理工。;Perez-Lezaun,A。;Feldman,M.W.,“人类Y染色体的群体增长:Y染色体微卫星的研究”,《分子生物学与进化》,161791-1798(1999)
[30] Pudlo,P。;马林·J·M。;Estoup,A。;科努埃,J.-M。;戈蒂埃,M。;Robert,C.P.,“通过随机森林选择可靠的ABC模型”,生物信息学,32,859-866(2016)
[31] Ratmann,O。;俄勒冈州约根森。;欣克利,T。;Stumpf,M。;理查森,S。;Wiuf,C.,“使用无似然推断比较幽门螺杆菌和恶性疟原虫蛋白质网络的进化动力学”,《公共科学图书馆·计算生物学》,3,e230(2007)
[32] 雷纳,L。;马林·J·M。;Pudlo,P。;里巴特,M。;罗伯特,C.P。;Estoup,A.,“贝叶斯参数推断的ABC随机森林”,生物信息学,351720-1728(2019)
[33] 索尔尼尔,E。;加斯库尔,O。;Alizon,S.,“利用回归-ABC:比较研究从系统发育推断流行病学参数,公共科学图书馆计算生物学,13,e1005416(2017)
[34] 西格尔,M。;Xiao,Y.,“多元随机森林,威利跨学科评论:数据挖掘和知识发现,180-87(2011)
[35] Silverman,B.W.,《统计和数据分析密度估计》,26(1986),CRC出版社·Zbl 0617.62042号
[36] 田中,M.M。;弗朗西斯,A.R。;卢西亚尼,F。;Sisson,S.,“使用近似贝叶斯计算从基因型数据估计结核病传播参数”,《遗传学》,1731511-1520(2006)
[37] Wager,S.,《随机森林的渐近理论》,arXiv:1405.0352(2014)
[38] 威尔金森,R.D。;Tavaré,S.,“利用有条件的出生和死亡过程估计灵长类的分化时间”,《理论种群生物学》,第75期,第278-285页(2009年)·Zbl 1213.92052号
[39] Wright,M.N。;齐格勒,A.,《流浪者:C++和R中高维数据随机森林的快速实现》,arXiv:1508.04409(2015)
[40] 朱伟。;Marin,J.M。;Leisen,F.,“贝叶斯计算的Bootstrap似然方法”,《澳大利亚和新西兰统计杂志》,58,227-244(2016)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。