×

近似贝叶斯计算中降维方法的比较综述。 (英语) Zbl 1331.62123号

摘要:近似贝叶斯计算(ABC)方法利用模拟统计和观测统计之间的比较来克服计算困难的似然函数问题。由于ABC的实际实施需要基于汇总统计向量而非完整数据集进行计算,因此一个中心问题是如何从观测数据中导出低维汇总统计数据,并将信息损失降至最低。在本文中,我们对ABC文献中提出的主要降维方法的性能进行了全面的回顾和比较。这些方法被分为三个非互斥类,包括最佳子集选择方法、投影技术和正则化。此外,我们还介绍了两种新的降维方法。第一种是基于Akaike和贝叶斯信息准则的最佳子集选择方法,第二种是使用岭回归作为正则化过程。我们通过分析三个具有挑战性的模型和数据集来说明这些降维技术的性能。

MSC公司:

2015年1月62日 贝叶斯推断
62J07型 岭回归;收缩估计器(拉索)
65立方厘米60 统计中的计算问题(MSC2010)
62件 统计学的应用
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Abdi,H.和Williams,L.J.(2010年)。偏最小二乘回归,对潜在结构回归的投影。威利公司(Wiley Interdiscip)。版次计算。统计数字2 433-459。
[2] 埃施巴赫(Esechbacher,S.)、博蒙特(Beaumont,M.A.)和福斯克(Futschik,A.)(2012年)。一种在近似贝叶斯计算中选择摘要统计的新方法。遗传学192 1027-1047。
[3] Akaike,H.(1974年)。统计模型识别的新视角。IEEE传输。自动化。控制AC-19 716-723·Zbl 0314.62039号 ·doi:10.1109/TAC.1974.1100705
[4] Allingham,D.、King,R.A.R.和Mengersen,K.L.(2009年)。分位数分布的贝叶斯估计。统计计算。19 189-201. ·数字对象标识代码:10.1007/s11222-008-9083-x
[5] Baddeley,A.和Jensen,E.B.V.(2004)。统计学家的刻板印象。查普曼和霍尔/CRC,佛罗里达州博卡拉顿。
[6] Barnes,C.、Filippi,S.、Stumpf,M.P.H.和Thorne,T.(2012)。为ABC模型选择构建汇总统计的慎重方法。统计计算。22 1181-1197. ·Zbl 1252.62002号 ·doi:10.1007/s11222-012-9335-7
[7] Barthemé,S.和Chopin,N.(2011年)。无汇总、无可能性推理的期望传播。可从获取·Zbl 1367.62063号
[8] Beaumont,M.A.(2010年)。进化和生态学中的近似贝叶斯计算。生态学、进化和系统学年鉴41 379-406。
[9] Beaumont,M.A.、Zhang,W.和Balding,D.J.(2002)。群体遗传学中的近似贝叶斯计算。遗传学162 2025-2035。
[10] Beaumont,M.A.、Marin,J.M.、Cornuet,J.M和Robert,C.P.(2009年)。ABC算法的适应性:ABC-PMC方案。生物特征96 983-990·兹比尔1437.62393 ·doi:10.1093/biomet/asp052
[11] Bertorelle,G.、Benazzo,A.和Mona,S.(2010年)。ABC作为一个灵活的框架来估计人口在空间和时间上的变化:有一些缺点,也有很多优点。摩尔生态。19 2609-2625.
[12] Blum,M.G.B.(2010年a)。近似贝叶斯计算:非参数视角。J.Amer。统计师。协会105 1178-1187·Zbl 1390.62052号 ·doi:10.1198/jasa.2010.tm09448
[13] Blum,M.G.B.(2010年B)。在近似贝叶斯计算中选择摘要统计量和接受率。2010年COMPSTAT:《计算统计学学报》(G.Saporta和Y.Lechevallier,eds.)47-56。纽约州施普林格。
[14] Blum,M.G.B.和François,O.(2010年)。近似贝叶斯计算的非线性回归模型。统计计算。20 63-73. ·doi:10.1007/s11222-009-9116-0
[15] Blum,M.G.B.、Nunes,M.A.、Prangle,D.和Sisson,S.A.(2013年)。补充“近似贝叶斯计算中降维方法的比较综述”·Zbl 1331.62123号 ·doi:10.1214/12-STS406
[16] Bonassi,F.V.、You,L.和West,M.(2011年)。生物网络模型中边缘数据的贝叶斯学习。统计应用程序。遗传学。分子生物学。10第49、29条·兹标06351955 ·doi:10.2202/1544-6115.1684
[17] Bortot,P.、Coles,S.G.和Sisson,S.A.(2007年)。体视学极端的推断。J.Amer。统计师。协会102 84-92·Zbl 1284.62795号 ·doi:10.1198/016214500000988
[18] Boulesteix,A.-L.和Strimmer,K.(2007年)。偏最小二乘法:一种用于分析高维基因组数据的通用工具。简介。生物信息学8 32-44。
[19] Coles,S.(2001)。极值统计建模简介。斯普林格,伦敦·Zbl 0980.62043号
[20] Csillery,K.、François,O.和Blum,M.G.B.(2012年)。abc:近似贝叶斯计算的R包。生态学与进化方法3 475-479。
[21] Csillery,K.、Blum,M.G.B.、Gaggiotti,O.和Francois,O.(2010年)。实际中的近似贝叶斯计算。生态与进化趋势25 410-418。
[22] Del Moral,P.、Doucet,A.和Jasra,A.(2012年)。一种用于近似贝叶斯计算的自适应序贯蒙特卡罗方法。统计计算。22 1009-1020. ·Zbl 1252.65025号 ·doi:10.1007/s11222-011-9271-y
[23] Drovandi,C.C.和Pettitt,A.N.(2011年)。使用近似贝叶斯计算估计大型寄生虫种群进化的参数。生物统计学67 225-233·Zbl 1217.62128号 ·文件编号:10.1111/j.1541-0420.2010.01410.x
[24] Drovandi,C.C.、Pettitt,A.N.和Faddy,M.J.(2011年)。使用间接推理的近似贝叶斯计算。J.R.统计社会服务。C.应用。统计数字60 317-337·文件编号:10.1111/j.1467-9876.2010.00747.x
[25] Estoup,A.、Lombaert,E.、Marin,J.M.、Guillemaud,T.、Pudlo,P.、Robert,C.和Cornuet,J.M(2012)。使用基于汇总统计的线性判别分析的近似贝叶斯计算估计demo-genetic模型概率。分子生态学资源12 846-855。
[26] Fan,Y.、Nott,D.J.和Sisson,S.A.(2012年)。回归密度估计ABC。未发表的手稿。
[27] Fearnhead,P.和Prangle,D.(2012年)。为近似贝叶斯计算构建摘要统计:半自动近似贝叶斯计算(带讨论)。J.R.统计社会服务。B统计方法。74 419-474. ·文件编号:10.1111/j.1467-9868.2011.010.10.x
[28] Filippi,S.、Barnes,C.P.和Stumpf,M.P.H.(2012)。对Fearnhead和Prangle讨论的贡献(2012年)。为近似贝叶斯计算构建摘要统计:半自动近似贝叶斯计算。J.R.统计社会服务。B统计方法。74 459-460. ·文件编号:10.1111/j.1467-9868.2011.010.10.x
[29] Geman,S.、Bienenstock,E.和Doursat,R.(1992年)。神经网络和偏差/方差困境。神经计算。4 1-58.
[30] Golub,G.H.、Heath,M.和Wahba,G.(1979年)。广义交叉验证是一种选择良好脊线参数的方法。技术指标21 215-223·Zbl 0461.62059号 ·doi:10.2307/1268118
[31] Heggland,K.和Frigessi,A.(2004年)。间接推理中的函数估计。J.R.统计社会服务。B统计方法。66 447-462. ·Zbl 1062.62098号 ·doi:10.1111/j.1369-7412.003.05341.x
[32] Hoerl,A.E.和Kennard,R.W.(1970年)。岭回归:非正交问题的有偏估计。技术计量12 55-67·Zbl 0202.17205号 ·doi:10.307/1267351
[33] Hudson,R.R.(2002)。在Wright-Fisher中性遗传变异模型下生成样本。生物信息学18 337-338。
[34] Hurvich,C.M.、Simonoff,J.S.和Tsai,C.L.(1998年)。使用改进的Akaike信息准则平滑非参数回归中的参数选择。J.R.统计社会服务。B统计方法。60 271-293. ·Zbl 0909.62039号 ·doi:10.1111/1467-9868.00125
[35] Hurvich,C.M.和Tsai,C.L.(1989年)。小样本回归和时间序列模型选择。生物特征76 297-307·Zbl 0669.62085号 ·doi:10.1093/biomet/76.2.297
[36] Irizarry,R.A.(2001年)。局部似然估计中模型选择的信息和后验概率准则。J.Amer。统计师。协会96 303-315·Zbl 1015.62016号 ·doi:10.1198/016214501750332875
[37] Jasra,A.、Singh,S.S.、Martin,J.S.和McCoy,E.(2012年)。通过近似贝叶斯计算进行过滤。统计师。计算。22 1223-1237. ·Zbl 1252.62093号 ·doi:10.1007/s11222-010-9185-0
[38] Jeremiah,E.、Sisson,S.A.、Marshall,L.、Mehrotra,R.和Sharma,A.(2011年)。水文模型的贝叶斯校准和不确定性分析:自适应Metropolis和顺序蒙特卡罗采样器的比较。水资源研究47 W07547,第13页。
[39] Joyce,P.和Marjoram,P.(2008年)。大约足够的统计和贝叶斯计算。统计应用程序。遗传学。分子生物学。7第26、18条·Zbl 1276.62077号 ·doi:10.2202/1544-6115.1389
[40] Jung,H.和Marjoram,P.(2011)。近似贝叶斯计算中汇总统计权重的选择。统计应用程序。遗传学。分子生物学。10第45、25条·Zbl 1296.92043号 ·数字对象标识代码:10.2202/1544-6115.1586
[41] Konishi,S.、Ando,T.和Imoto,S.(2004)。径向基函数网络中的贝叶斯信息准则和平滑参数选择。生物特征91 27-43·Zbl 1132.62313号 ·doi:10.1093/biomet/91.1.27
[42] Leuenberger,C.和Wegmann,D.(2010年)。无可能性的贝叶斯计算和模型选择。遗传学184 243-252。
[43] Lopes,J.S.和Beaumont,M.A.(2010年)。ABC:用于分析人口数据的有用贝叶斯工具。感染。遗传学。进化。10 826-833.
[44] Luciani,F.、Sisson,S.A.、Jiang,H.、Francis,A.R.和Tanaka,M.M.(2009)。结核分枝杆菌耐药性的流行病学适应成本。程序。国家。阿卡德。科学。美国106 14711-14715。
[45] Marjoram,P.、Molitor,J.、Plagnol,V.和Tavare,S.(2003年)。无可能性的马尔可夫链蒙特卡罗。程序。国家。阿卡德。科学。美国100 15324-15328。
[46] Mevik,B.-H.和Cederkvist,H.R.(2004)。主成分回归(PCR)和偏最小二乘回归(PLSR)的预测均方误差(MSEP)估计。化学计量学杂志18 422-429。
[47] Mevik,B.-H.和Wehrens,R.(2007年)。pls包:《统计软件期刊》18 1-24中的主成分和偏最小二乘回归。
[48] Minka,T.(2001)。近似贝叶斯推理的期望传播。人工智能中的不确定性程序17 362-369。
[49] Nakagome,S.、Fukumizu,K.和Mano,S.(2012年)。群体遗传推断的核近似贝叶斯计算。可从获取。
[50] Nix,D.A.和Weigend,A.S.(1995年)。学习非线性回归的局部误差线。神经信息处理系统进展7(NIPS’94)(G.Tesauo,D.Touretzky and T.Leen,eds.)489-496。麻省理工学院出版社,剑桥。
[51] Nordborg,M.(2007年)。凝聚理论。《统计遗传学手册》,第3版(D.J.Balding、M.J.Bishop和C.Cannings编辑)179-208。奇切斯特·威利。
[52] Nott,D.J.、Fan,Y.和Sisson,S.A.(2012年)。对Fearnhead和Prangle讨论的贡献(2012年)。为近似贝叶斯计算构建摘要统计:半自动近似贝叶斯计算。J.R.统计社会服务。B统计方法。74 466. ·文件编号:10.1111/j.1467-9868.2011.010.10.x
[53] Nott,D.J.、Fan,Y.、Marshall,L.和Sisson,S.A.(2013年)。近似贝叶斯计算和贝叶斯线性分析:面向高维近似贝叶斯计算。J.计算。图表。统计师。
[54] Nunes,M.A.和Balding,D.J.(2010年)。近似贝叶斯计算中汇总统计量的最优选择。统计应用程序。遗传学。分子生物学。9第34、16条·兹比尔1304.92047 ·数字对象标识代码:10.2202/1544-6115.1576
[55] Peters,G.W.、Fan,Y.和Sisson,S.A.(2012年)。关于序贯蒙特卡罗、部分拒绝控制和近似贝叶斯计算。统计计算。22 1209-1222. ·Zbl 1252.65022号 ·doi:10.1007/s11222-012-9315-y
[56] Pritchard,J.K.、Seielstad,M.T.、Perez-Lezaun,A.和Feldman,M.W.(1999)。人类Y染色体的群体增长:Y染色体微卫星的研究。分子生物学。进化。16 1791-1798.
[57] Ripley,B.D.(1994)。神经网络和相关分类方法。J.R.统计社会服务。B统计方法。56 409-456. ·Zbl 0815.62037号
[58] Schwarz,G.(1978年)。估算模型的维度。安。统计师。6 461-464. ·兹伯利0379.62005 ·doi:10.1214/aos/1176344136
[59] Sedki,M.A.和Pudlo,P.(2012年)。对Fearnhead和Prangle讨论的贡献(2012年)。为近似贝叶斯计算构建摘要统计:半自动近似贝叶斯计算。J.R.统计社会服务。B统计方法。74 466-467·文件编号:10.1111/j.1467-9868.2011.010.10.x
[60] Shannon,C.E.(1948)。传播的数学理论。贝尔系统技术杂志27 379-423,623-656·Zbl 1154.94303号 ·doi:10.1002/j.1538-7305.1948.tb01338.x
[61] Singh,H.、Misra,N.、Hnizdo,V.、Fedorowicz,A.和Demchuk,E.(2003年)。熵的最近邻估计。阿默尔。数学杂志。管理科学。23 301-321.
[62] Sisson,S.A.、Fan,Y.和Tanaka,M.M.(2007年)。无可能性的连续蒙特卡罗。程序。国家。阿卡德。科学。美国104 1760-1765(电子版)·Zbl 1160.65005号 ·doi:10.1073/pnas.0607208104
[63] Sisson,S.A.和Fan,Y.(2011年)。无似然马尔可夫链蒙特卡罗。《马尔可夫链蒙特卡罗手册》(S.P.Brooks、A.Gelman、G.Jones和X.L.Meng编辑)319-341。佛罗里达州博卡拉顿CRC出版社。
[64] Taniguchi,M.和Tresp,V.(1997)。平均正则化估值器。神经计算。9 1163-1178.
[65] Toni,T.、Welch,D.、Strelkowa,N.、Ipsen,A.和Stumpf,M.P.(2009年)。动态系统参数推理和模型选择的近似贝叶斯计算方案。《皇家学会学报》第6期第187-202页。
[66] Vinzi,V.E.、Chin,W.W.、Henseler,J.和Wang,H.编辑(2010)。偏最小二乘手册:概念、方法和应用。海德堡施普林格·Zbl 1186.62001年 ·doi:10.1007/978-3-540-32827-8
[67] Wegmann,D.、Leuenberger,C.和Excoffier,L.(2009年)。有效的近似贝叶斯计算与无似然马尔可夫链蒙特卡罗耦合。遗传学182 1207-1218。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。