×

使用近似贝叶斯计算加速对观测到的具有测量误差和大样本大小的扩散的推断。 (英语) Zbl 1510.62343号

摘要:近年来,动态建模提供了一系列突破性的方法来执行精确的贝叶斯推断。然而,在大数据集和复杂模型的背景下,应用精确的统计方法在计算上往往是不可行的。本文考虑一个具有相关测量误差的非线性随机微分方程模型及其在蛋白质折叠建模中的应用。提出了一种近似贝叶斯计算(ABC)-MCMC算法,以允许在合理的时间限制内推断模型参数。ABC算法使用来自假设数据生成模型的“子样本”模拟以及所谓的“早期拒绝”策略来加速ABC-MCMC采样器中的计算。使用适当数量的子样本似乎不会降低所考虑应用的推断结果的质量。我们进行了一项仿真研究,将我们的策略与精确的贝叶斯推断进行了比较,后者在考虑的设置下比ABC-MCMC慢两个数量级。最后,将ABC算法应用于一个大尺寸的蛋白质数据。建议的方法相当通用,不限于示例模型和数据。

MSC公司:

2005年6月2日 马尔可夫过程:估计;隐马尔可夫模型
60 H10型 随机常微分方程(随机分析方面)
2015年1月62日 贝叶斯推断
62页第10页 统计学在生物学和医学中的应用;元分析
62-08 统计学相关问题的计算方法
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Andrieu C,Doucet A,Holenstein R.粒子马尔可夫链蒙特卡罗方法(含讨论)。J R Statist Soc:B系列,2010年;72(3):269-342. doi:10.1111/j.1467-9868.2009.00736.x[交叉引用],[谷歌学者]·Zbl 1411.65020号
[2] BretóC,He D,Ionides EL,King AA。通过机械模型进行时间序列分析。Ann Appl Stat.2009;3(1):319-348。doi:10.1214/08-AOAS201[Crossref],[Web of Science®],[Google学者]·Zbl 1160.62080号
[3] Golightly A,Wilkinson DJ。使用粒子马尔可夫链蒙特卡罗对随机生化网络模型进行贝叶斯参数推断。界面焦点。2011;1(6):807-820. doi:10.1098/rsfs.2011.0047[Crosref],[Web of Science®],[谷歌学者]
[4] Forman JL,Sörensen M.建模多模扩散的变换方法。J统计计划推断。2014;146:56-69. doi:10.1016/j.jspi.2013.09.013[Crossref],[Web of Science®],[Google学者]·Zbl 1279.62169号
[5] Pavliotis GA,Stuart AM。多尺度扩散的参数估计。统计物理学杂志。2007;127:741-781. doi:10.1007/s10955-007-9300-6[Crossref],[Web of Science®],[Google学者]·Zbl 1137.82016年
[6] Azencott R,Arjun B,Ankita J,Timofeyev I.多尺度动力学的子采样和参数估计。公共数学科学。2013;11:939-970. doi:10.4310/CMS.2013.v11.n4.a3[Crossref],[Web of Science®],[Google学者]·兹比尔1412.62111
[7] 阿伊特·萨哈利亚Y.测试即期利率的连续时间模型。《金融研究评论》,1996年;9:385-426. doi:10.1093/rfs/9.2.385[Crossref],[Web of Science®],[Google学者]
[8] Pokern Y,Stuart AM,Wiberg P.部分观测亚椭圆扩散的参数估计。J R Statist Soc Ser.公司。B.2009年;71:49-73. doi:10.1111/j.1467-9868.2008.00689.x[交叉引用],[谷歌学者]·Zbl 1231.62152号
[9] Crommelin D,Vanden-Eijnden E.通过算子特征对从多尺度数据进行扩散估计。SIAM多尺度模型。模拟。2011;9:1588-1623. doi:10.1137/100795917[Crossref],[Web of Science®],[Google学者]·Zbl 1244.60055号
[10] Best RB,Hummer G.蛋白质折叠中的配位依赖扩散。美国国家科学院。2010年;107:1088-1093。doi:10.1073/pnas.0910390107[Crossref],[PubMed],[Web of Science®],[Google学者]
[11] Bezanson J、Karpinskiy S、Shah VB、Edelman A.Julia:技术计算的快速动态语言;2012年,arXiv:1209.5145v1。[谷歌学者]
[12] Murray L.Bayesian使用LibBi.2013对高性能硬件进行状态空间建模;arXiv:1306.3277。[谷歌学者]
[13] 威尔金森DJ。系统生物学的随机建模。第二版,佛罗里达州博卡拉顿:CRC出版社;2012.[谷歌学者]·Zbl 1300.92004号
[14] 离子EL,BretóC,King AA。非线性动力系统的推断。美国国家科学院院刊。2006;103(49):18438-18443. doi:10.1073/pnas.0603181103[Crossref],[PubMed],[Web of Science®],[Google学者]
[15] Kloeden PE,Platen E.随机微分方程的数值解。柏林:施普林格;1992.【Crossref】,【谷歌学者】·Zbl 0752.60043号
[16] 随机微分方程解的强逼近的Röler A.Runge-Kutta方法。SIAM J.数字。分析。2010年;48(3):922-952. doi:10.1137/09076636X[Crossref],[Web of Science®],[Google学者]·Zbl 1231.65015号
[17] Girolma M、Lyne AM、Strathmann H、Simpson D、Atchade Y。玩俄罗斯轮盘赌的可能性很难控制;2013年,arXiv:1306.4032。[谷歌学者]·Zbl 1426.62092号
[18] Koratikara A,Chen Y,Welling M.《MCMC土地的紧缩:削减大都会-黑斯廷斯预算》;2014年,arXiv:1304.5299。[谷歌学者]
[19] Varin C,Reid N,Firth D.复合似然法概述。统计罪。2011;21(1):5-42. [Web of Science®],[Google学者]·Zbl 05849508号
[20] Marin J-M、Pudlo P、Robert CP、Ryder RJ。近似贝叶斯计算方法。统计计算。2012年;22(6):1167-1180. doi:10.1007/s1122-011-9288-2[Crossref],[Web of Science®],[Google学者]·Zbl 1252.62022号
[21] Pritchard JK,Seielstad MT,Perez-Lezaun A,Feldman MW。人类Y染色体的群体增长:Y染色体微卫星的研究。分子生物学进化。1999;16(12):1791-1798. doi:10.1093/oxfordjournals.molbev.a026091[Crossref],[PubMed],[Web of Science®],[Google学者]
[22] Fearnhead P,Prangle D。为近似贝叶斯计算构建汇总统计:半自动近似贝叶斯计算(带讨论)。J R Statist Soc Ser B.2012;第74:419-474页。doi:10.1111/j.1467-9868.2011.010.10.x[交叉引用],[谷歌学者]·Zbl 1411.62057号
[23] 博蒙特马萨诸塞州。进化和生态学中的近似贝叶斯计算。年度经济增长系统。2010年;41:379-406. doi:10.1146/annrev-ecolys-102209-144621[Crosref],[Web of Science®],[Google Scholar]
[24] Picchini U.通过近似贝叶斯计算对SDE模型进行推断。2014年计算机图表统计杂志;23(4):1080-1100. doi:10.1080/10618600.2013.866048[Taylor&Francis Online],[Web of Science®],[Google学者]
[25] Picchini U.abc-sde:用于随机微分方程模型中近似贝叶斯计算(abc)的Matlab工具箱;2013年。可从以下网址获得:http://sourceforge.net/projects/abc-sde/。[谷歌学者]
[26] Lee A,Andrieu C.关于为近似贝叶斯计算构建汇总统计的讨论:半自动近似贝叶斯计算。J R Statist Soc Ser B.2012;74:419-474. doi:10.1111/j.1467-9868.2011.01006.x[Crossref],[Google学者]·Zbl 1411.62057号
[27] Haario H,Saksman E,Tamminen J.自适应大都会算法。伯努利。2001;7(2):223-242. doi:10.2307/3318737[Crosref],[Web of Science®],[谷歌学者]·Zbl 0989.65004号
[28] Lenormand M,Jabot F,Deffuant G。复杂模型的自适应近似贝叶斯计算。2013年计算统计;28(6):2777-2796. doi:10.1007/s00180-013-0428-3[Crossref],[Web of Science®],[Google学者]·Zbl 1306.65088号
[29] Bortot P,Coles S,Sisson S.体视学极值推断。美国统计学会杂志,2007年;102(477):84-92. doi:10.1198/016214500000988[Taylor&Francis Online],[Web of Science®],[Google学者]·Zbl 1284.62795号
[30] 多CPU的Drovandi C.伪边缘算法;2014.昆士兰理工大学,可从以下网址获得:http://eprints.qut.edu.au/61505/。[谷歌学者]
[31] 新泽西州Gordon,Salmond DJ,Smith AFM。非线性/非高斯贝叶斯状态估计的新方法。IEE程序——F.1993;140(2):107-113. [谷歌学者]
[32] Doucet A、De Freitas N、Gordon N。实际中的序贯蒙特卡罗方法。纽约:Springer;2001.[交叉参考],[谷歌学者]·Zbl 0967.00022号
[33] BartheméS,Chopin N.相似自由推理的期望传播。J Am统计协会,2014年;109(505):315-333. doi:10.1080/01621459.2013.864178[Taylor&Francis在线],[Web of Science®],[Google学者]·Zbl 1367.62063号
[34] Toni T、Welch D、Strelkowa N、Ipsen A、Stumpf MPH。动态系统参数推理和模型选择的近似贝叶斯计算方案。J R Soc接口。2009;6(31):187-202. doi:10.1098/rsif.2008.0172[Crossref],[PubMed],[Web of Science®],[Google学者]
[35] Wolynes PG、Eaton WA、Fersht AR。蛋白质折叠的化学物理。美国国家科学院院刊。2012年;109(44):17770-17771. doi:10.1073/pnas.1215733109[Crossref],[PubMed],[Web of Science®],[Google学者]
[36] Socci ND,Onuchic JN,Wolynes PG。蛋白质折叠漏斗反应坐标的扩散动力学。化学物理杂志。1996;104:5860-5868. doi:10.1063/1.471317[Crossref],[Web of Science®],[Google学者]
[37] Das P,Moll M,Stamati H,Kavraki LE,Clementi C.通过非线性降维研究蛋白质折叠反应的低维自由能景观。美国国家科学院。2006;103:9885-9890. doi:10.1073/pnas0603553103[Crosref],[PubMed],[Web of Science®],[谷歌学者]
[38] Bottaro S、Boomsma W、Johansson KE、Andreetta C、Hamelryck T、Ferkinghoff Borg J.《精细蒙特卡罗在稠密分子系统中的更新》。化学理论计算杂志。2012年;8:695-702. doi:10.1021/ct200641m[Crossref],[Web of Science®],[Google学者]
[39] Boomsma W、Frellsen J、Harder T、Bottaro S、Johansson KE、Tian P、Stovgaard K、Andreetta C、Olsson S、Valentin JB、Antonov LD、Christensen AS、Borg M、Jensen JH、Lindorff-Larsen K、Ferkinghoff Borg J、Hamelryck T.PHAISTOS:蛋白质结构的马尔可夫链蒙特卡罗模拟和推断框架。计算机化学杂志。2013;34(19):1697-1705. doi:10.1002/jcc.23292[Crossref],[PubMed],[Web of Science®],[Google学者]
[40] Ahn S,Koratikara A,Welling M.通过随机梯度Fisher评分进行贝叶斯后验抽样。收录:Langford J,Pineau J,编辑。第29届机器学习国际会议论文集。爱丁堡:国际机器学习协会;2012年,第1591-1598页。arXiv:1206.6380。[谷歌学者]
[41] 纽伊·WK。半参数效率界限。应用经济学杂志。1990;5(2):99-135. doi:10.1002/jae.3950050202[Crossref],[Web of Science®],[Google学者]·Zbl 0705.62033号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。