×

为ABC模型选择构建汇总统计的慎重方法。 (英语) Zbl 1252.62002号

小结:对于几乎所有具有挑战性的科学问题,对可能性的评估即使不是不可能,也是有问题的。近似贝叶斯计算(ABC)允许我们将整个贝叶斯公式应用于可以使用模型模拟但无法直接评估可能性的问题。当比较真实数据和模拟数据的汇总统计数据而不是直接比较数据时,信息会丢失,除非汇总统计数据足够。然而,充足的统计数据并不常见,但如果没有它们,ABC推断中的统计推断应谨慎考虑。
以前,其他作者试图结合不同的统计数据,以便使用搜索和信息启发式构造(近似)足够的统计数据。在这里,我们采用了一个信息理论框架,该框架可用于通过组合不同的统计数据来构建适当的(近似足够的)统计数据,直到将信息损失降至最低。我们从潜在的大量不同统计数据开始,选择捕获(几乎)与完整数据集相同信息的最小数据集。然后,我们证明可以为参数估计和模型选择问题构建这样的统计集,并且我们将我们的方法应用于一系列说明性和实际的模型选择问题。

MSC公司:

62B10型 信息理论主题的统计方面
2015年1月62日 贝叶斯推断
65C60个 统计中的计算问题(MSC2010)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Barnes,C.,Silk,D.,Sheng,X.,Stumpf,M.:合成生物系统的贝叶斯设计。程序。国家。阿卡德。科学。美国108、15190–15195(2011)·doi:10.1073/pnas.1017972108
[2] Beaumont,M.,Zhang,W.,Balding,D.:人口遗传学中的近似贝叶斯计算。遗传学1622025–2035(2002)
[3] Blum,M.G.B.,Tran,V.C.:接触追踪艾滋病毒:近似贝叶斯计算的案例研究。生物统计11,644–660(2010)。doi:10.1093/biostatistics/kxq022·doi:10.1093/biostatistics/kxq022
[4] Burnham,K.,Anderson,D.:模型选择和多模型推理:实用信息理论方法。柏林施普林格出版社(2002年)·Zbl 1005.62007号
[5] Cover,T.,Thomas,J.:《信息理论的要素》。Wiley-Interscience,纽约(2006)·Zbl 1140.94001号
[6] Cox,D.:统计推断原理。剑桥大学出版社,剑桥(2006)·Zbl 1102.62002号
[7] Cox,D.,Hinkley,D.:理论统计学。查普曼&霍尔/CRC,伦敦(1974年)·Zbl 0334.62003号
[8] Dean,T.A.,Singh,S.S.:近似贝叶斯估计量的渐近行为(2011)。arXiv:1105.3655
[9] Dean,T.A.、Singh,S.S.、Jasra,A.、Peters,G.W.:具有难以处理的可能性的隐马尔可夫模型的参数估计(2011)。arXiv:1103.5399·Zbl 1305.62303号
[10] Didelot,X.,Everitt,R.,Johansen,A.,Lawson,D.:模型证据的无似然估计(2010)。http://warwick.ac.uk ·Zbl 1330.62118号
[11] Drovandi,C.C.,Pettitt,A.N.,Faddy,M.J.:使用间接推理的近似贝叶斯计算。J.R.Stat.Soc.,塞尔维亚。C、 申请。《统计》第60、317–337页(2011年)。文件编号:10.1111/j.1467-9876.2010.00747.x·文件编号:10.1111/j.1467-9876.2010.00747.x
[12] 尤恩斯,W.:《数学种群遗传学》,第2版。施普林格,柏林(2004)·Zbl 1060.92046号
[13] Fagundes,N.J.R.,Ray,N.,Beaumont,M.,Neuenschwander,S.等人:人类进化替代模型的统计评估。程序。国家。阿卡德。科学。美国104、17614–17619(2007)。doi:10.1073/pnas.0708280104·doi:10.1073/pnas.0708280104
[14] Fearnhead,P.,Prangle,D.:为近似贝叶斯计算构建摘要统计:半自动近似贝叶斯计算。J.R.Stat.Soc.,塞尔维亚。B(2011)
[15] Gelman,A.,Carlin,J.B.,Stern,H.,Rubin,D.:贝叶斯数据分析,第二版。查普曼&霍尔/CRC,伦敦(2003)·Zbl 1279.62004号
[16] Hein,J.、Schierup,M.、Wiuf,C.:基因系谱、变异和进化。牛津大学出版社,伦敦(2005)·兹比尔1113.92048
[17] Hudson,R.R.:《基因系谱和融合过程》(1991年)
[18] Joyce,P.,Marjoram,P.:近似充分统计和贝叶斯计算。统计应用程序。遗传学。分子生物学。(2008) ·Zbl 1276.62077号
[19] 草间弥生:关于近似充分性。大阪J.数学。13, 661–669 (1976) ·Zbl 0368.62001
[20] Lehmann,E.,Casella,G.:点估计理论。柏林施普林格(1993)·Zbl 0916.62017号
[21] Liepe,J.、Barnes,C.、Cule,E.、Erguler,K.等人:ABC-SysBio–支持GPU的Python近似贝叶斯计算。生物信息学26,1797–1799(2010)·doi:10.1093/bioinformatics/btq278
[22] 麦凯,D.J.:信息理论、推理和学习算法。剑桥大学出版社,剑桥(2003)·Zbl 1055.94001号
[23] Marin,J.、Pillai,N.、Robert,C.、Rousseau,J.:贝叶斯模型选择的相关统计(2011)。arXiv:1110.4700
[24] May,R.M.:生物学中数学的使用和滥用。《科学》303790-793(2004)。数字对象标识代码:10.1126/science.1094442·数字对象标识代码:10.1126/science.1094442
[25] Mézard,M.,Montanari,A.:信息、物理和计算。牛津大学出版社,伦敦(2009)·Zbl 1163.94001号
[26] Nunes,M.A.,Balding,D.J.:关于近似贝叶斯计算汇总统计的最佳选择。统计应用程序。遗传学。分子生物学。9 (2010) ·Zbl 1304.92047号
[27] Pèrez-Cruz,F.:连续分布的Kullback-Leibler散度估计。收录:IEEE国际交响乐。信息论(2008)
[28] Pritchard,J.K.,Seielstad,M.T.,Perez Lezaun,A.,Feldman,M.W.:人类Y染色体的群体增长:对Y染色体微卫星的研究。分子生物学。进化。16, 1791–1798 (1999) ·doi:10.1093/oxfordjournals.molbev.a026091
[29] Ratmann,O.、Jorgensen,O.,Hinkley,T.、Stumpf,M.、Richardson,S.、Wiuf,C.:使用无相似性推理比较幽门螺杆菌和恶性疟原虫蛋白质网络的进化动力学。公共科学图书馆计算。生物3,2266–2278(2007)
[30] Robert,C.:贝叶斯选择。柏林施普林格出版社(2007)·Zbl 1129.62003号
[31] Robert,C.P.,Cornuet,J.-M.,Marin,J.-M,Pillai,N.:对ABC模式选择缺乏信心。程序。国家。阿卡德。科学。美国108、15112–15117(2011)·doi:10.1073/pnas.1102900108
[32] Rudnick,J.,Gaspari,G.:《随机行走的要素》。剑桥大学出版社,剑桥(2010)·兹比尔1086.60003
[33] Secrier,M.、Toni,T.、Stumpf,M.P.H.:反向工程生物信号系统的基础知识。分子生物系统。5, 1925–1935 (2009). doi:10.1039/b908951a·doi:10.1039/b908951a
[34] 邵,J.:数理统计。柏林施普林格出版社(2003)·Zbl 1018.62001号
[35] Tanaka,M.M.、Francis,A.R.、Luciani,F.、Sisson,S.A.:使用近似贝叶斯计算从基因型数据估计结核病传播参数。《遗传学》1731511-1520(2006)。doi:10.1534/genetics.106.055574·doi:10.1534/genetics.106.055574
[36] Thorne,T.,Stumpf,M.P.H.:蛋白质相互作用网络进化的图形光谱分析。J.R.Soc.Interface(2012年)。doi:10.1098/rsif.2012.0220
[37] Toni,T.,Stumpf,M.P.H.:系统和种群生物学中动态系统的基于仿真的模型选择。生物信息学26,104–110(2010)·doi:10.1093/bioinformatics/btp619
[38] Toni,T.,Welch,D.,Strelkowa,N.,Ipsen,A.,Stumpf,M.P.:动力学系统中参数推断和模型选择的近似贝叶斯计算方案。J.R.Soc.接口6187-202(2009)。doi:10.1098/rsif.2008.0172·doi:10.1098/rsif.2008.0172
[39] Wang,Q.,Kulkarni,S.,Verdü,S.:估计连续随机向量之间散度的最近邻方法。参加:IEEE信息理论国际研讨会(2006年)
[40] Wilkinson,R.D.:近似贝叶斯计算(ABC)在模型误差假设下给出了准确的结果(2008)。arXiv:0811.3355
[41] Wilkinson,R.D.、Steiper,M.E.、Soligo,C.、Martin,R.D.,Yang,Z.、Tavaré,S.:通过古生物学和分子数据的综合分析确定灵长类动物的年龄差异。系统。生物学60,16-31(2011)。doi:10.1093/sysbio/syq054·doi:10.1093/sysbio/syq054
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。