×

用于ABC模型选择的汇总统计的半自动选择。 (英语) Zbl 1296.92065号

摘要:一个主要的统计目标是在数据的替代解释模型之间进行选择。在许多现代应用中,如群体遗传学,不可能应用基于评估模型的似然函数的标准方法,因为这些方法在数值上很难处理。近似贝叶斯计算(ABC)是用于此类情况的常用替代方法。ABC为每个模型下的许多参数值模拟数据(x),并与观测数据(x{mathrm{obs}})进行比较。在模型中,(S(x))接近(S(x{\mathrm{obs}}),其中(S)将数据映射到汇总统计向量。以前的工作表明,S的选择对ABC的效率和准确性至关重要。本文提供了一种选择好的汇总统计数据进行模型选择的方法。它使用了一个初步步骤,模拟所有模型的许多(x)值,并以此模型作为响应拟合回归。由此产生的模型权重估计值在ABC分析中用作(S)。给出的理论结果证明这是近似低维充分统计量。本文提出了一个实际应用:在人口增长的竞争合并模型中进行选择空肠弯曲菌在新西兰使用多基因座序列分型数据。

MSC公司:

92B15号机组 普通生物统计学
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Atkinson,I.A.和E.K.Cameron(1993):“人类对新西兰陆地生物群和生物群落的影响”,《生态与进化趋势》,第8期,第447-451页。;
[2] Barnes,C.P.,S.Filippi,M.P.H.Stumpf和T.Thorne(2012a):“为ABC模型选择构建汇总统计的慎重方法”,《统计与计算》,22,1181-197·兹比尔1252.62002
[3] Barnes,C.P.,S.Filippi和M.P.H.Stumpf(2012b):“对Fearnhead和Prangle讨论的贡献(2012)。为近似贝叶斯计算构建汇总统计:半自动近似贝叶斯计算,”英国皇家统计学会杂志:B系列,74453。;
[4] Beaumont,M.A.(2008):“种群树中拓扑、发散时间和迁移的联合确定”,收录于:C.Renfrew、S.Matsumura和P.Forster,《模拟、遗传学和人类史前史》编辑。麦当劳研究所专著,第134-154页。;
[5] Beaumont,M.A.、W.Zhang和D.J.Balding(2002):“群体遗传学中的近似贝叶斯计算”,《遗传学》,1622025-2035年。;
[6] Blum,M.G.B.(2010):“近似贝叶斯计算:非参数视角”,《美国统计协会杂志》,105(491),1178-1187·Zbl 1390.62052号
[7] Blum,M.G.B.和O.François(2010):“近似贝叶斯计算的非线性回归模型”,《统计学与计算》,20,63-73。;
[8] Blum,M.G.B.,M.A.Nunes,D.Prangle和S.A.Sisson(2013):“近似贝叶斯计算中降维方法的比较综述”,《统计科学》,第28期,第189-208页·Zbl 1331.62123号
[9] Del Moral,P.、A.Doucet和A.Jasra(2012):“近似贝叶斯计算的自适应序贯蒙特卡罗方法”,《统计与计算》,22(5),1009-1020·Zbl 1252.65025号
[10] Didelot,X.,R.G.Everitt,A.M.Johansen和D.J.Lawson(2011):“模型证据的无似然估计”,贝叶斯分析6(1),49-76·Zbl 1330.62118号
[11] Dingle,K.E.,F.M.Colles,D.R.A.Wareing,M.C.J.Maiden,M.C.J.Ure,R.Maiden.,A.J.Fox,H.J.Bootsma,R.J.Willems,R.Urwin和M.C.Maiden(2001):“空肠弯曲菌的多位点序列分型系统”,《临床微生物学杂志》,39,14-23。;
[12] Drovandi,C.C.和A.N.Pettitt(2011):“使用近似贝叶斯计算估算大型寄生虫种群进化参数”,《生物计量学》,67(1),225-233·Zbl 1217.62128号
[13] Estoup,A.、E.Lombaert、J.-M.Marin、T.Guillemaud、P.Pudlo、C.P.Robert和J.Cornuet(2012年):“利用汇总统计的线性判别分析,通过近似贝叶斯计算估算进化模型概率”,《分子生态学资源》,12(5),846-855。;
[14] Fan,Y.,D.J.Nott和S.A.Sisson(2013):通过回归密度估计进行近似贝叶斯计算。统计数字,234-48。;
[15] Fearnhead,P.和D.Prangle(2012):“构建近似贝叶斯计算的汇总统计:半自动ABC”,《皇家统计学会杂志》,B辑,74419-474·Zbl 1411.62057号
[16] French,N.,S.Yu,P.Biggs,B.Holland,P.Fearnhead,B.Binney,A.Fox,D.H.Grove-White,J.Leigh,W.Miller,P.Muellner和P.Carter(2014):“新西兰弯曲杆菌物种的进化”,载于S.Sheppard和G.Méric,《弯曲杆菌生态学与进化》编辑。凯斯特学术出版社,诺福克。;
[17] Friedman,J.、T.Hastie和R.Tibshirani(2010):“通过坐标下降法实现广义线性模型的正则化路径”,《统计软件杂志》,33(1)。;
[18] Grelaud,A.,C.Robert,J.-M.Marin,F.Rodolphe和J.F.Taly(2009):“吉布斯随机场模型选择的ABC类无网格方法”,贝叶斯分析,4(2),317-336·Zbl 1330.62126号
[19] Hudson,R.R.(2002):“在Wright-Fisher中性遗传变异模型下生成样本”,《生物信息学》,第18期,第337-338页。;
[20] Humphrey,T.、S.O'Brien和M.Madsen(2007):“弯曲杆菌作为人畜共患病原体:食品生产视角”,《国际食品微生物学杂志》,117(3),237-57。;
[21] Joyce,P.和P.Marjoram(2008):“大约足够的统计和贝叶斯计算”,《遗传学和分子生物学的统计应用》,2008年7月。第26条·Zbl 1276.62077号
[22] Kolmogorov,A.N.(1942):“通过有限数量的观测确定分散中心和测量精度(俄语)”,Izv。阿卡德。Nauk,苏联。材料,6,3-32·Zbl 0063.03293号
[23] Liu,J.S.(1996):“都市独立抽样与拒绝抽样和重要性抽样的比较”,《统计与计算》,第6期,第113-119页。;
[24] Marin,J.-M.,N.Pillai,C.P.Robert和J.Rousseau(2013):“贝叶斯模型选择的相关统计数据”,预印本。见·Zbl 1411.62072号
[25] Mullner,P.、S.E.F.Spencer、D.J.Wilson、G.Jones、A.D.Noble、A.C.Midwinter、J.M.Collins-Emerson、P.Carter、S.Hathaway和N.P.French(2009):“新西兰人类弯曲菌病的来源:比较遗传学和流行病学方法”,《感染、遗传学和进化》9(6),1311-1319。;
[26] Nordborg,M.(2004):“联合理论”,摘自:D.J.Balding,M.Bishop,C.Cannings(编辑)。《统计遗传学手册》,Wiley-Interscience,第2卷,纽约·Zbl 1131.92349号
[27] Nunes,M.A.和D.J.Balding(2010):“关于近似贝叶斯计算的汇总统计的最佳选择”,《遗传学和分子生物学中的统计应用》,9(1),2010·Zbl 1304.92047号
[28] Rambaut,A.和N.C.Grassly(1997):“Seq-gen:DNA序列沿系统发育树演化的蒙特卡罗模拟应用”,《生物科学中的计算机应用》,第13期,第235-238页。;
[29] Rayner,G.D.和H.L.MacGillivray(2002):“G-and-k和广义G-and-H分布的数值最大似然估计”,《统计与计算》,12(1),57-75·Zbl 1247.62069号
[30] Robert,C.P.(1996):“内在损失”,理论与决策,40(2),191-214·Zbl 0848.90010号
[31] Robert,C.P.(2014):贝叶斯计算工具。《统计及其应用年鉴》,第1期,第16.1-16.25页。;
[32] Robert,C.P.,J.M.Cornuet,J.-M.Marin和N.Pillai(2011):“对近似贝叶斯计算模型选择缺乏信心”,《美国国家科学院学报》,108(37),15112-15117。;
[33] Savill,M.,A.Hudson,M.Devane,N.Garrett,B.Gilpin和A.Ball(2003):“新西兰弯曲杆菌潜在传播途径的阐明”,《水科学与技术》,47(3),31-38。;
[34] Sears,A.、M.G.Baker、N.Wilson、J.Marshall、P.Muellner、D.M.Campbell、R.J.Lake和N.P.French(2011年):“新西兰针对家禽的干预措施后,弯曲菌病显著下降”,《新发传染病》,17(6),1007-1015。;
[35] Sjödin,P.、A.E.Sjö的strand、M.Jakobsson和M.G.B.Blum(2012):“重新排序数据没有证据表明倒数第二个冰川期非洲存在人类瓶颈”,《分子生物学与进化》,29(7),1851-1860。;
[36] Sousa,V.C.、M.A.Beaumont、P.Fernandes、M.M.Coelho和L.Chikhi(2012):“有或无混合的人口差异:使用ABC方法选择模型”,《遗传》,第108期,第521-530页。;
[37] Toni,T.和M.P.H.Stumpf(2010):“系统和种群生物学中动态系统的基于仿真的模型选择”,生物信息学,26(1),104-110。;
[38] Wilson,D.J.、E.Gabriel、A.J.H.Leatherbarrow、J.Cheesbrough、S.Gee、E.Bolton、A.Fox、C.A.Hart、P.J.Diggle和P.Fearnhead(2009):“快速进化和重组对胃肠道病原体空肠弯曲杆菌的重要性”,《分子生物学与进化》,26(2),385-397。;
[39] Wiuf C.和J.Hein(2000):“基因转化的结合”,《遗传学》,155,451-462。;
[40] Yu,S.,P.Fearnhead,B.R.Holland,P.Biggs,M.Maiden和N.P.French(2012):“评估重组和点突变在空肠弯曲菌和大肠弯曲菌单基因座变异生成中的相对作用”,《分子进化杂志》,74(5-6),273-280。;
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。