×

群体遗传推断的近似最大似然估计。 (英语) Zbl 1396.92050号

摘要:在许多群体遗传问题中,参数估计受到难以处理的似然函数的阻碍。因此,近似估计方法已经被开发出来,并且随着计算能力的增长,基于采样的方法变得流行起来。然而,这些方法(如近似贝叶斯计算(ABC))在高维问题中可能效率低下。这导致了更复杂的迭代估计方法的发展,如粒子滤波器。在这里,我们提出了一种基于随机近似的替代方法。通过沿模拟梯度或上升方向移动,该算法生成一系列估计,在给定一组观察到的汇总统计信息的情况下,这些估计最终收敛到最大似然估计。这种策略不会从参数空间的低似然区域中进行太多采样,而且速度很快,即使涉及许多汇总统计数据。我们在提供调整指南方面付出了相当大的努力,以提高稳健性,并在高维摘要统计和低信噪比的问题上取得良好的性能。然后,我们研究了我们得到的方法的性能,并在仿真中研究了其特性。最后,我们重新估计了描述博尔尼亚和苏门答腊猩猩-不丹的人口统计历史的参数。

MSC公司:

92D10型 遗传学和表观遗传学
62页第10页 统计学在生物学和医学中的应用;元分析
2015年1月62日 贝叶斯推断
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Bach,F.(2014):“平均随机梯度下降对logistic回归局部强凸性的适应性”,J.Mach。学习。第15号决议,595-627·Zbl 1318.62224号
[2] Beaumont,M.A.(2010):《进化和生态学中的近似贝叶斯计算》,《年度》。经济评论。进化。美国,41,379-406。
[3] Beaumont,M.A.、W.Zhang和D.J.Balding(2002):“人口遗传学中的近似贝叶斯计算”,《遗传学》,1622025-2035年。
[4] Beaumont,M.A.、J.-M Cornuet、J.-M.Marin和C.P.Robert(2009):“自适应近似贝叶斯计算”,《生物特征识别》,96,983-990·Zbl 1437.62393号
[5] Bertl,J.(2014):“带案例研究的近似最大似然算法”,维也纳大学博士论文。
[6] 布鲁姆,J。R.(1954):“多维随机近似方法”,《数学年鉴》。统计,25737-744·Zbl 0056.38305号
[7] Blum,M.G.B.,M.A.Nunes,D.Prangle和S.A.Sisson(2013):“近似贝叶斯计算中降维方法的比较综述”,《统计科学》。,28, 189-208. ·Zbl 1331.62123号
[8] Creel,M.和D.Kristensen(2013):“间接似然推断(修订)”,UFAE和IAE工作文件931.13。URL。
[9] Davison,A.C.和D.V.Hinkley(1997):Bootstrap方法及其应用,剑桥大学出版社,剑桥·Zbl 0886.62001号
[10] De Maio,N.,C.Schlötterer和C.Kosiol(2013):“使用多态性感知系统发育模型将类人猿基因组进化跨时间尺度联系起来,”Mol.Biol。演变。,30, 2249-2262.
[11] De Valpine,P.(2004):“加权后验核密度估计的蒙特卡罗状态空间可能性”,《美国统计协会期刊》,第99期,第523-536页·Zbl 1117.62314号
[12] Dieuleveut,A.和F.Bach(2016):“大步距非参数随机近似”,《美国统计年鉴》,第44卷,第1363-1399页·Zbl 1346.60041号
[13] Diggle P.J.和R.J.Gratton(1984):“隐式统计模型的蒙特卡罗推断方法”,J.R.Stat.Soc.B,46,193-227·Zbl 0561.62035号
[14] Drovandi,C.C.、A.N.Pettitt和M.J.Faddy(2011):“使用间接推断的近似贝叶斯计算”,J.R.Stat.Soc.C,60,317-337。
[15] Ehrlich,E.,A.Jasra和N.Kantas(2013):“具有棘手可能性的隐马尔可夫模型的无梯度参数估计,”Methodol。计算。申请。概率。,17, 1-35.
[16] Ewing,G.和J.Hermisson(2010年):“MSMS:一个结合模拟程序,包括单个位点的重组、人口结构和选择”,生物信息学,26,2064-2065。
[17] Fearnhead,P.和D.Prangle(2012):“构建近似贝叶斯计算的汇总统计:半自动近似贝叶斯计算”,J.R.Stat.Soc.B,74419-474·Zbl 1411.62057号
[18] Fermanian,J.-D.和B.Salanié(2004):“非参数模拟最大似然估计方法”,《计量经济学》。理论。,20, 701-734. ·Zbl 1081.62107号
[19] Forneron,J.-J.和S.Ng(2015):“模拟估算与辅助统计的ABC”,技术报告,arXiv。
[20] Gouriéroux,C.、A.Monfort和E.Renault(1993):“间接推断”,J.Appl。计量经济学。,8, 85-118.
[21] Gutenkunst,R.N.、R.D.Hernandez、S.H.Williamson和C.D.Bustamante(2009):“从多维SNP频率数据推断多个人群的联合人口统计学历史”,《公共科学图书馆·遗传学》。,5, 1-11.
[22] Gutmann,M.U.和J.Corander(2016年):“基于模拟器的统计模型的无似然推理的贝叶斯优化”,J.Mach。学习。研究,17,1-47·Zbl 1392.62072号
[23] Härdle,W.,M.Müller,S.Sperlich和A.Werwatz(2004):非参数和半参数模型,统计学中的Springer系列。纽约州施普林格·Zbl 1059.62032号
[24] Heggland,K.和A.Frigessi(2004):“间接推断中的函数估计”,《J.R.Stat.Soc.B》,第66期,第447-462页·Zbl 1062.62098号
[25] Kiefer,J.和J.Wolfowitz(1952):“回归函数最大值的随机估计”,《数学年鉴》。统计,23,462-466·Zbl 0049.36601号
[26] Locke,D.P.,L.W.Hillier,W.C.Warren,K.C.Worley,L.V.Nazareth,D.M.Muzny,S.-P.Yang,Z.Wang,A.T.Chinwalla,P.Minx,M.Mitreva,L.Cook,K.D.Delehaunty,C.Fronick,H.Schmidt,L.A.Fulton,R.S.Fulton、J.O.Nelson,V.Magrini,C.Pohl,T.A.Graves,C.Markovic,A.Cree,H.Dinh,J.Hume,C.L.Kovar,G.R.Fowler,G。Lunter、S.Meader、A.Heger、C.P.Ponting、T.Marques-Bonet、C.Alkan、L.Chen、Z.Cheng、J.M.Kidd、E.E.Eichler、S.White、S.Searle、A.J.Villela、Y.Chen、P.Flicek、J.Ma、B.Raney、B.Suh、R.Burhans、J.Herrero、D.Hausler、R.Faria、O.Fernando、F.Darre、D.Farré、E.Gazave、M.Oliva、A.Navarro、R.Roberto、O.Capozzi、N。Archidiacono、G.Della Valle、S.Purgato、M.Rocchi、M.K.Konkel、J.A.Walker、B.Ulmer、M.A.Batzer、A.F.Smit、R.Hubley、C.Casola、D.R.Schrider、M.W.Hahn、V.Quesada、X.S.Puente、G.R.Ordoñez、C.López-Otín、T.Vinar、B.Brejova、A.Ratan、R.S.Harris、W.Miller、C.Kosiol、H.A.Lawson、V.Taliwal、A.Martins、A.Siepel、A。Roychoudhury,X.Ma,J.Degenhardt,C.D.Bustamante,R.N.Gutenkunst,T.Mailund,J.Y.Dutheil,A.Hobolth,M.H.Schierup,O.A.Ryder,Y.Yoshinaga,P.J.de Jong,G.M.Weinstock,J.Rogers,E.R.Mardis,R.A.Gibbs和R.K.Wilson(2011):“猩猩基因组的比较和人口统计学分析”,《自然》,469,529-533。
[27] Ma,X.,J.L.Kelly,K.Eilertson,S.Musharoff,J.D.Degenhardt,A.L.Martins,T.Vinar,C.Kosiol,A.Siepel,R.N.Gutenkunst和C.D.Bustamante(2013):“种群基因组分析揭示了猩猩的丰富物种形成和人口历史(蓬戈·皮格马乌斯苏门达腊猩猩),《公共科学图书馆·综合》,第8期,第1-11页。
[28] Marjoram,P.和S.Tavaré(2006):“分析分子遗传变异数据的现代计算方法”,《自然评论遗传学》。,7, 759-770.
[29] McKinley,T.、A.R.Cook和R.Deardon(2009):“无可能性流行病模型中的推断”,国际生物统计杂志。,5, 1-37.
[30] Meeds,E.、R.Leenders和M.Welling(2015):“哈密尔顿ABC”,arXiv预印本(arXiv:1503.01916)。
[31] Naduvilezhath,L.N.,L.E.Rose和D.Metzler(2011):“Jaatha:估算人口统计学参数的快速复合类方法”,《分子生态学》。,20, 2709-2723.
[32] Rosenblatt,M.(1991):随机曲线估计,IMS,加利福尼亚州海沃德·Zbl 1163.62318号
[33] Rubio,F.J.和A.M.Johansen(2013):“最大棘手似然估计的简单方法”,电子。J.Stat.,第7期,1632-1654页·Zbl 1327.62075号
[34] Sadegh,P.(1997):“通过同时扰动梯度近似的随机近似进行约束优化”,Automatica,33889-892·Zbl 0875.93573号
[35] Scott,D.(2015):《多元密度估计:理论、实践和可视化》,《概率统计中的威利级数》。纽约威利·Zbl 1311.62004号
[36] Soubeyrand,S.、F.Carpentier、N.Desassis和J.Chadœuf(2009):“基于对比的后验分布推断及其在空间统计中的应用”,Stat.Methodol。,第6页,466-477页·Zbl 1463.62157号
[37] Spall,J.C.(1992):“使用同时扰动梯度近似的多元随机近似”,IEEE T.Automat。控制。,37, 352-355.
[38] Spall,J.C.(2003):《随机搜索和优化导论:估计、模拟和控制》,纽约威利出版社·邮编1088.90002
[39] Stephens,M.(2007):“合并下的推断”,In:Balding,D.J.、Bishop,M.和Cannings,C.(编辑),《统计遗传学手册》,第2卷,John Wiley&Sons,纽约,第三版,第878-908页。
[40] Tellier,A.、P.Pfaffelhuber、B.Haubold、L.Naduvilezhath、L.E.Rose、T.Städler、W.Stephan和D.Metzler(2011):“基于联合位点频谱的精细总结估算物种形成模型的参数”,《公共科学图书馆·综合》第6卷第5页。
[41] Toni,T.、D.Welch、N.Strelkowa、A.Ipsen和M.P.H.Stumpf(2009):“动力学系统中参数推断和模型选择的近似贝叶斯计算方案”,J.Roy。Soc.接口,6187-202。
[42] Wand,M.P.和M.C.Jones(1995):《核平滑》,查普曼和霍尔出版社,博卡拉顿出版社·Zbl 0854.62043号
[43] Wegmann,D.、C.Leuenberger和L.Excoffier(2009):“高效近似贝叶斯计算与无似然马尔可夫链蒙特卡罗耦合”,《遗传学》,1821207-1218。
[44] Wellek,S.(2010):检验等效性和非劣效性的统计假设,CRC出版社,Taylor&Francis,Boca Raton·Zbl 1219.62002号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。