×

现场频谱实验。 (英语) Zbl 1220.62141号

摘要:从现有脱氧核糖核酸(DNA)序列评估高结构群体遗传模型参数的似然函数在计算上是禁止的。在这种情况下,可以从数据的汇总统计数据(如站点频率谱(SFS)或其线性组合)中近似推断参数。这种方法被称为近似似然或贝叶斯计算。使用受控集总马尔可夫链和计算交换代数方法,我们计算了在无限多人突变模型下中性进化的非重组轨迹上SFS及其许多经典线性组合的精确似然。利用SFS周围的部分序合并实验图,我们为近似充分性提供了一个决策理论框架。我们还将一系列基于SFS的非重组位点标准中性的经典假设检验扩展到一个更强大的版本,该版本以SFS提供的拓扑信息为条件。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
92D10型 遗传学和表观遗传学
60J22型 马尔可夫链中的计算方法
92C40型 生物化学、分子生物学
65C60个 统计中的计算问题(MSC2010)
92D15型 与进化有关的问题
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Bahlo,M.和;Griffiths,R.(1996)。根据细分群体中的基因树进行推断。西奥。大众。生物学57,79–95·Zbl 0984.9202号 ·doi:10.1006/tpbi.1999.1447
[2] Barvinok,A.(1994)。维数固定时计算多面体积分点的多项式时间算法。数学。操作。第19、769–779号决议·Zbl 0821.90085号 ·doi:10.1287/门19.4.769
[3] Beaumont,M.、Zhang,W.和;Balding,D.(2002年)。群体遗传学中的近似贝叶斯计算。遗传学1622025-2035。
[4] Bertorelle,G.、Benazzo,A.和;Mona,S.(2010年)。ABC作为一个在空间和时间上估计人口统计学的可行框架:有一些缺点,也有很多优点。摩尔生态。19, 2609–2625. ·doi:10.1111/j.1365-294X.2010.04690.x
[5] 伯克纳,M.,&;Blath,J.(2008)。计算无限多站点模型中具有多重碰撞的聚合体的可能性。数学杂志。生物学57,435-465·Zbl 1274.92039号 ·doi:10.1007/s00285-008-0170-6
[6] Cam,L.L.(1964年)。充分性和近似充分性。安。数学。《美国联邦法律大全》第35卷,第1419–1455页·Zbl 0129.11202号 ·doi:10.1214/aoms/1177700372
[7] Casanellas,M.、Garcia,L.和;Sullivant,S.(2005)。小树目录。L.Pachter&B.Sturmfels(编辑),计算生物学代数统计(第291-304页)。剑桥:剑桥大学出版社·兹比尔1376.62075
[8] Diaconis,P.和;Sturmfels,B.(1998)。从条件分布中采样的代数算法。Ann.Stat.26,363–397·Zbl 0952.62088号 ·doi:10.1214/aos/1030563990
[9] Duflo,M.(1997)。随机迭代模型。柏林:施普林格·Zbl 0868.62069号
[10] Erdös,P.、Guy,R.和;Moon,J.(1975)《关于改进隔墙》。J.隆德。数学。Soc.(2)9565–570·Zbl 0312.05008号 ·doi:10.1112/jlms/s2-9.4.565
[11] Ewens,W.(1972年)。选择性中性等位基因的抽样理论。西奥。大众。生物3,87–112·Zbl 0245.92009号 ·doi:10.1016/0040-5809(72)90035-4
[12] Ewens,W.(1974年)。关于无限等位基因和无限位点模型抽样理论的注记。西奥。大众。生物学6,143-148·Zbl 0291.92006号 ·doi:10.1016/0040-5809(74)90020-3
[13] Ewens,W.(2000)。数学种群遗传学(第二版)。柏林:施普林格·Zbl 0422.92011号
[14] Fay,J.和;Wu,C.(2000)。正达尔文选择下的搭便车。遗传学1551405-1413。
[15] Felsenstein,J.(1981)。DNA序列进化树:一种最大似然方法。《分子进化杂志》。17, 368–376. ·doi:10.1007/BF01734359
[16] Felsenstein,J.(2006)。合并似然估计的准确性:我们需要更多位点、更多序列还是更多位点?分子生物学。进化。23, 691–700. ·doi:10.1093/molbev/msj079
[17] 格雷森·D·;Stillman,M.(2004年)。Macaulay 2,用于代数几何研究的软件系统。网址:www.math.uiuc.edu/Macaulay2。
[18] Griffiths,R.和;Tavare,S.(1994)。群体遗传学中的祖先推断。统计科学。,9, 307–319. ·Zbl 0955.62644号 ·doi:10.1214/ss/1177010378
[19] Griffiths,R.和;Tavare,S.(1996)。群体遗传学中的马尔可夫链推理方法。数学。计算。建模,23,141–158·Zbl 0853.92014号 ·doi:10.1016/0895-7177(96)00046-5
[20] Griffiths,R.和;Tavare,S.(2003)。中性突变的系谱。P.Green、N.Hjort和;S.Richardson(编辑),《高度结构化随机系统》(第393–412页)。伦敦:牛津大学出版社。
[21] Hastings,W.(1970年)。使用马尔可夫链的蒙特卡罗抽样方法及其应用。生物特征57、97–109·Zbl 0219.65008号 ·doi:10.1093/biomet/57.1.97
[22] Hemmecke,R.、Hemmecker,R.和;Malkin,P.(2005)。4ti2版本1.2–计算希尔伯特基、格拉夫基、复曲面Gröbner基等。网址:www.4ti2.de。
[23] Hosten,S.、Khetan,A.和;Sturmfels,B.(2005年)。求解似然方程。找到计算。数学。5(4), 389–407. ·Zbl 1097.13035号 ·doi:10.1007/s10208-004-0156-8
[24] Hudson,R.(1993)。如何和为什么生成基因系谱。摘自:Clark.A.、Takahata,N.(编辑)《分子进化机制》(第23-36页)。桑德兰:西努埃尔。
[25] Hudson,R.(2002年)。在Wright–Fisher遗传变异中性模型下生成样本。生物信息学18,337–338·doi:10.1093/bioinformatics/18.2.337
[26] Iorio,M.和;Griffiths,R.(2004)。合并历史的重要性抽样。I.高级申请。概率。,36, 417–433. ·Zbl 1045.62111号 ·doi:10.1239/aap/1086957579
[27] Jones,G.和;Hobert,J.(2001)。通过马尔可夫链蒙特卡罗诚实地探索难处理的概率分布。统计科学。16(4), 312–334. ·Zbl 1127.60309号 ·doi:10.1214/ss/1015346317
[28] Jukes,T.和;Cantor,C.(1969年)。蛋白质分子的进化。H.Munro(编辑),《哺乳动物蛋白质代谢》(第21-32页)。圣地亚哥:学术出版社。
[29] Kemeny,Snell(1960年)。有限马尔可夫链。普林斯顿:Van Nostrand·Zbl 0089.13704号
[30] Kendall,D.(1975年)。数学谱系学中的一些问题。收录于:Gani,J.(编辑),《概率统计视角》(第325-345页)。圣地亚哥:学术出版社·兹比尔0356.60040
[31] Kingman,J.(1982年a)。融合。斯托克。过程。他们的申请。13, 235–248. ·Zbl 0491.60076号 ·doi:10.1016/0304-4149(82)90011-4
[32] Kingman,J.(1982年b)。关于大量人口的谱系。J.应用。普罗巴伯。19、27至43·Zbl 0516.92011号 ·doi:10.2307/3213548
[33] 科尔莫戈罗夫(Kolmogorov,A.)(1942年)。高斯参数估算统计。牛市。阿卡德。科学。URSS序列。数学。6, 3–32. ·Zbl 0063.03293号
[34] Loera,J.D.、Haws,D.、Hemmecke,R.、Huggins,P.、Tauzer,J.&Yoshida,R.(2004)。点阵点枚举:LattE,通过Barvinok锥分解计算有理凸多面体内点阵点数量的软件。网址:www.math.ucdavis.edu/\(\sim\)latte。
[35] Marjoram,P.、Molitor,J.、Plagnol,V.和;Tavare,S.(2003)。无可能性的马尔可夫链蒙特卡罗。程序。国家。阿卡德。科学。美国100、15、324–15328·doi:10.1073/pnas.0306899100
[36] Metropolis,N.、Rosenbluth,A.、Rosenbruth,M.、Teller,A.和;Teller,E.(1953年)。快速计算机器的状态方程计算。化学杂志。物理学。21087-1092年·doi:10.1063/1.1699114
[37] 莫塞尔,E.,&;Vigoda,E.(2005)。系统发育MCMC算法对混合树具有误导性。科学,3092207-2209·doi:10.1126/科学.1115493
[38] 莫塞尔,E.,&;Vigoda,E.(2006年)。马尔可夫链蒙特卡罗算法在贝叶斯系统发育推断中的局限性。附录申请。概率。,16(4),2215–2234·Zbl 1121.60078号 ·doi:10.1214/105051600000000538
[39] Rosenblatt,M.(1974年)。随机过程。柏林:施普林格·Zbl 0287.60031号
[40] Sainudiin,R.和;Stadler,T.(2009)《统一的多分辨率合并:Kingman-Tajima n合并的马尔可夫集总》。UCDMS研究报告2009/4,2009年4月5日(已提交)。可在http://www.math.canterbury.ac.nz/\(\sim\)r.sainudiin/prints/SixCoal.pdf。
[41] 赛努丁,R.,&约克·T(2009)。从小系统发育树空间中自动验证冯·诺依曼排斥取样。算法分子生物学。4, 1. ·doi:10.1186/1748-7188-4-1
[42] Sainudiin,R.、Clark,A.和;Durrett,R.(2007)。人类SNP密度基因组变异的简单模型。BMC基因组学8,146·doi:10.1186/1471-2164-8-146
[43] Semple,C.和;Steel,M.(2003)。系统发育学。牛津大学出版社,伦敦·Zbl 1043.92026
[44] Sisson,S.、Fan,Y.和;Tanaka,M.(2007)。无可能性的连续蒙特卡罗。程序。国家。阿卡德。科学。美国104、1760–1765年·Zbl 1160.65005号 ·doi:10.1073/pnas.0607208104
[45] Slatkin,M.(2002)。重要抽样的矢量化方法及其在突变和迁移模型中的应用。西奥。大众。生物学62,339–348·Zbl 1102.92041号 ·doi:10.1016/S0040-5809(02)00007-2
[46] Stephens,M.和;Donnelly,P.(2000)。分子群体遗传学中的推断。《美国法律总汇》第62卷第605页至第655页·Zbl 0962.62107号 ·doi:10.1111/1467-9868.00254
[47] Tajima,F.(1989)。用DNA多态性检验中性突变假说的统计方法。遗传学123、585–595。
[48] Tavaré,S.(1984)。线性衰减和系谱过程及其在种群遗传学模型中的应用。西奥。大众。生物学26,119-164·兹伯利0555.92011 ·doi:10.1016/0040-5809(84)90027-3
[49] 桑顿(Thornton,K.)、詹森(Jensen,J.D.)、贝克特(Becquet,C.)和;Andolfatto,P.(2007)。基因组中最近选择图谱绘制的进展和前景。遗传98、340–348。
[50] Wakeley,J.(2007)。凝聚理论:导论。格林伍德村:Roberts&有限公司。
[51] Watterson,G.(1975)。关于没有重组的遗传模型中分离位点的数量。西奥。大众。生物学,7256–276·Zbl 0294.92011号 ·doi:10.1016/0040-5809(75)90020-9
[52] Weiss,G.和;von Haeseler,A.(1998年)。使用似然方法推断人口历史。遗传学,1491539-1546。
[53] Yang,Z.(2000)。最简单的系统发育估计问题的复杂性。程序。R.Soc.伦敦。生物科学B。267、109至119·doi:10.1098/rspb.2000.0974
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。