×

高覆盖率与低覆盖率测序下估计成对遗传距离的方差:连锁不平衡的贡献。 (英语) Zbl 1393.92038号

摘要:单倍型之间的平均成对遗传距离是群体突变率(θ)的估计值,也是群体变异的标准度量。随着下一代测序(NGS)方法的出现,可以在不同的采样模式下估计这一群体参数和其他群体参数。一种方法是对高覆盖率的单个基因组进行测序,并计算所有样本对的遗传距离。第二种方法通常用于微生物样本或肿瘤细胞,是测序大量个体覆盖率极低的集合基因组。在覆盖率较低的情况下,成对遗传距离是通过独立采样的位点而不是单个基因组来计算的。在本研究中,我们表明,如果等位基因频率加权的平均成对连锁不平衡为正,那么低覆盖率抽样可以减少遗传距离估计的方差。实际上,这意味着,如果平均而言,成对基因座上最常见的等位基因处于正连锁不平衡状态,那么低覆盖率测序会导致对θ的估计值提高,假设每侧读取深度相似。我们表明,在突变裂谷平衡的无限位点模型的等位基因频率和连锁不平衡的预期分布下,这个结果是成立的。从模拟中,我们发现只有在变异等位基因很少且频率很低的情况下,方差降低的条件才不成立。这些结果应用于肺癌肿瘤的单倍型频率,以计算加权连锁不平衡以及使用高覆盖率与低覆盖率估计遗传距离的预期误差。

MSC公司:

92D10型 遗传学和表观遗传学
62页第10页 统计学在生物学和医学中的应用;元分析
92D15型 与进化有关的问题
62焦耳10 方差和协方差分析(ANOVA)
PDF格式BibTeX公司 XML格式引用
全文: 内政部 内政部

参考文献:

[1] 阿南德,S。;曼加诺,E。;北卡罗来纳州巴里佐内。;博多尼,R。;索罗尼亚,M。;Clarelli,F.,《合并样本的下一代测序:变体筛选指南》,《自然科学》。代表,6(2016),第33735条
[2] Andolfatto,P。;Przeworski,M.,《果蝇自然种群中标准中性模型的全基因组偏离》,遗传学,156,1,257-268(2000)
[3] 费雷蒂,L。;雷内里,E。;Ramos-Onsins,缺失数据序列的中性测试,遗传学,1911397-1401(2014)
[4] 费雷蒂,L。;Ramos-Onsins,S.E。;Pérez-Encisco,M.,《来自池测序的群体基因组学》,《分子生态学》。,22, 22, 5561-5576 (2013)
[5] Fu,Y.-X.,分离位点的统计特性,Theor。大众。《生物学》,48,172-197(1995)·Zbl 0854.92014号
[6] Futschik,A。;Schlötterer,C.,汇集DNA样本大规模平行测序的下一代微生物标记,遗传学,186,1207-218(2010)
[7] 加瓦德,C。;Koh,W。;雷克,S.R.,《单细胞基因组测序:科学现状》,《自然评论遗传学》。,17, 3, 175-188 (2016)
[8] Golding,B.,连锁不平衡的抽样分布,遗传学,108,1,257-274(1984)
[9] Kimura,M.,由于稳定的突变通量,在有限的人群中保持杂合核苷酸位点的数量,遗传学,61,4,893(1969)
[10] 科尔内柳森,T.S。;莫尔特克,I。;Albrechtsen,A。;Nielsen,R.,根据低深度下一代测序计算Tajima的D和其他中性测试统计数据,BMC生物信息学,14,289(2013)
[11] 勒沃廷,R.C。;Kojima,K.-i.,复杂多态性的进化动力学,进化,14,4,458-472(1960)
[12] 李,H。;Durbin,R.,《使用Burrows-Wheeler变换进行快速准确的短读校准》,生物信息学,25,14,1754-1760(2009)
[13] Ling,S。;胡,Z。;杨,Z。;Yang,F。;李毅。;林,P。;Chen,K。;Dong,L。;曹,L。;Tao,Y.,单个肿瘤中极高的遗传多样性表明非达尔文细胞进化的普遍性,Proc。国家。阿卡德。科学。,112、47、E6496-E6505(2015)
[14] Lynch,M.,高覆盖率基因组测序项目的核苷酸多样性、不平衡系数和突变率估计,分子生物学。演变。,25, 11, 2409-2419 (2008)
[15] McKenna,A。;汉娜,M。;班克斯,E。;Sivachenko,A。;Cibulskis,K。;科尔尼茨基,A。;加里梅拉,K。;Altshuler博士。;加布里埃尔,S。;Daly,M.,《基因组分析工具包:用于分析下一代DNA测序数据的MapReduce框架》,《基因组研究》,20,9,1297-1303(2010)
[16] Navin,N.E.,《单细胞癌基因组学的前五年及以后》,《基因组研究》,25,10,1499-1507(2015)
[17] Nielsen,R.,《基因组时代选择性中性的统计测试》,《遗传》,86,641-647(2001)
[18] 彼得森,A.C。;Di Rienzo,A。;Lehesjokl,A.-E。;de la Chapelle,A。;斯莱特金,M。;Frelmer,N.B.,《连锁不平衡在匿名基因组区域上的分布》,《人类分子遗传学》。,4, 5, 887-894 (1995)
[19] Pluzhnikov,A。;Donnelly,P.,测量分子遗传多样性的最佳测序策略,遗传学,1441247-1262(1996)
[20] Reich,D.E。;嘉吉,M。;博尔克,S。;爱尔兰,J。;萨贝蒂,P.C。;Richter,D.J。;Lavery,T。;Kouyoumjian,R。;法哈迪安,S.F。;Ward,R.,《人类基因组中的连锁不平衡》,《自然》,411,6834,199-204(2001)
[21] Schlötterer,C。;托布勒,R。;科夫勒,R。;Nolte,V.,《个体测序池——无需大笔资金挖掘全基因组多态性数据》,《自然遗传学评论》。,15, 749-763 (2014)
[23] Tajima,F.,通过DNA多态性检验中性突变假说的统计方法。,遗传学,123,3,585-595(1989)
[24] Tajima,F.,《群体遗传学中的无限位模型和无限位模型》,J.Genet。,75, 1, 27-31 (1996)
[25] Wakeley,J。;Takahashi,T.,当样本大小超过有效种群大小时的基因系谱,分子生物学。演变。,20, 2, 2008-2013 (2003)
[26] Watterson,G.,关于没有重组的遗传模型中分离位点的数量,Theor。大众。生物学,7,2,256-276(1975)·Zbl 0294.92011号
[27] 威廉姆斯,M.J。;沃纳,B。;巴恩斯,C.P。;Graham,T.A。;Sottoriva,A.,《跨癌症类型中性肿瘤进化的鉴定》,《自然遗传学》。(2016)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。