摘要

推断有效人口规模的变化(N个e(电子))最近,人们对濒危物种的保护和人类历史研究特别感兴趣。当前估算最近历史数据的方法N个e(电子)无法检测到涉及多个瓶颈、下降和扩张事件的复杂人口轨迹。我们开发了一个理论和计算框架,从当代个体样本中广泛重组率下观察到的基因座对连锁不平衡(LD)谱推断过去100代内的人口统计历史。我们的模型中包括了所有前代对观测LD的累积贡献,并使用遗传算法搜索历史序列N个e(电子)最能解释观察到的LD光谱的值。该方法可以应用于使用各种基因分型和DNA测序数据从大样本到少于10个个体的样本:单倍体、具有阶段性或非阶段性基因型的二倍体和低覆盖测序的假单倍体数据。通过计算机模拟测试了该方法对基因分型错误、样本的时间异质性、种群混合和亚种群结构划分的敏感性,表明该方法对模型假设的偏差具有很高的容忍度。计算机仿真还表明,当推理涉及最近的时间段时,该方法优于其他主流方法。对各种人类和动物种群的数据进行分析,得出的结果与以前通过其他方法或历史事件记录进行的估计相一致。

介绍

已经开发了几个模型和复杂的数学工具来从快速增长的基因组数据中提取人口统计信息。这些模型侧重于突变和重组产生的遗传变异的不同方面。当不考虑重组时,唯一的自由参数是突变率,它成为合并过程的节拍器(哈德逊1990). 由于突变积累缓慢,这些模型适合于估计有效的种群规模(N个e(电子))自古以来(Atkinson等人。2008)样本中所有序列的合并时间给定了极限。重组的纳入更好地反映了核基因组的现实,并改进了对过去的估计N个e(电子)不仅在最近的时期,也在遥远的时期,因为在同一分析中可以考虑几个基因组片段(李和杜宾2011;Schiffels和Durbin 2014;Palacios等人。2015;Terhorst等人。2017;Speidel等人。2019). 然而,突变在估计谱系分支长度中的作用仍然很重要,重组的影响仅限于较小的基因组规模。有相当准确的估计N个e(电子)在几千代人的古代历史中,这些方法不能很好地估计最近的时间范围(比如200代以内)。

完全基于基因座间连锁不平衡(LD)理论的模型通过重组事件的发生率来测量时间,当基因座距离较远时,重组事件的值可能比突变率大几个数量级。因此,特定的突变率变得无关紧要,LD对种群规模的推断基本上涉及到最近的人口统计学史,这是理解当前小种群遗传组成的关键。在某种程度上,一个种群的LD结构可以用按血统划分的身份域分布(IBD)来描述,而最近的人口统计学可以从这种分布中推断出来,即个体共享的域较长,对应较近的共同祖先,因此意味着较小N个e(电子)在最近的过去(Hayes等人。2003;Palamara等人。2012;Browning和Browning 2015). 然而,只有在大样本人群中很少出现的长IBD道才能被可靠地识别。因此,通常需要大量的阶段性基因型样本,以便对人口统计学的总体趋势达成某种解决方案。

通过基因座对的等位基因之间的相关性,给出了LD结构的简化表示(Sved和Hill 2018). 在恢复过去的人口统计数据方面,双基因座统计数据提供了比单基因座统计更强大的功能(Ragsdale和Gutenkunst 2017年). 这一基本理论已被证明有助于估计电流N个e(电子)来自未连锁位点之间LD的小种群(Waples 2006年;2008年Waples and Do;Sved等人。2013;Wang等人。2016)并被扩展到推断N个e(电子)最近从LD在连锁基因座之间(Hayes等人。2003;Tenesa等人。2007;Qanbari等人。2010;Corbin等人。2012;Mörseburg等人。2016). 基本思想是,不同遗传距离的SNP对之间的LD提供了关于N个e(电子)在过去的不同时间点。

几种方法假设在特定重组率下,基因座之间的预期LD是特定世代遗传漂变的结果(Barbato等人。2015;2015年Mezzavilla和Ghiroto;Hollenbeck等人。2016). 假设在遗传距离1/(2)处观察到的基因座对之间的LDt吨)摩根反映了N个e(电子)价值t吨世代相传,他们能够在人口规模缓慢变化的情况下估计总体趋势,这对于一种相当简单的方法来说是一个显著的成就。然而,尽管紧密连锁基因座的LD比松散连锁基因座LD更强烈地依赖于过去发生的遗传漂变,但任何给定遗传距离的基因座之间的LD大小是遗传漂变累积效应的结果(由N个e(电子)−1(产生LD)和重组(由减少LD的遗传距离决定)发生在所有前几代。

在这里,我们推导了过去每一代人对由特定遗传距离分隔的基因座对LD的预期贡献的方程式。我们还对采样效应(即由于有限的样本量导致的LD)进行了校正,涵盖了基因分型和DNA测序中最常见的SNP数据类型:通常由古老DNA测序产生的低覆盖基因组的二倍体非相位基因型、二倍体相态基因型和假单倍体基因型(Haak等人。2015). 根据不同遗传距离的观察LD提供过去的差异信息的原理N个e(电子)在不同的世代,我们开发了一种优化方法(遗传优化N个e(电子)估计[GONE]),实现遗传算法(米切尔1998)从一小部分当代个体的SNP数据推断一个群体的近期人口历史。通过不同人口场景下的仿真验证了该方法的有效性,并与以前的主流方法MSMC进行了比较(Schiffels和Durbin 2014),关联(Speidel等人。2019),以及之前LD临时使用的算法N个e(电子)方法,如SNeP(Barbato等人。2015)、NeON(2015年Mezzavilla和Ghiroto),或LinkNe(Hollenbeck等人。2016). 接下来,我们从动物和人类的一些实际数据集推断出历史人口规模。

结果

理论发展

我们导出了对给定一对基因座的等位基因之间协方差平方的期望(D类2)及其两个方差的乘积(W公司),这样就可以用标准化的量来测量基因座之间的LDδ2=E类D类2/E类W公司(Ohta和Kimura 1969年)(见补充文件,在线补充材料).

恒定有效人口规模

当种群规模在世代之间保持不变时,预期值E类D类2E类W公司通过考虑第三个统计量可以获得连续世代E类[D类(1−2第页)(1−2q个)],其中第页q个这两个位点的等位基因频率是多少(Hill and Robertson 1968年;希尔1975). 第三个统计值相当于我们近似的第(2,2)阶矩D类2W公司假设任何一代产生的大多数新LD都是通过作用于旧变体的漂移构建的(参见补充文件中的附录,在线补充材料).

在平衡状态下,经过多次有效种群数量恒定的世代N个e(电子)恒定突变率和重组率c,δ2可以通过以下方式进行预测N个e(电子)c作为:
δc2=1+c2+N个e(电子)-12N个e(电子)1-1-c2+2.21-c2 .
(1)

请注意δ2实际上是平方相关系数第页2=D类2/W公司(希尔和罗伯逊1968)通过方差乘积加权,即,δ2=E类第页2W公司/E类W公司(罗杰斯2014). 在简化假设下(可忽略不计c2N个e(电子)−1),方程式(1)接近经典斯维德(1971)近似值,第页2≈ 1/[4N个e(电子)c+2],对于未知相位的情况。方程式(1)对整个范围有效c值。对于独立的基因座(c=½)并忽略该术语N个e(电子)−1,方程式(1)简化为5/(6N个e(电子)). 同样,单倍体基因组的对应方程式(补充文件中的等式S2,在线补充材料)减少到2/(3N个e(电子)). 两者之间的数量差异δ2第页2通常被认为是较小的,尤其是中间等位基因频率。然而,在估计N个e(电子)如果第页2而不是δ2 已使用(补充图S1,在线补充材料).

实际上,抽样也可能产生LD(相当于重组和漂移的一个额外生成),因此需要纠正其影响,以获得人口估计值(而不是样本)δ2补充文件中给出了几种数据类型(单倍体、相二倍体、非相二倍体和假单倍体基因组)的近似校正,在线补充材料.

可变有效人口规模

当种群规模随时间变化时δ2不成立的历史系列N个e(电子)无法从单个δ2值。对于特定的复合率(c)当前的期望D类c2可以表示为:
E类D类c2=0(C类·2N个μ),
哪里C类(补充文件第10节,在线补充材料)是一代发生的单个突变对当前平方协方差的贡献回到时间和术语2N个μ是该代新突变的数量,N个是有效的人口规模N个e(电子)第代μ假定突变率在基因座和世代之间是恒定的。
以同样的方式,E类W公司c可以表示为:
E类W公司c==0(w个·2N个μ)μ=0 V(V)x个·π=0-11-1N个 ,
哪里w个是一代发生突变的方差对当前乘积的贡献,以及V(V)x个是背景中性方差。负指数因子等于1。请注意,右侧的表达式显示了遗传漂变导致的遗传变异下降。期望值比率E类D类c2E类W公司c对于特定的复合值c变得独立于μ,
δc2=E类D类c2E类W公司c==0(C类·2N个)=0 V(V)x个·π=0-11-1N个 .

时间序列的估计N个值可以从观测值中获得δc2 具有不同重组率的标记对的值c因此,我们开发了一种遗传算法,并将其应用到计算机程序(GONE)中,以搜索时间N个使预期值与观测值之差的平方和最小的值δc2 值(请参见材料和方法)。补充图S2,在线补充材料,显示了观测值和优化值之间的密切一致δc2针对不同的人口统计情景。

仿真结果

超过108对重组率和种群规模的每个组合进行重复模拟,以检查预测的准确性δ2对于二倍体的恒定种群规模(等式1)和单倍体(如补充文件中的S2,在线补充材料). 这些预测结果与整个重组率范围内的模拟结果非常接近(补充表S1图S3,在线补充材料). 即使在重组率范围的两个边界上,它们也是准确的c(c)=0.5和c(c)=0,其中trueδ2价值观过去是有争议的。表和图也显示了其他方法的预测。

我们评估了GONE推断真实历史序列的能力N个e(电子)模拟种群的值。根据LD数据在重组率为0.001到0.5的基因座之间进行推断。模拟了种群大小的几个变化曲线,并用GONE分析了所得遗传数据,与三种主要方法MSMC进行了比较(Schiffels和Durbin 2014),关联(Speidel等人。2019),以及上一个LD临时使用的算法N个e(电子)方法(如SNeP、NeON或LinkNe)。结果如所示图1用于人口统计场景的代表性样本。在最近200代的范围内,GONE优于其他方法,这些方法最多能够检测出分阶段和非分阶段数据的总体趋势。之前的简单LD-临时N个e(电子)和Relate和MSMC相比,该方法表现相当不错,尤其是对于非相位数据。Relate在最近几代人中容易出现较大的估计误差,这表明合并方法更适合古代N个e(电子)估计值。

图1。

时间估算N个e(电子)在从现在(第0代)到过去220代的不同人口场景下,从分阶段(左)和非分阶段(右)数据中模拟的人口。绿色区域是真实(模拟)的人口规模。黑色、橙色、蓝色和紫色线分别由GONE、MSMC、Relate(仅适用于相位数据)和LinkNe软件的方程式进行估算。样本由4个MSMC二倍体个体(8个单倍体)和20个其他方法的二倍体个人组成。估算中涉及的SNP总数在255000到450000之间,具体取决于情景。未对数据应用MAF阈值。

图2说明了GONE估算的不同特征。首先,估计的准确性随着时间的推移而降低:古老的人口结构变化,就像图中140代的瓶颈一样(图2B),检测精度低于最近的(图2A). 第二,世代重叠会导致近几代人的低估(图2C). 第三,从过去混合多个群体的合成群体中得出的推论在N个e(电子)从时间混合到现在的估计(图2D). 第四,当分析根据标准岛屿模型构建的集合种群时,不会出现失真或偏差,并且各子种群之间的迁移率很高(图2E). 这些估计值对应于集合种群的总规模,与经典的预期有效种群规模一致N个e(电子)理论。然而,当移民率较低时,对最近几代人的估计有很大的偏差(图2F). 第五,如果基数误差不大于1%,则不会对估计值产生重大影响,这是对通用商业基因分型和测序平台数据的合理假设(图2G). 其他方法需要高质量的序列或应用阈值MAF来消除因系谱或不同位点等位基因之间的相关性而引起的畸变。第六,非临时个体的抽样导致最近几代人的估计存在偏差(图2H). 这个场景假设每个个体都是在过去100代中的每一代中采样的。这些估计中的失真似乎很严重,但影响的推理时间(约四分之一)小于采样期的长度。最后,随机选择小样本中的个体会导致不同样本的估计值存在差异,尤其是最近几代的样本(图2I). 如果来自遥远基因座的数据(比如c(c)>0.05)不包括在分析中,导致更一致的估计(图2J).

图2。

时间估算N个e(电子)GONE在从现在(第0代)到过去220代的不同模拟人口场景下。真正的人口规模是绿色阴影区和n个是用于分析的个人样本量。对于所有面板,黑线表示所有来自c=0.001至c=0.5(选项hc公司=0.5),而红线是指使用来自c=0.001至0.05(hc公司= 0.05). (A类)和(B类)检测不同时间发生的瓶颈。(C类)具有重叠代的场景,每代有三个队列,并进行混合短抽样。(D类)一个群体N个e(电子)=1000分为两个群体N个e(电子)=1000个,它们被隔离了100代,然后在50代前混合成一个单一种群N个e(电子)= 1,000. (E类)和(F类)由两个亚群组成的混合群N个e(电子)=1000个,分别有2%和0.2%的迁移。(G公司)不同基站呼叫错误率下的估计。从上到下分别为10%、1%、0.1%和0%,后两者无法区分。(H(H))在100个连续世代的时间里,从人群中抽取了100个个体,每代抽取一个个体。()和(J型)八个小样本(n个=10)同时从同一人群中提取。

应用于实际数据

接下来,我们应用该方法推断几个人类和动物种群的近期人口变化(图3)尺寸差异很大。为了减少抽样对模拟中观察到的最近几代人估计值的影响,分析中排除了重组率>0.05的LD数据。的推论N个e(电子)从一组来源不明的家猪中发现的家猪,在取样前在受控交配条件下饲养26代,与从观察到的个体系谱信息中获得的估计值一致(Saura等人。2015)除了接近种群结构的世代。如模拟所示,这种偏差正是混合不同种群后预期的伪影类型(图2D).

图3。

时间估算N个e(电子)具有不同样本大小的真实人群(n个). 猪:伊比利亚猪的Guadyerbas种群。蓝色细线是对N个e(电子)使用家谱数据中的个人贡献(Saura等人。2015). 芬兰:芬兰人口估计。阴影区给出了通过运行20个重复获得的估计值的90%置信区间,每个重复对应于每个染色体50000个SNP的随机样本。细长的蓝色虚线是通过以下公式得出的估计值布朗宁和布朗宁(2015)针对芬兰北部5402人的NFBC样本。细绿线是对N个e(电子)假设复合速率恒定为1.2 cM/Mb。鲑鱼:苏格兰迪河两条支流的大西洋鲑鱼。新石器时代:来自苏格兰西部和北部的两个新石器时期样本,采样周期约为60代。ASHKENAZI犹太人:东欧和西欧人口样本。米兹拉希犹太人:来自高加索人口以及伊朗和伊拉克的样本。除了NEOLITHIC(涉及假单倍体基因组)外,所有估计均假设没有MAF阈值和非时相基因组。

估计很小N个e(电子)猪的数值与近期的大值相比N个e(电子)从芬兰人口的99个样本中推断出的数值,在过去20代中,芬兰人口经历了快速增长。在这种情况下,数据是从测序分析中获得的,并且有大量SNP(>900万)可用。因此,我们进行了20次重复分析,每一次都从每条染色体中随机抽取了50000个SNP。红色粗线表示重复次数的平均值,阴影区域表示从重复次数中获得的置信区间。这些估计值与之前的一项基于对5402名大样本IBD片段分析的研究有所不同(Browning和Browning 2015). 虽然IBD推断假定人口数量单调增加,但我们发现芬兰人口在中世纪减少,这实际上可能是铁器时代和中世纪部分分化人口混合的结果(Øversti等人。2019). 我们最近的估计显然低于芬兰人的实际人数。这种偏差只能通过有效尺寸之间的实质性差异来部分解释(N个e(电子))和人口普查规模(N个)通常在自然种群中观察到。此外,该图显示,在整个基因组中使用恒定重组率为1.2 cM/Mb的替代图(绿色连续线)不会对芬兰人口的人口统计学估计产生很大差异。

对1985年至1992年间出生于苏格兰迪伊河两条支流的鲑鱼样本的分析表明,该方法用于复制样本时具有一致性。这两个估计值都与抽样前大约十代人的人口数量下降一致。尽管猪和人使用了精细规模的重组图谱,但这种鲑鱼分析假设整个基因组的重组率为1 cM/Mb,这是几位作者估计的近似平均值(菲利普斯等人。2009;Lien等人。2011;Tsai等人。2016). 鲑鱼基因组最近经历了二倍体化和几个染色体重排事件(Lien等人。2016)并且对其中一些人来说仍然是多态的。因此,假设的物理遗传图和估计的遗传图之间缺乏连续性,但通过删除重组率较大的位点对(超过c(c)=0.05),我们避免了由于间隙或缺乏连续性而导致的大多数并发症。

公元前2500年至4500年的古代人类遗骸样本分析(Olalde等人。2018)生产N个e(电子)从两个苏格兰样本中估计有2000至6000人。对这些古老DNA样本进行基因分型的“随机抽取”方法产生假单倍体基因组(Haak等人。2015). 尽管其他N个e(电子)估计员无法充分处理此类数据,我们的方法可以直接修改以适应它(补充文件,在线补充材料). 100代扩展采样周期的模拟结果(图2H)在大约四分之一的采样时间内显示出估计偏差。因此,最近N个e(电子)应谨慎考虑这些样本的估计值。

来自东欧和西欧两个德系犹太人样本的推断(Behar等人。2010)显示类似的N个e(电子)对于最遥远的世代来说,偏差增加的轨迹。The strong reduction inN个e(电子)据推测,60岁左右的人与1世纪的犹太-罗马战争大致同时代,这场战争通常被认为是犹太人散居到欧洲、非洲和亚洲的原因(古德曼2004). 这个民族近年来的大规模扩张(斯莱特金2004)在我们的结果中没有观察到,这只显示了适度的增加。这再次说明了该方法在检测N个e(电子)最近从非常小的样本中。Mizrahi基因组分析显示N个e(电子)这与当时这些社区被纳入帕提亚帝国,没有受到犹太罗马战争的影响这一事实是一致的(古德曼2004). 伊斯兰教后期的扩张对N个e(电子)观察到,但N个e(电子)尤其在高加索米兹拉希姆地区发现,这与13世纪至16世纪期间对该地区的多次入侵是一致的(歌手1906)后来,伊朗和伊拉克的米兹拉希犹太人人数有所下降。

讨论

我们的方法能够从分期和非分期基因型推断过去一百代人的人口统计学历史。这些短期推断似乎比当前合并方法和基于LD的方法获得的结果更准确,忽略了累积漂移效应。通过绘制突变图来估计系谱树分支的长度,使得合并理论更适合模拟古代人口统计学,因为突变在种群中积累非常缓慢。因此,合并方法的估计值偏离了实际值N个e(电子)对于最近几代人来说,可以从模拟数据中观察到Relate估计(图1). 相反,MSMC利用观察到的全基因组杂合性变化来推断人口统计学,其中考虑了突变和重组事件。尽管MSMC的表现比Relate好,但它缺乏足够的力量来解决最近的人口变化。原因可能是因为即使样本中包含八个单倍型,最近也很少有连续位点之间的重组事件。包含更多单倍型可以改善最近的N个e(电子)估计,但该方法可能会在计算上变得棘手。

GONE利用了来自广泛重组率的信息,包括在每次减数分裂中预期至少有一个交叉事件的远距离位点。每个新突变都会在突变位点和其他多态位点之间产生少量LD。该LD预计会因连续世代的遗传漂变而增加,其速度取决于N个e(电子)以及通过世代重组以取决于基因座之间遗传距离的速率减少。因此,观察到的远距离位点之间的LD主要是最近漂移的结果,因为旧漂移的影响通过几代内的强烈重组而消除,而紧密连锁位点之间的LD是最近和过去远距离产生漂移的结果(Hayes等人。2003).

GONE的相关方面允许检测先前LD方法失败的场景中的人口变化。其中之一是使用δ2(Ohta和Kimura 1969年)测量LD而不是通常使用的Pearson’s第页.使用第页2推断…的时间变化N个e(电子)是有问题的,因为它的采样误差没有分析解决方案。这使得很难准确预测漂移对LD的累积影响,尤其是在重组率很低的情况下。一般近似值费希尔(1915)正态分布和一些相关变化(Tenesa等人。2007)对于二元二项分布是不准确的第页2以一种复杂的方式取决于基因频率。相反地,δ2是可以确定连续几代人期望值的两个统计数据的比率。此外,因为δ2是通过相关基因座的遗传方差加权的LD的度量(罗杰斯2014),受影响比第页2通过采样低频变异和基因分型错误,这通常会在样本中产生单基因变异。方法使用第页2(Tenesa等人。2007;Saura等人。2015;Mörseburg等人。2016)容易高估N个e(电子)在这些情况下,通过对数据应用任意MAF阈值可以部分纠正(补充图S1,在线补充材料). 然而,对于我们的方法,应用MAF阈值通常会导致对N个e(电子)并且除非DNA测序产生低质量数据时,否则不应先验地应用。在这种情况下,MAF阈值的应用结果是可以接受的N个e(电子)估计值,除非基本呼叫错误率非常高(~10%或更高)(图2G). 我们推导出了精确且计算效率高的方程来预测δ2连续几代人。这种准确性至关重要,因为N个e(电子)跨越时间是所有前几代人对观测结果的累积贡献的比较结果δ2具有不同重组率的基因座对的值。我们还导出了抽样的适当修正,其中一些修正与以前的发展相似但更准确,并将其扩展到新的抽样方法。

几位作者导出了δ2(Ohta和Kimura 1971年;希尔1975;1980年堰山;McVean 2007年). 最近Ragsdale和Gravel(2020年)开发了一种组合方法来寻找与δ2与预测理论相结合希尔和罗伯逊(1968)为了考虑一个群体从一代到下一代的遗传转化中不需要重新定位的抽样。他们对平衡状态下LD的预测c(c)=0.5,且种群规模随时间保持不变δ2= 1/(6 N个)单倍体和δ2=1/(3N个)对于二倍体,后者也可以通过堰和山(1980). 然而,对于c(c)=0.5,我们的结果是δ22/(3 N个)和5/(6N个)对于单倍体和二倍体,它们分别符合统计概念,即δ2第页2在大小为2的随机样本中N个不能小于1/(2N个)(补充文件第4节,在线补充材料). 模拟显示,我们对δ2与先前理论预测的重组率相比,恒定的种群规模对整个重组率范围更准确(补充表S1,在线补充材料).

正如我们上面所解释的,对于特定的复合率,预期的LD不是漂移的结果(N个e(电子))在特定的一代人中,漂流的后果在过去的许多代人中积累了下来。以前基于两个oci LD的方法(Hayes等人。2003;Tenesa等人。2007;Barbato等人。2015;2015年Mezzavilla和Ghiroto;Hollenbeck等人。2016)假设以下两者之间存在唯一的对应关系N个e(电子)在特定的一代过去和观察到的具有特定重组率的基因座对之间的LDc(c)=1/(2 ). 这个关系是由Hayes等人。(2003)在两个染色体片段(两侧有两个具有重组率的标记)的概率范围内c,来自共同祖先,没有干预重组。如所述Hayes等人。(2003),此方法仅对常量有效N个e(电子)或线性递增或递减N个e(电子)跨越几代人。然而,我们的方法为历史的推断提供了一个解决方案N个e(电子)没有任何关于变化幅度或趋势的事先假设。此外,该方法对于标底错误、遗传图的偏差以及与单个非结构化种群假设的偏差都非常稳健。世代重叠往往会低估最近的N个e(电子),据报告N个e(电子)(Waples等人。2014). 此外,尽管分化种群的混合扭曲了LD的结构,但在混合几乎产生之前,推断对衍生种群是有效的。

虽然在估计过程中可以使用不同距离的SNP对的所有箱子,但在实践中建议忽略那些对应于最大重组频率的箱子,从而忽略默认最大值c在我们的应用程序中使用的设置为0.05。原因有三方面。首先,对少数个体的随机抽样可能会导致与群体平均血统的偏差(图2I). 这些偏差对时间推断的影响N个e(电子)对大的来说更大c因为有限样本个体的系谱随着时间的倒退而逐渐混合。也就是最近的推断N个e(电子)比古代的推论更受抽样的影响N个e(电子)。这些偏差可以通过忽略c(参见。图2I和J). 其次,观察到的任何特定LDc值不完全依赖于N个e(电子)在特定的时代。然而,尽管SNP的LD与c(c)=0.5取决于N个e(电子)最近几代人中(比如说回到过去几代人),较小垃圾箱的LDc价值观取决于历史N个e(电子)从过去到现在,包括最近几代人在内,时间跨度更大的价值观。作为的推论N个e(电子)不同代人之间以这种方式相互联系,在测量大型垃圾箱的LD时存在偏差c值对整个时间序列的推断影响更大N个e(电子)小于LD的偏差c最后,当人口的地理结构很强时,LD中的失真可能非常大(图2F). 这一效应与随机抽样人群中的少数个体相对类似。忽略大箱子c价值观,过去推断中的扭曲N个e(电子)减轻了。然而,我们建议考虑最大值c因为0.05是一个折衷的解决方案,用户可以通过将此选项的开关设置为0到0.5之间的任何其他值来更改。例如,对于模拟结果,如果个体的抽样是人口的随机抽样,则使用最大值c除非样本量非常小,否则值是合理的。

GONE的推断仅限于N个e(电子),在采样前100代内具有最高分辨率。剧烈的人口变化部分抹去了旧事件的LD足迹。因此,如果较旧的变化相对较小,或者在考虑的时间段内涉及许多人口统计学变化,则该方法将无法准确检测到这些变化,或者只检测到最近的变化。缺乏精确性N个e(电子)古代事件的估计(图2A与2相比B类)可能是古代N个e(电子)估计依赖于不同重组率箱的大量LD测量。因此,预计古代估计值的累积误差将大于近期估计值。

近似而言,估计的准确性与样本量成正比,与分析中包括的SNP对数量的平方根成正比,与有效种群大小的倒数成正比(见方法和补充文件第11节,在线补充材料). 也就是说,可以通过将分析中包含的SNP数量加倍来近似补偿样本量的一半。这与之前关于N个e(电子)时间方法估计(Waples 1989年). 然而,请注意,这个近似值依赖于这样一个假设,即所分析的个体是来自人群的真正随机样本。即使如此,如果样本量很小,人口参数估计的准确性也无法用更多的SNP进行补偿。如所述King等人。(2018)随着越来越多的基因座,估计值收敛于抽样个体系谱的真实参数值,但不一定收敛于总体的系谱。对于深度融合评估来说,这并不是一个大问题,因为当一个人回到过去时,所有最近的血统都会融合到相同的祖先血统中。然而,这对近几代人来说是一个重要的问题,尤其是在大量人群中,因为漂移信号(与1成比例/N个)较弱且样本量较大n个由于采样误差与1成比例,因此需要进行检测/n个.

在这里,我们介绍了一种方法,通过芯片基因分型或DNA测序数据中成对SNP之间的LD分布推断有效种群规模的最近变化。它的推理时间空间在调查和评估濒危人口的观点方面特别有意义,也可以成为研究人口统计学的有用的历史工具。它具有计算效率高、准确度高、对偏离模型假设的情况(如基因分型错误、非随机交配、种群混合、世代重叠和遗传图谱改变)相当稳定。它适用于具有广泛人口变化和不同类型基因组数据的人群。总之,这种方法有助于立即使用大量基因组信息来研究人口的近期人口学特征。

材料和方法

历史估算N个e(电子)

第一步,SNP数据文件地图佩德格式由自定义程序处理以计算LD(示例 d日c2)对于具有不同重组率的成对SNP的箱子(c). 分析是针对单个染色体进行的,这些染色体可以在多个处理器上并行运行。它有许多选项:1)假定的箱子数量和长度;2) SNP之间观察到的遗传距离的使用,如果在地图文件,或使用在给定序列数cM/Mb的假设下计算的遗传距离;3) 使用霍尔丹或科萨姆比的遗传距离校正,或两者都不使用;4) 排除或包含缺失数据的SNP;5) 使用阶段性二倍体数据、非阶段性二倍体数据或假单倍体数据;6) 每个染色体要分析的预定义最大SNP数,在所有可用SNP中随机选取,不包括具有两个以上等位基因的位点;和7)如果需要,应用阈值MAF。的值d日c2然后将所有染色体合并到一个文件中,以估计N个e(电子)虽然也可以从单个染色体进行估计。

第二个程序(GONE)实现了遗传算法(米切尔1998)寻求历史问题的全局最优解N个e(电子)最适合观察的系列δc2 值。要最小化的函数是观测值和预测值之间的平方差之和δc2 整个复合速率范围的值c在分析中考虑。在这个遗传算法中,“个体”是一个特定的时间序列N个e(电子)前几代人的价值观。为了降低优化过程的复杂性,将过去从0(即采样点)到无穷多代的整个时间空间分割为连续的块,具有相同的N个e(电子)每个块中所有代的值。为了生成每个初始“个体”,时间空间被随机分成四个块,并在生成时设置边界1/c最小值,其中c最小值是最小值c分析中包含的所有SNP对之间的值,以及随机N个e(电子)将值分配给每个块。因此,随机生成1000个“个体”,并将适合度值指定为总和的倒数c观测值和预测值的平方差箱δc2 从一组N个e(电子)然后,选择最合适的100个“个体”作为下一代“父母”。为了产生下一代的每个“个体”,随机选择两个“父母”,“交叉”(时间段的互换N个e(电子)序列)和“突变”(区块边界和N个e(电子)块的值)随机发生。每个“交叉”引入一个新的边界,但块的数量也可以通过合并两个连续块的随机“突变”来减少。这样,就产生了一组新的1000个“个体”,“父母”的选择又开始产生下一代1/c最小值在整个优化过程中,将保持到无穷大而无需进一步划分。选择过程重复了750代,平均N个e(电子)最佳十个“个体”的系列被认为是优化过程的解决方案。由于该解可能是一个“自适应峰值”,即局部最优解,因此“选择过程”被重复所需的次数(例如40次),最终解被计算为可用解的平均值,例如40×10=400个“个体”。复制的估计也可以使用多个处理器并行运行。因此,GONE通过两个输出文件为人口统计历史提供了共识趋势的解决方案:时间估计N个e(电子)序列(Output_Ne_*文件)和观测和预测的序列d日c2分析中考虑的重组率范围内的值(Output_d2_*文件)。我们发现,与其他优化方法(如模拟退火)相比,该解决方案更加一致和可重复。优化(估计)值之间的拟合示例d日c2观察到的模拟值如所示补充图S2,在线补充材料.

该方法不会生成估计的参数置信区间。然而,如果每条染色体的SNP数量很大,例如测序数据或一些大型芯片,则可以通过使用脚本中实现的功能选择每条染色体的不同SNP集来估计不确定性,如上所述。这将允许获得经验置信极限。此应用程序的示例如所示图3芬兰人口。然而,用这种方法计算的置信区间应该谨慎对待,因为当只分析一小部分个体时,它们没有考虑系谱抽样在人群中的额外随机影响。另一种选择是,如果抽样的个体数量足够大,则使用个体的子样本获得经验重复估计,至少可以部分量化人口中的随机系谱抽样。

仿真程序

检查新LD的准确性和统计特性N个e(电子)估计方法,使用软件SLiM进行仿真(Messer 2013年;Haller and Messer 2019年)是SNP的正向模拟器,以及内部程序,主要用于检查特定重组率的准确性。在大多数情况下,250 Mb长度的序列被运行了10000代,假设在不同的人口统计学场景下没有选择(N个几代之后),例如在过去200代中人口的瓶颈、下降或扩张。每个核苷酸的突变和重组率假定为µ=c(c)=10−8,这意味着1 Mb=1 cM。在上一代n个取二倍体个体(20或100)进行分析。在某些情况下,我们还考虑了替换抽样,以检查在此抽样场景下的相应估计。一般来说,没有对MAF进行修剪,但一些模拟是通过应用MAF<0.05和0.1来检查罕见等位基因的影响。模拟结果基于每个场景的10–100次重复。使用自定义程序获得地图佩德启动估算过程所需的文件。

时间估计N个e(电子)使用其他方法

这个地图佩德许多模拟场景的文件被转换为MSMC所需的文件格式(Schiffels和Durbin 2014)和关联(Speidel等人。2019)和参数设置为默认选项。通过指出MSMC中所有可能的阶段化模式,对非阶段性基因型进行分析。同样d日c2模拟中获得的值由之前的时间估计值进行了分析N个e(电子)带LD(Tenesa等人。2007;Barbato等人。2015;2015年Mezzavilla和Ghiroto;Hollenbeck等人。2016)对阶段性和非阶段性基因型进行相应的校正。

样本量估计

通过假设一些简化(补充文件的第11节,在线补充材料)可以看出N个e(电子)大致与以下各项成比例:
G公司=n个·ϑN个e(电子),
哪里n个是样本量和ϑ是分析中包含的位点对数。作为实验的一般规则c值从0.5到0.001不等,当G公司>100G公司<10.

生成时间

为了比较N个e(电子)参考历史事件,人类的世代被设定为30年(芬纳2005).

物理图和重组图之间的关系

要估计重组频率,需要有一张cent-M器官(cM)的遗传图和一个图函数c在基因组中的任何一对基因座之间。精细重组图用于人类(Myers等人。2005)和根据数据推断出的地图Tortereau等人。(2012)用于猪。

到目前为止,关于鲑鱼的物理和遗传图谱还没有达成共识,可能是由于该物种染色体重排的复杂性。我们使用了鲑鱼参考基因组组合ICSASG_v2(Lien等人。2011)将位置分配给SNP,并将遗传图和物理图之间的关系视为1 cM/Mb的恒定比率,这是几项研究的近似平均值(菲利普斯等人。2009;Lien等人。2011;Tsai等人。2016).Tsai等人。(2016)显示了假定的物理遗传图和估计的遗传图之间缺乏连续性,特别是对于一些染色体,其间隙高达150 cM。然而,忽略了0.05以上的重组率(带有选项hc公司0.05)我们避免了由于基因组中的缺口或缺乏连续性而导致的大多数并发症。注意,在1 cM/Mb时,0.05的重组率对应于5.3 Mb,假设霍尔丹函数。使用比这个距离更近的SNP,不太可能在间隙的不同侧面有显著的SNP对表示。

样品

分析的个体样本大小不同(n个)以及SNP的数量(N个SNP公司)估计中分析如下。伊比利亚猪的Guadyerbas种群(Saura等人。2015) (n个=219;N个SNP公司=19144),芬兰人口(2012年1000基因组项目联盟;上次访问时间:2017年3月27日) (n个=99;N个SNP公司=1100000),来自迪河的鲑鱼(n个=每人口16人;N个SNP公司=104354),新石器时代西苏格兰(Olalde等人。2018) (n个=17[10.8],括号中的数字表示实际样本量,忽略缺失的基因分型数据;N个SNP公司=552191),新石器时代苏格兰北部(Olalde等人。2018) (n个=21 [14.8];N个SNP公司=594385),阿什肯纳齐东(Behar等人。2010) (n个=9;N个SNP公司=478394),阿什肯纳齐西(Behar等人。2010) (n个=9;N个SNP公司=477884),米兹拉欣来自高加索(Behar等人。2010) (n个=12;N个SNP公司=486075),米兹拉希姆来自伊朗和伊拉克(Behar等人。2010) (n个=15;N个SNP公司= 485,199).

软件可用性

应用该方法所需的脚本和程序(Linux和MacOSX)可在GitHub地址获得https://github.com/esrud/GONE。

补充材料

补充数据可在分子生物学与进化在线。

致谢

我们感谢Humberto Quesada和两位匿名裁判的有益评论,Beatriz Villanueva提供了猪的数据和富有成效的讨论,John Taggart提供了三文鱼样本,Paloma Morán在三文鱼基因分型方面的合作和有益评论。这项工作由法国国家调查局(AEI)(CGL2016-75904-C2-1-P)、加利西亚巡洋舰(ED431C 2016-037)和Fondos Feder:“Unha maneira de face r Europa”资助。UVigo海洋研究中心(CIM-UVigo)由区域文化、教育和大学理事会的“卓越研究(INUGA)”计划资助,欧盟通过ERDF 2014-2020年加利西亚行动计划提供联合资助。猪和鲑鱼基因分型由西班牙经济竞争力部资助(批准号:RZ2010-00009-00-00和RZ2012-00011-C02-00)。国际原子能机构感谢来自InnovacióN y Universidades Ciencia部长的FPU赠款的支持。A.F.P.感谢医学研究委员会项目拨款(MC_PC_17212)的支持。

作者贡献

E.S.和A.C.构思了这部作品并撰写了这篇文章。E.S.发展了理论和计算解决方案。A.C.设计了数据结构和分析。I.N.比较方法。A.F.P.提供了人类数据和调查。M.S.提供了动物数据和分析。J.W.提供了智力投入。

工具书类

1000基因组项目联盟。

2012
.
1092份人类基因组遗传变异综合图
.
自然
491
:
56
65(上次访问日期:2017年3月27日
).

阿特金森
QD公司
,
灰色
研发
,
德拉蒙德
AJ公司。
2008
.
线粒体DNA变异预测了人类的种群数量,揭示了人类史前史中南亚的一个重要篇章
.
分子生物学进化
.
25
(
2
):
468
474
.

巴尔巴托
M(M)
,
Orozco-terWengel公司
P(P)
,
塔皮奥
M(M)
,
布鲁福德
兆瓦。
2015
.
SNeP:利用全基因组SNP数据估计近期有效种群规模轨迹趋势的工具
.
前Genet
.
6
:
109
.

比哈尔
DM公司
,
尤努斯巴耶夫
B类
,
梅斯帕卢
M(M)
,
梅斯帕卢
E类
,
罗塞
S公司
,
帕里克
J型
,
Rootsi公司
S公司
,
乔贝
G公司
,
库图耶夫
,
尤德科夫斯基
G公司
2010
.
犹太人的全基因组结构
.
自然
466
(
7303
):
238
242
.

布朗宁
SR公司
,
布朗宁
提单。
2015
.
根据血统身份片段对近期有效人口规模的精确非参数估计
.
美国人类遗传学杂志
.
97
(
):
404
418
.

科尔宾
LJ公司
,
线路接口单元
AYH公司
,
主教
联合国安全理事会
,
伍利亚姆
青年成就组织。
2012
.
利用标记数据的连锁不平衡估计历史有效人口规模
.
《动漫基因》
.
129
(
4
):
257
270
.

芬纳
年。
2005
.
人类世代间隔的跨文化估计在基于遗传学的人口差异研究中的应用
.
Am J Phys Anthropol公司
.
128
(
2
):
415
423
.

费希尔
拉脱维亚。
1915
.
无限大总体样本中相关系数值的频率分布
.
生物计量学
10
(
4
):
507
521
.

古德曼
M。
2004
.
图拉真与罗马对犹太人的敌意
.
过去现在
.
182
(
1
):
29
.

哈克
W公司
,
拉扎里迪斯
,
帕特森
N个
,
罗兰
N个
,
马利克
S公司
,
拉马斯
B类
,
勃兰特
G公司
,
诺登费尔特
S公司
,
哈尼
E类
,
斯图尔德森
K(K)
2015
.
大草原的大规模迁移是欧洲印欧语言的来源
.
自然
522
(
7555
):
207
211
.

哈勒
不列颠哥伦比亚省
,
梅塞尔
密码。
2019
.
SLiM 3:超越Wright-Fisher模型的正向遗传模拟
.
分子生物学进化
.
36
(
):
632
637
.

海耶斯
BJ公司
,
维斯切
颗粒物
,
麦克帕特兰
HC公司
,
戈达德
我。
2003
.
一种新的连锁不平衡的多点测量方法,用于估计过去的有效人口规模
.
基因组研究
.
13
(
4
):
635
643
.

希尔
工作组。
1975
.
有限群体突变产生的多个中性等位基因之间的连锁不平衡
.
Theor流行生物学
.
8
(
2
):
117
126
.

希尔
无人机
,
罗伯逊
答:。
1968
.
有限种群中的连锁不平衡
.
Theor应用基因
.
38
(
6
):
226
231
.

霍伦贝克
厘米
,
波特努瓦
DS公司
,
黄金
年少者。
2016
.
一种从连锁和非连锁位点的连锁不平衡中检测当代有效种群规模近期变化的方法
.
遗传
117
(
4
):
207
216
.

哈德逊
右后。
1990
.
基因谱系与融合过程
.
Oxf Surv Evol-Biol公司
.
7
:
1
44
.

国王
L(左)
,
韦克利
J型
,
卡米
美国。
2018
.
两个序列的Tajima估计的非零方差,即使是无限多个未链接位点
.
Theor Popul生物
.
122
:
22
29
.

H(H)
,
杜宾
R。
2011
.
从个体全基因组序列推断人类种群历史
.
自然
475
(
7357
):
493
496
.

留置权
S公司
,
吉兹凯豪格
L(左)
,
莫恩
T型
,
海耶斯
BJ公司
,
伯格
公共关系
,
戴维森
WS公司
,
奥姆霍尔特
软件
,
肯特
MP公司。
2011
.
基于SNP的大西洋鲑鱼紧密连锁图(鲑鱼沙拉)揭示了扩展的染色体同源性和性别特异重组模式的显著差异
.
BMC基因组学
12
:
615
.

留置权
S公司
,
库普
高炉
,
桑德韦
SR公司
,
米勒
年少者
,
肯特
MP公司
,
诺姆
T型
,
阿维斯滕
信托收据
,
梁朝伟(Leong)
JS公司
,
明克利
博士
,
自民
A类
2016
.
大西洋鲑鱼基因组为重倍化提供了不利条件
.
自然
533
(
7602
):
200
205
.

麦克韦
G.公司。
2007
.
连锁不平衡的系谱解释
.
遗传学
175
(
):
1395
1991
.

梅塞尔
第页。
2013
.
SLiM:通过选择和链接模拟进化
.
遗传学
194
(
4
):
1037
1039
.

夹层
M(M)
,
吉罗托
美国。
2015
.
Neon:根据SNPS间连锁不平衡模式估计人类有效种群规模和分化时间的R包
.
计算机科学系统生物学杂志
.
8
(
1
):

米切尔
M。
1998
.
遗传算法简介
.
剑桥
:
麻省理工学院出版社
.

马尔塞堡
A类
,
帕加尼
L(左)
,
里科
F-X公司
,
Yngvadottir公司
B类
,
哈尼
E类
,
卡斯蒂略
C类
,
胡格沃斯特
T型
,
安踏
T型
,
Kusuma公司
P(P)
,
布鲁卡托
N个
2016
.
东南亚岛屿人口的多层结构
.
欧洲人类遗传学杂志
.
24
(
11
):
1605
1611
.

迈尔斯
S公司
,
博托洛
L(左)
,
弗里曼
C类
,
麦克韦
G公司
,
唐纳利
第页。
2005
.
人类基因组重组率和热点的精细地图
.
科学类
310
(
5746
):
321
324
.

欧姆(Ohta)
T型
,
木村
M。
1969
.
随机遗传漂变导致的连锁不平衡
.
基因研究
.
13
(
1
):
47
55
.

欧姆(Ohta)
T型
,
木村
M。
1971
.
有限群体稳定突变流下两个分离核苷酸位点之间的连锁不平衡
.
遗传学
68
:
571
580
.

奥拉尔德
,
撑木
S公司
,
阿伦托夫特
,
阿米特
,
克里斯蒂安森
K(K)
,
展位
T型
,
罗兰
N个
,
马利克
S公司
,
塞尼·纳吉
A类
,
米特尼克
A类
2018
.
烧杯现象与西北欧的基因组转化
.
自然
555
(
7695
):
190
196
.

厄弗斯蒂
S公司
,
马贾德
K(K)
,
萨尔梅拉
E类
,
萨洛
K(K)
,
阿佩
L(左)
,
贝尔斯基
S公司
,
埃图·西沃拉
H(H)
,
拉克索
V(V)
,
米考拉
E类
,
普夫伦格勒
S公司
2019
.
铁年龄芬诺斯坎迪亚人线粒体DNA谱系表明早期混合和东部引入与农业相关的母系血统
.
科学代表
.
9
(
1
):
16883
.

帕拉西奥斯
青年成就组织
,
韦克利
J型
,
拉马钱德兰
美国。
2015
.
序列系谱中种群规模变化的贝叶斯非参数推断
.
遗传学
201
(
1
):
281
304
.

帕拉马拉
PF公司
,
伦茨
T型
,
道尔沃希
A类
,
佩尔
一、。
2012
.
按血统划分的身份长度分布揭示了精细的人口统计历史
.
美国人类遗传学杂志
.
91
(
5
):
809
822
.

菲利普斯
皇家银行
,
基特利
灵魂
,
莫拉什
先生
,
文丘拉
AB公司
,
卢比安妮基
KP公司
,
库普
高炉
,
丹兹曼
RG公司
,
戴维森
WS公司。
2009
.
大西洋鲑鱼的分配(鲑鱼沙拉)特定染色体的连锁群:虹鳟整体染色体臂对应的大共张力区的保存(毒吻吻鱼)
.
BMC基因
.
10
(
1
):
46
.

坎巴里
S公司
,
皮门特尔
EGC公司
,
Tetens公司
J型
,
塔勒尔
G公司
,
利希特纳
P(P)
,
谢里菲
应收账
,
西米亚纳
小时。
2010
.
德国荷斯坦牛连锁不平衡的模式
.
动画基因
.
41
:
346
356
.

拉格斯代尔
A类
,
砾石
美国。
2020
.
基于非相位数据的连锁不平衡无偏估计
.
分子生物学进化
.
37
(
):
923
932
.

拉格斯代尔
AP公司
,
古滕孔斯特
注册护士。
2017
.
使用双焦点统计推断人口历史
.
遗传学
206
(
2
):
1037
1048
.

罗杰斯
答:。
2014
.
人口增长如何影响联系失衡
.
遗传学
197
(
4
):
1329
1341
.

绍拉
M(M)
,
特内萨
A类
,
羊毛
青年成就组织
,
费尔南德斯
A类
,
维拉努埃瓦
B。
2015
.
世代重叠时估算有效种群规模的链接非平衡方法的评估:一个经验案例
.
BMC基因组学
16
:
922
.

Schiffels公司
S公司
,
杜宾
R。
2014
.
从多基因组序列推断人类种群规模和分离历史
.
自然基因
.
46
(
8
):
919
925
.

歌手
,编辑。
1906
.
犹太百科全书。
纽约
:
Funk和Wagnalls
.

斯拉特金
M。
2004
.
创始人效应的群体遗传学测试及其对德系犹太人疾病的影响
.
美国人类遗传学杂志
.
75
(
2
):
282
293
.

斯皮德尔
L(左)
,
森林
M(M)
,
S公司
,
迈尔斯
SR公司。
2019
.
数千个样本的全基因组系谱估计方法
.
自然基因
.
51
(
9
):
1321
1329
.

斯维德
青年成就组织。
1971
.
有限群体中染色体片段的连锁不平衡和纯合性
.
Theor Popul生物
.
2
(
2
):
125
141
.

斯维德
青年成就组织
,
卡梅隆
欧盟委员会
,
吉尔克里斯特
美国。
2013
.
从未连锁位点之间的连锁不平衡估计有效种群规模:理论及其在果蝇暴发种群中的应用
.
公共科学图书馆一号
8
(
7
):
e69078(电子69078)
.

斯维德
青年成就组织
,
希尔
工作组。
2018
.
连锁失衡一百年
.
遗传学
209
(
):
629
636
.

特内萨
A类
,
纳瓦罗
P(P)
,
海耶斯
BJ公司
,
达菲
DL公司
,
克拉克
总经理
,
戈达德
,
维斯切
下午。
2007
.
从连锁不平衡估计近期人类有效人口规模
.
基因组研究
.
17
(
4
):
520
526
.

特霍斯特
J型
,
卡姆
青年成就组织
,
歌曲
耶斯。
2017
.
基于数百个非阶段全基因组的人口历史稳健可扩展推断
.
自然基因
.
49
(
2
):
303
309
.

托特雷奥
F类
,
服务
B类
,
弗兰茨
L(左)
,
梅根斯
HJ公司
,
米兰
D类
,
罗勒
G公司
,
维德曼
R(右)
,
比弗牌手表
J型
,
阿奇博尔德
美国铝业公司
,
斯库克
LB(磅)
2012
.
猪的高密度重组图谱揭示了性别特异性重组与GC含量之间的相关性
.
BMC基因组学
13
(
1
):
586
.

HY公司
,
罗布利多
D类
,
尼泊尔卢比
,
贝卡尔特
M(M)
,
塔格特
接线盒
,
布郎
JE公司
,
休斯敦
罗德岛。
2016
.
大西洋鲑鱼高密度SNP连锁图的构建与注释(鲑鱼沙拉)基因组
.
G3(贝塞斯达)
6
:
2173
2179
.

J型
,
圣地亚哥
E类
,
卡巴列罗
答:。
2016
.
有效人口数量的预测和估计
.
遗传
117
(
4
):
193
206
.

波纹
RS.公司。
1989
.
从等位基因频率的时间变化估计有效种群规模的通用方法
.
遗传学
121
(
2
):
379
391
.

波纹
RS.公司。
2006
.
基于非连锁基因位点连锁不平衡的有效群体规模估计的偏差修正
.
保护基因
.
7
(
2
):
167
184
.

波纹
RS系列
,
安踏
T型
,
路易卡特
G.公司。
2014
.
世代重叠对有效种群规模连锁不平衡估计的影响
.
遗传学
197
(
2
):
769
780
.

波纹
RS系列
,
C。
2008
.
LDNE:一个从连锁不平衡数据估算有效人口规模的程序
.
Mol Ecol Resour公司
.
8
(
4
):
753
756
.

英国标准
希尔
工作组。
1980
.
交配结构对连锁不平衡变异的影响
.
遗传学
95
(
2
):
477
488
.

本文根据牛津大学出版社标准期刊出版模式的条款出版和发行(https://academic.oup.com/journals/pages/open_access/funder_policies/chorus/standard_publication_model)
副编辑: 尤塞奥布·金
尤塞奥布·金
助理编辑
搜索此作者的其他作品:

补充数据