跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
公共科学图书馆-遗传学。2012年11月;8(11):e1003100。
2012年11月29日在线发布。 数字对象标识:10.1371/journal.pgen.1003100
预防性维修识别码:PMC3510040型
PMID:23209444

猪基因组中的纯合子区域:人口统计学和重组景观的影响

Peter M.Visscher,编辑器

关联数据

补充资料

摘要

长期以来,近交一直被认为是野生和驯化种群适应度降低的主要原因。近亲交配导致单倍型的遗传,单倍型按血统相同(IBD),并导致纯合子沿着后代基因组延伸。纯合子区域(ROH)的大小和位置预计与GC含量和重组率等基因组特征相关,也与选择方向相关。因此,ROH应该在基因组中非随机分布。因此,人口统计学史可能无法完全预测近亲繁殖的影响。猪基因组的重组率分布相对不均匀苏斯克罗法这是一个研究重组景观和人口统计学对基因组变异影响的优秀模型。本研究利用下一代测序数据,采用比较滑动窗口方法分析基因组ROH模式。我们基于三个不同的参数对基因组变异进行了深入研究:ROH外的核苷酸多样性、基因组中ROH的数量和平均ROH大小。我们在欧亚大陆商业品种和野生种群的多头猪的所有基因组中发现了丰富的ROH。ROH的规模和数量与已知的人口统计学数据一致,人口瓶颈极大地增加了ROH的发生。ROH以外的核苷酸多样性在来自大型古代种群的种群中较高,而与当前种群规模无关。此外,我们发现ROH基因组分布不均匀,ROH大小和丰度与重组率和GC含量密切相关。全球基因含量与ROH频率无关,但一些ROH热点确实包含商业品系和野生种群中的阳性选择基因。这项研究强调了人口统计学和重组对基因组纯合子的影响对于理解近亲繁殖的影响的重要性。

作者摘要

由于有害等位基因的高表达,小种群的近亲繁殖抑郁症风险增加。这可能会对这些人口的生存能力产生重大影响。在繁殖种群中人工选择的家养物种,如猪,以及栖息地减少的野生种群中,保持遗传多样性至关重要。序列技术的最新进展使我们能够识别单个基因组中核苷酸变异的模式。我们对欧亚大陆的野猪和商业猪的全基因组进行了纯合性区域筛选。我们发现这些纯合子区域是由猪的人口统计学历史和有效种群大小引起的。欧洲野猪的变异性最小,但欧洲品种的基因组中也包含大量纯合子延伸。此外,一个区域被耗尽的可能性取决于它在基因组中的位置,因为变异与重组率高度相关。端粒区域的变异性要大得多,而染色体的中央区域包含长纯合子区域的可能性更大。这些发现增加了对基因组变异精细结构的认识,对种群遗传管理尤为重要。

引言

亲缘关系对后代适应性的影响早就被人们认识到了。近亲交配导致单倍型的遗传,单倍型按后代相同(IBD),导致后代基因组中潜在的长纯合子延伸。这些纯合子区域(ROH)增加了隐性有害等位基因共表达的风险,降低了生物体的生存力。在人类和犬类种群中,大型同质远交种群的基因组纯合子比例低于小型孤立种群[1][2][3]此外,研究表明基因组中的纯合子延伸与人类疾病之间存在相关性[4][5][6]生物学各个方面的长期兴趣之一是了解近亲繁殖的直接后果。近亲繁殖系数F是一种常用的统计数据,用于估计由于亲缘关系而遗传的相同等位基因的程度[7]然而,近亲繁殖抑制可能在整个基因组中存在很大差异,使用很少分子标记的研究不太可能检测到这些差异。因此,了解IBD等位基因的基因组分布,充分掌握近交对特定群体生存能力的重要性是非常重要的。物种的生物学特性,如交配系统和繁殖率,在维持种群遗传多样性方面起着重要作用。此外,长期遗传变异与过去和现在的人口统计学之间的相互作用会影响种群的近亲繁殖程度。纯合度用于人工交配选择,以最小化子代近交[8].维持最小存活种群规模(MVP)对种群的持续生存至关重要[9]这对保护工作和商业育种都很重要。但是,在估计遗传变异和遗传保守性的相关考虑中,对其结构有贡献的基因组的固有特征,例如重组率,通常被忽视[10][11]

在随机交配的种群中,IBD束可望通过重组随时间而分解。在人类中,ROH的衰减被认为是每一代都遵循逆指数分布,因为共同祖先将ROH大小减半[12][13]因此,ROH在基因组中的大小和位置预计与重组率相关[14]如果如预期的那样,重组率在整个基因组中变化,并且不能仅用过去的人口统计学来解释,那么纯合子延伸应该是非随机分布的。ROH的发生应该是人口统计学和重组景观之间的相互作用。[15]研究表明,ROH可能已经席卷了一个群体,因为该地区的特定等位基因发生了正向选择。此外,来自近亲交配的ROH可能被错误地认为是阳性选择的标志,因为这两种效应预计会在给定的基因组区域显示出多态性的缺失。因此,如果我们要区分选择信号和近亲繁殖,了解ROH如何在基因组中分离是很重要的。

以往研究不同哺乳动物ROH模式的研究发现,ROH的发生与重组率相关[16][17]然而,这些研究基于高密度单核苷酸多态性(SNP)芯片的纯合子得分。测序技术的最新进展使得对全基因组SNP分布的彻底调查成为可能,并且可以在很大程度上扩展高密度SNP阵列用于ROH鉴定的应用。此外,重测序策略应该能够减少偏差,而SNP芯片通常存在确定偏差。此外,重组率的细微影响可以通过全基因组分辨率进行检测。众所周知,猪基因组的重组率和GC含量分布相对不均匀[18]特别是染色体中央部分的重组率比外围部分低得多。尽管这种效应存在于其他哺乳动物基因组中,但在猪基因组中似乎更为明显。此外斯克罗法链球菌众所周知,(家猪和欧亚野猪)在其自然和人工栖息地的种群结构非常多样化。这些特点使苏斯克罗法研究重组和人口统计学对哺乳动物基因组中ROH分布的影响的极好模型。

这个属苏斯起源于东南亚中新世晚期或中新世/上新世界线附近的物种形成事件,距今约1400万年(Mya)([19][20][21](Frantz LAF et al.,未公开数据),野猪在更新世~1至0.5 Mya期间将其活动范围扩展至整个欧亚大陆[22]欧洲野猪种群被认为是从东南亚分离出来的,它们在地理上距离该物种的假定起源最远苏斯克罗法在晚更新世0.5至0.9 Mya之间[19][22][23]欧洲最新的冰川事件造成了人口瓶颈,随后伊比利亚半岛和巴尔干半岛避难所的冰川后人口扩张[23]亚洲野猪的遗传多样性可能受最新冰川事件的影响较小,因为尽管东北和东南野猪可能被分隔开,但仍有更大的适宜栖息地[24]大约8000年前,小亚细亚和中国的当地野猪种群已经对猪进行了至少两次独立驯化,自第一次驯化事件以来,野猪可能会反复从野生物种和品种间渗入[25].因为可能的渗入,甚至从头开始驯化后,欧洲商业猪的近东线粒体单倍型已被欧洲野猪单倍型完全取代[19].已知的人口历史苏斯克罗法无论是野生的还是驯化的,都为种群基因组研究提供了一个有价值的框架,因为来自序列数据的结论可以得到人口学的支持。

本研究使用重新排序数据分析ROH和核苷酸多样性(π,[26]),探讨ROH和π的基因组分布是如何由重组景观、人口统计学和选择的加性效应形成的。对来自欧洲和亚洲不同品种和野生群体的多头猪的完整基因组多态性分布进行了详细研究。我们预计基因组中ROH的丰度与有效(过去和现在)种群规模相关。特别是ROH的规模预计会与近期和当前的人口规模相关,反映创始人效应和人口瓶颈。非IBD单倍型之间的核苷酸多样性应反映过去或古代的人口规模。此外,我们还研究了重组率对基因组ROH模式的影响。这种高度异质的基因组重组景观使猪和野猪非常适合在全基因组范围内研究重组对形成变异的影响。此外,我们还研究了人口统计学和重组对ROH分布的整体影响。最后,我们调查了ROH热点的阳性选择痕迹和基因含量。由于这些不同的因素是相互关联的,ROH的形成和降解是一个动态的基因组过程。总的来说,我们发现过去的人口统计事件和重组景观的结合,主要塑造了基因组中ROH的模式。

结果

一般统计数据

个体常染色体中的纯合子区域由重新排序的亚洲和欧洲猪和野猪确定。我们根据地理来源和驯化状态对样本进行分组,以便进一步分析(图S1;表S1). 猪被分为五组,分别是亚洲家养、亚洲野生、欧洲家养、欧洲野生和其他种类。分组是基于地理和驯化而非系统发育。在所有52个测序个体中均鉴定出ROH(例如图S2,中的详细信息表S1). 我们发现平均778.8个ROHs/基因组(+/-349),平均大小为1.11 Mbp。ROH大小从10 Kbp(考虑的最小大小)到83.6 Mbp(染色体的29%)不等。ROH(π-out)外基因组区域的全基因组核苷酸多样性(π)平均为1.733个SNP/Kbp(+/-0.57)和2.49个SNP/bp(+/-0.57)。欧洲大白猪的π和π-out差异在1.2 SNPs/Kbp之间婆罗猪个人。ROH的平均数量和大小在欧洲和亚洲家猪之间以及野猪和各大洲品种之间差异显著(p<0.001,图1C和1D). 平均23%的基因组被认为是纯合子区域。亚洲家猪和野猪在ROH外的核苷酸多样性没有显著差异,但在两大洲之间和两个欧洲群体内有所不同(p<0.001,图1B). 日本野猪的ROH覆盖率最高(占其基因组的78%)。

保存图片、插图等的外部文件。对象名称为pgen.1003100.g001.jpg
基因组变异的汇总统计。

亚洲品种(n=7)、亚洲野猪(n=5)、欧洲品种(n=29)、欧洲野猪(n=6)和其他物种(n=5)的ROH统计分布。根据地理位置(亚洲人和欧洲人)、驯化(猪和野猪)和物种形成(其他物种包括非洲疣猪非洲Phacochoerus africanus和Sus属的其他代表巴比妥斯(barbatus)、塞来本斯(Sus celebensis)、疣状苏(Sus verrucosus)和cebifrons). 值在个体内平均,从而为每个个体的每个ROH特征生成一个数据点。答:。核苷酸多样性,包括ROH(*10−4bp)1B。核苷酸多样性,不包括ROH(*10−4bp)1C。平均ROH大小(*104bp)1D。个体基因组中ROH的数量。

人口统计学对ROH分布的影响

ROH被分为三个大小等级:1)小(<100 Kbp),2)中(0.1至5 Mbp)和3)大(>5 Mbp。我们计算了在所有52个样本中,每一类中ROH的下降比例。虽然小的ROH在整个基因组中都很丰富,但它们对基因组的绝对贡献相对较小(图2). 相比之下,中等大小的ROH相对较小和较大的ROH来说不太常见,但覆盖了更多的基因组。大型ROH的含量至少是中型ROH的10倍,但仍占基因组的很大一部分。亚洲家猪的基因组主要由大型ROH覆盖。与所有欧洲猪和亚洲家猪相比,亚洲野生个体的基因组ROH数量更少,ROH在其基因组中的比例也更小(p<0.0001)。欧洲野猪的ROH平均数量最高,基因组纯合子比例最高。由于其岛屿生物地理背景,日本野猪在ROH数量和累积大小方面都是一个异类,因此我们对其进行了单独处理。据估计,欧洲和亚洲野猪之间的差异发生在~1.2mya,而这两个大陆群的种群规模从~50kya及以后都发生了重大下降,这是基于成对顺序马尔科夫群(PSMC)模型中实施的个体基因组人口统计推断得出的(图S3). 亚洲人口规模苏斯克罗法ROH和ROH分析之外的核苷酸多样性支持了这一观点(图1A–1B图2). 此外,根据ROH分析,亚洲野生种群的有效种群规模估计大于亚洲家猪,而欧洲野生种群的种群规模最小。

保存图片、插图等的外部文件。对象名称为pgen.1003100.g002.jpg
ROH总数和ROH覆盖的基因组比例。

第二章。对于不同的组,ROH的平均数量分别属于三个大小类别,即小(<100 Kbp)、中等(0.1至5 Mbp)和大(>5 Mbp)。2B、。单个个体中特定ROH大小类别涵盖的基因组总大小,每组平均值。日本野猪是单独显示的,不包括在亚洲组中,因为其来自岛屿种群的人口历史和相关ROH模式与所有其他抽样个体非常不同。亚洲野猪(4头)、亚洲猪(7头)、欧洲野猪(6头)、欧猪(29头)、其他物种(5头)。

我们测试了Illumina猪60K珠片在三个尺寸等级中识别ROH的效用。基因分型阵列被广泛使用,并提供了成本效益高的可能性,可以研究更大的样本量,并测试该技术对ROH检测的有用性。使用该阵列,我们评估了有限数量个体的全基因组重新排序分析结果是否可以外推到整个群体。基于芯片的方法能够检测大于5Mbp的ROH(图3)但低估了ROH在基因组中的累积大小,尤其是欧洲样本。这一现象可能是由于欧洲人群中存在大量小型ROH,而由于SNP芯片的分辨率有限,无法检测到这些ROH。日本野猪有许多ROH,但ROH的大小并不是特别大,因为ROH是由具有可变位点的短节段所介导的(图S2表S1). 因此,这个个体的ROH总量可能被高估了(图3)通过基于芯片的方法,显示出与使用重新排序方法识别的>5Mbp纯合块的累积ROH大小弱相关。由于最大尺寸等级中的ROH被完全检测到(>5 Mbp,图3)基于60K定义的ROH分布比较种群对于分析大型ROH是有效的。自然,检测较短ROH的有限能力对推断的人口统计学有影响,因此我们仅使用60K定义的ROH与我们最大的基于序列的ROH进行比较。

保存图片、插图等的外部文件。对象名称为pgen.1003100.g003.jpg
基于60K芯片法和重新排序法的猪ROH大小。

3A显示了从重新排序方法(“基因组ROHsum”)和60K芯片方法(“60K ROHsu姆”)中提取ROHs总量时两种方法之间的相关性。在3B中,当重新排序方法仅考虑超过5Mbp的ROH时,显示出相关性。亚洲群(日本野猪)的异常值不包括在R中2计算。

241名来自不同国家的人苏斯克罗法使用60K分析对重新测序的人群进行基因分型,并对ROH数量和累积大小进行评分。基因型个体的详细信息见表S2.就ROH数量或ROH大小而言,测序个体在其种群中从未达到极端。在亚洲和欧洲品种中,ROH的数量在5到59之间,累积ROH大小为10 Mb到1 Gb(图4). 欧洲品种ROH数量和累积ROH大小的分布较窄。亚洲品种建曲海和湘的ROH总量和数量均呈适度的双峰分布。与欧洲近亲相比,中国野猪的ROH和ROH累积量往往较少。尽管由于60K芯片的低分辨率,日本野猪的ROH累积大小可能被高估了,但有四个个体是极其纯合子,其基因组的2/3以上由ROH组成。日本野生个体的ROH大小和丰度的差异远高于其他群体。值得注意的是,两只荷兰野猪的ROH显著低于相同种群的所有其他欧洲野猪(用*表示图4B).

保存图片、插图等的外部文件。对象名称为pgen.1003100.g004.jpg
所有基因型个体的ROH数量和累积大小(ROHs>5MB)。

用Illumina猪60k基因芯片对所有241个个体进行基因分型后,PLINK检测到的ROH数量和ROH总和。ROXIZ总和为*1000 bp。第4A条。家养个体中的ROH。亚洲猪用红色、橙色和紫色表示,欧洲猪用蓝色和绿色表示。4B、。野生个体中的ROH。亚洲野猪用红色和橙色表示,欧洲野猪用绿色和蓝色表示。虚线表示驯化个体ROH数量和ROH大小的范围。标有*的个体是推测的杂种。

对52个重新测序个体的基因组变异模式进行了更深入的分析。我们发现,π-out(ROH外核苷酸多样性)、ROH平均大小和ROH总数等统计数据是很好的预测因素,可以将个体分配到相应的组(图5). 有趣的是,虽然所有亚洲野猪在我们的进化树上都形成了一个单系分支(图S1),我们发现日本样本与其他亚洲样本在三维图上没有聚集(图5). 中国野猪因其高核苷酸多样性和少量ROH而代表了最具变异性的集群(p<0.001)。我们发现欧洲品种的核苷酸多样性高于欧洲野猪(p<0.0001)。此外,欧洲品种基因组中ROH的总数也较低。这在我们的三维图中产生了两个簇(图5)与我们的系统发育树上欧洲种群的单系地位形成对比(图S1). 亚洲品种比它们的野生祖先更近交,但表现出比欧洲动物更少的ROH和更高的核苷酸多样性(p<0.0001)。已排序的疣状皮肤由于极低的核苷酸多样性、中等的ROH数量和大的ROH大小,个体的基因组变异在所有测试动物中最低。已排序的婆罗猪在所有测序个体中,个体的ROH最小,ROH大小最小,表明该个体是高度远交的,具有较高的有效种群规模。ROH模式卷毛野猪特别有趣的是,ROH的总数非常低,但它包含的ROH数量很少,并且核苷酸多样性相对较低。

保存图片、插图等的外部文件。对象名称为pgen.1003100.g005.jpg
所有52个测序个体的三点ROH统计。

在x轴上,绘制了每个个体基因组中ROH的数量,平均ROH大小(*104bp)显示在y轴上,ROH外的核苷酸多样性显示在一个10 kb的窗口中,核苷酸多样性(π-out*10−4)'在z轴上。颜色是基于亲缘关系和地理位置,来自同一种群的个体具有相同的颜色。

重组率对ROH分布的影响

为了测试重组率和GC含量对ROH形成和分布的影响,我们分别计算了每条染色体相对于物理染色体位置的GC含量和重组率,并对所有染色体的结果进行平均(图6C和6D). GC含量基于猪参考基因组构建10.2[21]GC含量通常在向中着丝粒染色体的端粒区域和向顶着丝粒的染色体边缘移动时较高(图6A). 总的来说,GC含量与到端粒的距离呈负相关(图6C). 猪的重组率根据从Tortereau等人获得的~60.000个标记计算,并对所有染色体进行平均[18]染色体物理位置上的重组分数变化在猪中最为显著,而在小鼠中几乎没有,端粒区域的重组率较高,而染色体中央部分的重组率极低(图6D). 重组率的“U”型分布存在于猪的所有染色体中,而在人类中,这仅在中着丝粒染色体中观察到(数据未显示)。核苷酸多样性与重组率(cor=0.88,p<0.00001)和GC含量(cor=0.61,p<0.05)密切相关。排除ROH基因座后,欧洲品种和野猪的核苷酸多样性大大增加。然而,这种现象只在亚洲品种的染色体尖端观察到(图6A、6B). ROH分布与ROH外的GC含量、重组率和核苷酸多样性呈负相关(cor分别为−0.71、−0.87和−0.95,p均<0.0001)。这是意料之中的,因为这些基因组特征似乎都高度相关。

保存图片、插图等的外部文件。对象名称为pgen.1003100.g006.jpg
猪基因组相对染色体位置的特征。

总核苷酸多样性(6A)、ROH外核苷酸多样性的物理分布(6B)、GC含量(6C)、染色体上的重组率(6D)。所有染色体的相对染色体位置均为平均值,因此0.0代表左侧端粒区域,1.0代表最右侧端粒。

ROH在特定染色体位置发生的可能性取决于ROH的大小(图7). 四位ROH苏斯克罗法将各组分为前面提到的三个大小级别(小、中、大),并计算每个大小级别ROH在基因组中的相对分布(日本野猪属于亚洲野猪组,图7D). 在欧洲品种和亚洲两个群体中,最大的ROH更多地出现在染色体中部的低重组区域,最小的ROH相对较高地分布在端粒区域(p<0.001)。中等大小的ROH似乎均匀分布在所有组的基因组中。欧洲野猪的ROH往往比其他群体的ROH分布更均匀(图7B). 重组频率极端区域之间ROH发生率和核苷酸多样性的差异在欧洲家猪中最为显著。

保存图片、插图等的外部文件。对象名称为pgen.1003100.g007.jpg
ROH在相对染色体位置上的分布。

ROH被分为三个大小级别;大(x>5 Mbp)、中(0.1至5 Mbp,小(x<0.1 Mbp)。该分布仅与特定大小类别中ROH单元的总数有关,并且分布是所有染色体的平均值。ROH分布分为四组:欧洲猪(7A)、欧洲野猪(7B)、亚洲猪(7C)和亚洲野猪(包括日本,7D)。

ROH、基因含量和共享纯合子

我们在全基因组范围内研究了基因含量与ROH发生的相关性。我们发现基因含量与ROH计数之间没有显著相关性。当在不同样本组中重复相同的分析时,这一结果得到了证实(图S4). 此外,当使用不同类别的ROH(小型、中型、大型)时,这仍然不显著。所有测序中没有重叠的纯合子区域苏斯克罗法个人。我们在欧洲品种中发现了两个重叠的ROH(累积大小为6.03 Mbp)。第1号染色体的第一个区域不包含任何基因,而第9号染色体的第二个区域包含11个基因,其中7个是语义蛋白。这些基因参与细胞分化(神经系统发育),此前已被确定为大白猪和伊比利亚猪之间的差异表达[27]

在亚洲品种猪的所有纯合子区域中,所有个体共有4个区域,累积大小为4,38 Mbp。最大的区域位于1号染色体上,共包含1136个基因。在所有亚洲品种中,3号染色体的两个相邻部分都含有ROH。有趣的是,我们发现其中一个区域也与所有亚洲野猪的ROH部分重叠,但不是所有欧洲猪。该基因密集区共包含91个基因,此前曾报道该区域可能是亚洲猪的正选择区域[21]第5染色体上亚洲品种的最后一个纯合区包含3个基因,包括参与氧化还原的LEMD3、MSRB3和参与脂肪细胞分化正向调节的WIF1基因。

我们在13个大型白色样本中发现28个ROH重叠(欧洲品种;累积大小为54.38 Mbp)。所有这些ROH都携带基因(共336个基因)。GO分析显示37个明显过度表达的GO-ID,o.a.参与核小体的组织和组装并参与生殖(表S3). 仅在大白种长白种群所有个体中发现的ROH包含11个基因,包括与生长有关的第4染色体上的PLAG1基因。

欧洲野猪在81个地区共表现出47,52 Mbp的共同基因组纯合子。在这些相互纯合的区域中,只有26个携带基因。这些区域的97个基因导致24个GO-ID显著过度表达。在大白猪中发现的一些丰富的术语在欧洲野猪中也有过度表达,主要是组蛋白。组蛋白通常是非常同步的,这可以解释组蛋白相关基因的聚集,并且可能没有任何功能相关性。大分子复合物和细胞成分的组装和组织在野猪的名单中非常丰富,还有防御反应(表S4).

讨论

重组图谱目前仅适用于少数脊椎动物物种。猪在整个基因组中的重组率表现出非常显著的差异,在野生和驯化种群中表现出高度多样的人口统计学特征,使其成为展示重组景观和人口统计学之间相互作用的优秀模式物种。

人口统计学的影响

猪基因组中ROH的大小和丰度在不同(亚)种群个体之间存在显著差异。来自同一种群的动物在其基因组中往往具有相似的ROH模式(图4图6)这表明共享人口统计学对ROH分布的影响。大型ROH类对最近的人口变化最为敏感。因此,亚洲品种中大型ROH的双峰分布可以通过两个不同种群的采样来解释。在欧洲人中,ROH的数量和范围与纬度密切相关[13]但不是经度。Kirin等人还显示了地理位置和人类基因组ROH发生率之间的相关性[28]在我们的研究中,我们还发现欧洲和亚洲野猪在ROH丰度和大小方面存在显著差异。然而,与所有其他个体相比,日本野猪与其他亚洲野猪具有悠久的人口统计历史,但表现出完全不同的ROH模式。该个体的ROH模式与当前较小的种群规模一致。ROH的高数量(而非ROH大小或核苷酸多样性)表明种群在较长时间内一直很小,但源种群的规模很大。这种ROH模式可能表明孤立或岛屿人口较少,在相对较小的人口中也发现了较小的情况[28]

亚洲猪的累积ROH大小主要由大型ROH决定,这表明种群规模最近才有所减少,这些猪来自大型来源种群(图2). 相比之下,欧洲野猪的ROH相对于染色体位置的分布更加均匀(图7)与长期持续的低有效人口规模相一致。Scandura等人的发现。[23]证实了目前欧洲野猪(意大利半岛野猪除外)的遗传多样性主要受到冰川瓶颈的影响。Nothnagel等人表示,过去~200年来,人类最近的人口增长对基因组ROH分布没有显著影响[13]。在当前对猪的研究中,ROH确实受到了种群增长的影响,因为以前较大的ROH被不均匀分布的重组所分解(图6图7)随着新的ROH的形成,人口减少。这些不同的结果可能是这两个物种的人口统计学历史的结果,因为人类在全球范围内的人口增长,但野猪和猪的(当地)人口却严重减少。因此,ROH似乎既反映了人口的最近过去和当前状态,也反映了遥远的人口历史,并且非常容易受到人口动态的影响。

东南亚被确定为苏斯克罗法([21][22]Frantz LAF等人,未公布数据)。因此,亚洲来源种群的估计单倍型多样性高于欧洲种群并不奇怪。这种现象也见于(非洲以外的)人类遗传模式,其中核苷酸多样性和来源距离之间存在线性关系[29][30]同样,通过苏斯克罗法可能涉及许多创始人事件。预计这些事件将导致西欧亚种群的遗传多样性降低。此外,最近的研究发现,由于更新世冰川作用,欧洲的瓶颈比亚洲更为严重[21]因此,与亚洲人口相比,我们预计欧洲人口的整体遗传多样性会退化。这种现象在ROH以外的核苷酸多样性中最为明显(图5). 据英国《每日邮报》报道,大多数欧洲野猪种群的人口统计学下降似乎并没有导致这些种群的遗传变异下降[23]然而,这里我们表明,ROH分布模式以及ROH以外的核苷酸多样性与当地小有效种群规模的长期持续历史相一致。

在养殖业中,人工选择的一个可能后果是减少了有效种群规模和相关的遗传多样性。然而,养猪者通常担心保持足够的遗传变异性,以在未来保持良好的选择反应[31]基于微卫星标记和遗传多样性的定量测量,例如预期杂合性(H),[32]表明家猪品种内的遗传变异并不显著低于野猪基因组内的遗传多样性。我们的发现证实了这一点,与欧洲家猪相比,欧洲野猪含有更多的ROH,ROH以外的核苷酸多样性更低。尽管杜洛克和汉普郡品种与欧洲野猪同属于一个分支(图S1)它们的ROH模式和核苷酸多样性是欧洲品种的典型特征(图5). ROH模式是品种相似处理的标志。在封闭种群中,ROH外的核苷酸多样性(称为π-out)应反映祖先种群中存在的古代单倍型变异,并且不应受到(最近)发生的自合子的强烈影响。欧洲商品猪的总π和π-out差异最大。这表明祖先群体的单倍型多样性较高,尽管最近形成的群体有效群体规模较小,导致ROH降低了总核苷酸多样性π。这可能是因为最近欧洲和亚洲品种的混合。事实上,在工业革命期间,亚洲猪被进口到欧洲以改良当地猪。与野生猪相比,亚洲猪基因组在欧洲的这种渗入有望增加欧洲猪的总体遗传多样性。杂交可能引入了不同的单倍型,从而导致更少的IBD区和可能更高的变异。较高的核苷酸多样性可能是通过与亚洲猪杂交改良欧洲品种的结果[33][34][35]表现出强烈的异交影响。在使用Illumina猪60K珠片数据分析的荷兰野猪中,与来自同一种群的其他个体相比,有两只野猪表现出高度不同的ROH模式(图4B). 之前的一项研究确定这两个人最近与家猪融合[36]这些个体特异的ROH模式和欧洲品种中相对较高的核苷酸多样性突出了父母祖先对后代基因组变异水平和模式的重要性。

我们能够使用相同的基于重新排序的方法研究几个密切相关的ROH模式苏斯物种。在这一外群中发现了在低核苷酸多样性和ROH数量方面最杰出的个体。胡子猪婆罗猪在婆罗洲分布最广,基因组ROH覆盖率最低。这表明种群已经足够大,可以在相当长的一段时间内避免近亲交配。有趣的是卷毛野猪尽管该物种仅出现在菲律宾的几个小岛上,但显示出的ROH很少。然而,ROH的平均大小是所有个体中最大的,并且它显示出低π-out,这表明古代种群规模较小。由于该物种仅限于几个小岛,创始人效应可以解释观测到的π-out较低。物种苏斯·维罗库索斯核苷酸多样性和ROHsize最低。这表明目前和过去的有效种群数量都很小,这与IUCN红色名录上的濒危状态一致。由于这个来自动物园的个体,近亲繁殖可能会加剧。其他因素,如不同的交配制度也可能影响ROH的分布。例如,人工管理种群的交配模式预计与自然种群不同。此外,密切相关的物种甚至单独的野生种群可能具有不同的等级系统,这会强烈影响有效种群规模[7]例如,年中国家猪群与欧洲猪群的距离更近图5与欧洲野猪相比,尽管系统发育树显示出不同的聚类(图S1). 这表明,单倍型变异模式在国内种群中的形成类似,尽管有一个基本独立的驯化历史。

重组率的影响

从群体遗传学理论来看,连锁不平衡的影响对理解基因组变异很重要[37]尤其是在有选择的情况下。基因组的大部分似乎处于选择中,基因组中的所有功能位点都可能处于净化选择中[38]或适应性进化,即使在非转录区域[39]选择和人口学的影响预计将与基因组中的重组景观相互作用,从而形成个体和群体的全基因组变异。到目前为止,这种相互作用甚至在有大量基因组资源的物种中也没有得到很好的研究,并且在遗传保护研究中被忽视了[10]

ROH在其他哺乳动物(包括人类)染色体上的分布是非随机的[13][16][28][40]猪的ROHs在基因组中的比例远高于迄今为止研究的任何其他物种,其基因组中75%以上的个体含有ROHs。与其他哺乳动物相比,猪重组率的U形分布更为深刻。尽管人和猪之间存在高度保守的同源性[41]令人惊讶的是,与人类相比,猪的这种模式如此明显。其他物种的ROHs和LD之间存在相关性,在猪中也很强,在中央染色体区域外和短染色体臂中重组率较高[42]我们发现,这些外围区域的杂合性较高,这是以前在猪身上观察到的现象[43]在人类中,染色体大小似乎是ROH发生的重要决定因素[13]在猪中,ROH在较大的染色体上的发生率并不是比例较高,但似乎在整个基因组中都存在,并且主要受染色体上的物理位置的影响,特别是与局部重组率有关。朝向端粒的小ROH丰度较高,可能是因为染色体的中央部分被较大的ROH覆盖,而这些ROH由于该区域的重组较低而未被分解。正如在欧洲野猪中观察到的那样,过去人口增长稳定或持续的瓶颈可能导致ROH的分布更加均匀。

基因组特征、GC含量、核苷酸多样性和重组率均相关,在猪基因组中表现出类似的U形染色体分布(图6A–6D). 这对不同染色体区域的自合子概率具有重要意义。大ROH在低重组区域出现的频率更高。欧洲家猪和欧洲野猪ROH模式的差异可能与欧洲野生种群中更为连续的近亲繁殖有关,而欧洲野生种群在过去60年中只扩大了其种群和范围[36]欧洲猪的品种形成可能是由不同家猪和野生猪的杂交造成的,包括来自亚洲的猪。过去几十年来,猪的种群(定义为品种或商业品系)很可能有一个有效的种群规模,在许多情况下,以数十而不是数百或数千来衡量。许多传统品种已被边缘化,繁殖量很小[44]即使是商业纯系,尤其是通常用于三元或四元杂交以产生屠宰肥育猪的公猪系,也常常以较小的有效种群规模封闭。因此,较大的ROH主要出现在家猪重组率低的区域,因为形成时间较短。小ROH被认为存在于人群中的时间长于大ROH,并且与大ROH相比,小ROH更经常在个体之间共享。这背后的理论基础是,重组将随着时间退化大型ROH,但在很少或没有重组的区域,小型ROH将被保留。因此,尽管存在时间因素,但这些非重组区域在创建时将保留ROH,而最近起源的大型ROH可能会在降解之前随机出现在基因组中。因此,ROH的数量和大小分布是近期和更为历史性的人口瓶颈和近亲繁殖事件的重要决定因素。

基因含量和选择的影响

编码序列通常是哺乳动物(包括猪)中富含GC的区域[45][46]我们发现ROH的发生与基因组中GC含量之间存在相关性,但全球基因含量与ROH之间没有相关性。ROH中明显缺乏基因富集,这表明与我们研究中确定的ROH和作用于基因的选择没有直接关系。然而,一些ROH可能与非编码功能元件(如顺式调节模块)重叠。虽然已经确定了一些区域的遗传多样性损失可能是选择的结果,但我们的研究表明,绝大多数ROH可能是中性的。因此,ROH的发生和分布主要受过去人口事件和重组率的相互影响。

对其中13个个体进行测序的大白种犬,在所有组合的个体中仅发现54 Mbp为纯合子,这是同一群体ROH中嵌入的基因组总数的一小部分。因此,每个个体的纯合子总数远远大于种群的纯合度总和。在大白猪品种中,在纯合子区域发现了一些基因,这些纯合子可能正选择与商业性状相关,例如快速繁殖。然而,这些基因存在于较大的区域(许多Mbp大小)。在其他种群中,如欧洲野猪,累积共享的纯合区域要短得多,并且并不总是携带基因,这可能表明,尽管野生种群的个体基因组具有高度的纯合性,但选择性扫描可能并不常见。一些重叠的ROH可能包含与防御机制和适应新环境有关的特定基因,但在野猪之间的许多重叠ROH区域中未发现任何基因,这一事实说明了ROH发生的随机性。我们的结论是,由于正选择,猪中只有一小部分ROH区域是纯合的。

结论

我们的研究表明,ROH的形成主要受过去人口统计事件和局部重组率的影响。这一发现表明,近交和重组率可能在包含基因的区域共同作用,模拟选择。因此,低重组区域的基因具有更高的近亲繁殖风险,并且可能经历更快速的固定。这种现象会对小群体中个体的适应性产生重大影响。

ROH与局部GC含量和重组率的全基因组相关性突出了基因组特征的重要性,例如重组率对纯合子预测的重要性。许多二倍体物种在全基因组重组率上可能具有异质性。这意味着根据有效的种群规模、系谱,甚至遗传数据(例如微卫星基因型数据)来估计近亲繁殖系数[12][47],没有完全测量IBD纯合性的比例和分布。因此,近交衰退的风险被低估了。此外,在选择性扫描分析中,这种低重组的局部基因组区域可能被错误地解释为处于选择中。

我们基于重新排序的方法来确定基因组变异,将基因组ROH分布作为核苷酸多样性的单独变量。我们表明,该方法甚至适用于密切相关的非模型物种。因此,它的效用超越了物种界限,并结合了二倍体生物多样性的不同特征。我们表明,人口统计学和重组景观都会影响基因组ROH的发生,在设计野生和驯化物种的遗传保护策略时,应同时考虑这些因素。我们建议对全基因组机制进行更多研究,通过影响ROH的定位来防止近亲繁殖的负面影响。

材料和方法

实验装置

共选择52只动物在猪60K SNP芯片上进行重新测序和基因分型。我们对每种婆罗猪印尼野猪卷毛野猪疣状皮肤还有一只疣猪(非洲Phacochoerus africanus)代表该属以外的一个近亲苏斯.在苏斯克罗法欧洲五个猪种杜洛克、汉普郡、大白猪、皮特兰和长白猪分别由4只、2只、13只、5只和5只个体组成。来自荷兰、法国和意大利四个不同种群的欧洲野猪种群共有六只动物作为一个单独的组,以及五只亚洲野猪(两只来自华北,两只来自华南,一只来自一个日本岛屿的小种群)。最后,选择了7头中国猪,4头来自眉山品种,2头来自湘品种,1头来自建渠海品种,以代表亚洲家猪的变异。另有241人来自苏斯克罗法对个体进行测序的人群进行基因分型,以进行基于SNP分析的ROH分析。由于在60K芯片上对其他Suid的确定偏差和分离SNP的不足苏斯克罗法,没有其他Sus物种的基因型(图S5).

DNA提取、SNP基因分型和文库制备

使用QIAamp DNA血液自旋试剂盒(Qiagen Sciences)从全血中提取DNA。在Qubit 2.0荧光仪(Invitrogen)上检查每个DNA样本的数量和质量,并在1%琼脂糖凝胶上运行。在Illumina猪60K iSelect芯片上进行SNP基因分型[48]所有个体的DNA稀释至100 ng/ul,并根据IlluminaHD iSelect方案进行基因分型。使用Genome Studio软件(Illumina Inc.)对数据进行分析。在重新测序的情况下,根据Illumina文库准备协议(Illunima Inc.),使用1–3 ug基因组DNA对单个样本进行文库构建和重新测序。文库插入大小的目标是300–500 bp,并使用100对-end测序试剂盒进行测序。

测序和SNP发现

从家养品种和野生种群中选择的所有个体猪均已完全测序至~8×深度(详细说明表S1). 将读取值修剪为每分质量>20,两对最小长度均为40 bp,并将质量修剪后的读取值与Sus-scrofa参考基因组构建10.2进行比对[21]使用Mosaik Aligner(V.1.1.0017)的独特对齐选项,避免因拷贝数变化和重复而导致错误调用SNP。数据已存放在EBI的序列读取档案(SRA)中,登记号为ERP001813(链接:http://www.ebi.ac.uk/ena/data/view/ERP001813). 从SAMtools(V.0.1.7 r510)软件包中调用并使用mpileup筛选SNP[49]具有二倍体生物体的默认设置。使用VCFtools对调用的变体进行额外过滤(minDP=7;minDP调用SNP=2;maxDP=~2*平均覆盖率;不包括索引)。通过将最小深度设置为7×,将SNP称为7×并且仅考虑7×足以覆盖的基底,我们减少了缺失变体的数量。计算每个个体内整个基因组中10 kbp的核苷酸多样性。“SNPbin”是每10 kbin的SNP计数,针对该bin中未被VCFtools过滤足够覆盖的碱基数进行校正,因此每个bin的最终SNP计数(SNPbins)与10.000个覆盖碱基成比例。SNPcount=一个10 kbp的箱子中统计的SNP总数。DP=覆盖率(单位:bp/bin)(每个基底的深度至少为7×,最大为~2×平均覆盖率)。箱子大小=10.000。校正系数=DP/箱尺寸。SNPbin=SNPscount/校正系数。

系统发生树构建

为52个重新测序的个体构建了系统发育树。我们在Illumina猪60K iSelect珠片上对这些个体进行了基因分型。基于这些基因型,使用Plink 1.07创建了IBS相似性矩阵[50]随后,使用Phylip软件包中提供的程序neighbor执行加入层次聚类的邻居[51]

ROH定义

提取52个重测序个体的所有常染色体的纯合子区域。性染色体被排除在外,因为它们的重组景观与常染色体不同,并且X染色体的遗传图谱分辨率与猪的常染色体不同。此外,如果包含X染色体,男性和女性应该得到不同的对待,而这种分析超出了本文的范围。自合子(父母双方从共同祖先遗传而来的基因组区域,因此表明一定程度的亲缘关系)通常可以作为ROH追溯到基因组中。通过重组,自动接合的拉伸最终被分解成较短的片段。纯合子区域是指个体中包含的变异小于基于基因组平均值的预期变异的基因组延伸。使用滑动窗口方法确定重新测序个体的常染色体纯合子延伸(ROH)。SNP以10 kbp为单位进行计数,那些落入10个连续箱子窗口且总SNP平均值低于基因组平均值的箱子在正向和反向方向上进行提取。将所有相邻的垃圾箱串联起来,形成纯合拉伸。在这一选择中,只有那些SNP计数低于设定阈值的片段才被认为是真正纯合片段的一部分。阈值设置为SNP计数最大为基因组平均值的0.25倍,每段错误发现率加上突变率的最大绝对值(μ=2.5*10−8)因为在某些情况下,这超过了基因组平均值的0.25倍。根据Illumina猪60K iSelect芯片上的纯合基因座计算错误发现率[48]在我们的数据库中,vcftools将其称为杂合位点(平均每箱约1.78个)。杂合子阈值而非无杂合子容差背后的理论基础是,原始纯合子延伸的突变可能会随着时间的推移掩盖纯合子。个体的全基因组杂合性表示了群体中当前的变异,以及某个纯合延伸将重新结合的相关机会。测序个体在基因组杂合性和种群历史上差异很大。此外,并不是所有人群都被同等抽样。因此,阈值的高度仅基于受试个体的基因组平均值,而不是基于总个体集或基于等位基因频率的ROH发生可能性。基因组平均值的0.25倍的阈值基于排列,其中单个SNP分布在所有染色体上随机分布。当值小于基因组平均值的0.25倍时,观察到的ROH分布偏离了随机分布(参见图S6). 通过在纯合子范围内放宽单个基因座的阈值,如果10个基因座的局部最大值不超过基因组平均值的2/3倍,则允许一个基因座中平均SNP计数的最大值是平均值的两倍,从而尽可能避免局部组装或对齐错误,假设错误垃圾箱周围的ROH平均值仍符合上述标准。垃圾箱覆盖不足(DP=<10%)被排除在SNP平均值计算之外,但包含在ROH尺寸测定中,接受的ROH最多包含2/3个未覆盖的箱子,并且两端都包含有覆盖的箱子(例如图S7). 在一项所有个体的覆盖率都降低的分析中,我们对垃圾箱覆盖率(DP=<5、<10、<20、<50、<80%)和ROH内未覆盖垃圾箱的比例(<1/4、<1/3、<1/2、<2/3、<3/4)使用了5个阈值范围。我们将结果与高覆盖个体进行了比较,当使用DP=<10%的垃圾箱覆盖阈值和<2/3的缺失垃圾箱阈值时,由于低覆盖导致的ROH大小和丰度的误差最小。

我们在Illumina猪60K iSelect Beadchip上对241个人进行了ROH检测的基因分型(详情见表S2). 使用PLINK(v.1.07)中的Runs of Homozygenity工具,通过调整参数(–homozyg-density 1000,–homozzyg-window-het 1,–homo zyg-kb 10,–homonzyg-windows-snp 20)计算ROH[50]。标记被筛选为呼叫率>95%。PLINK v.1.07中的纯合子工具不包括在评估ROH时去除MAF<0.05或LD修剪。我们旨在使60K数据和基因组数据的ROH检测方法尽可能相似,以便进行合理的比较。因此,没有对低等位基因频率进行额外的过滤,因为不同人群的采样是不平等的,去除罕见的等位基因可能会导致对样本不足人群中个体的ROH过高估计。没有根据重组率进行调整,因为我们的部分目标是分析重组率对ROH发生的影响。对于重新排序的动物,用R(v.2.11.1)测试与用PLINK定义的ROH的相关性cor公司cor.测试功能。

人口规模估计

使用PSMC中实施的HMM推断出欧洲(n=2,来自荷兰和意大利)和亚洲(n=2,来自中国北部和南部)野猪的有效种群规模和比例[52]拷贝数中性片段,累积大小为1Mbp,世代时间为五年(g=5),默认突变率/世代(μ=2.5*10−8).

基因组ROH分布的统计分析

所有基因组特征都基于非重复屏蔽苏斯克罗法参考基因组(构建10.2)。计算每个相对染色体距离(0-1,步长0.05)的GC含量和核苷酸多样性值,并对所有染色体进行平均。基于猪的遗传图谱[18]我们根据相对容器内相邻标记的遗传距离和物理距离的比率(容器内所有标记的平均值)估计重组率。为了与人类、小鼠和奶牛基因组中的重组率进行比较,我们使用了迈尔斯描述的遗传距离及染色体大小,Shifman和Arias分别[53][54][55]分别分析了四个组(亚洲野生、欧洲野生、亚洲品种和欧洲品种),计算了组内相对ROHbin分布和基因组特征的相关系数,并用R(v2.11.1)检验了显著性cor公司cor.测试与Pearson的产品-矩相关函数。用R(v2.11.1)中的单向方差分析检验了ROH外核苷酸多样性、ROH数和ROHsize的组间差异。各组ROH的比例差异和ROH在相对染色体位置上的均匀性通过R中的比例和良好性的χ2检验进行了测试。所有图均使用R(v.2.11.1)lattice包和Ubuntu OpenOffice 3.2.1生成。

ROH和基因含量

每个染色体被分成20个大小相等的片段,并计算每个片段的相对基因含量。ROH根据三个大小等级进行分组,并计算每个等级在这些染色体片段上的相对分布。用相关检验检验了R。

所有带注释的猪基因来自苏斯克罗法(构建10.2 Ensembl版本67),使用Biomart提取[56]染色体上基因分布的计算方法与ROH发生的计算方法类似。每个染色体被分成20个大小相等的片段(因此每个片段代表染色体的5%),每个片段的基因总数被计算并表示为每个片段的相对基因含量,与染色体上的总基因含量成比例。由于人类基因组得到了更好的注释,因此在基因本体分析中考虑了猪基因的所有人类集合同源序列。宾果v2.44[57]a细胞景观v2.8.3[58]该插件使用人类注释作为背景,用于识别与生物过程相关的过度代表的GO术语。使用超几何检验评估丰富术语的重要性,并对多次比较进行Benjamini和Hochberg校正。

支持信息

图S1

所有52个测序个体的系统发育树。距离基于Illumina猪60K iSelect珠片上的基因型。可以观察到三个主要集群:其他Sus物种起源于东南亚群岛,野生和驯化的亚洲苏斯·斯科法欧洲野生和驯化苏斯克罗法。分支长度可能会受到影响,因为在SNP芯片构建期间,关注欧洲猪的可变位点带来了确定偏差。

(畅通节能法)

图S2

1号染色体上核苷酸多样性的分布。x轴以bp为单位显示染色体上的物理位置,y轴以10kbp为单位显示被调用的SNPs的校正数量。数据显示了来自Veluwe的荷兰野猪、来自欧洲Pietrain品种的猪、来自中国北方的野猪和来自日本岛屿的野猪。

(畅通节能法)

图S3

用两两序贯马尔可夫曲线(PSMC)估计人口历史和人口规模。x轴显示年份,y轴显示估计的有效种群规模N。数据显示了来自华北(红色)和华南(绿色)的两只亚洲野猪,以及来自荷兰(紫色)和法国(蓝色)的两只欧洲野猪。

(畅通节能法)

图S4

基因组基因含量与ROH频率的相关性。第4A条。基因含量在相对染色体位置上的分布,分别为所有染色体绘制。中着丝粒染色体显示为蓝色,顶着丝粒为红色。小(4B)、中(4C)和大(4D)ROH的相对基因含量与ROH频率呈曲线关系。ROH分布分为四组:欧洲品种(红色)、欧洲野猪(绿色)、亚洲品种(紫色)和亚洲野猪(包括日本、橙色)。

(畅通节能法)

图S5

比较基因组数据和60K数据的ROH数量和累积大小。x轴显示了每个个体的ROH数量,y轴显示了单个ROH的累积大小。显示基因组数据(蓝色)和60K数据(红色)的数据。所有52只已测序的动物都包括在分析中。只有对于60K数据,才会包括个人的姓名,这表明对于非苏斯克罗法物种(Warthog,疣状苏斯、cebifron苏斯、celebensis苏斯和barbatus苏斯)对于日本野猪(WB20U02),与基于基因组数据的ROH数量和大小相比,基于60K数据的ROHs数量和大小被高估。这可能是由于引入60K数据的确定偏差,因为芯片是基于欧洲猪品种中发现的多态性构建的。

(畅通节能法)

图S6

随机分配SNP分布的ROH检测试验示例。x轴显示ROH中所有箱子的平均SNP数量,相对于箱子中全基因组SNP的平均数量。以连续箱子为单位的ROH长度显示在y轴上。ROH计算按照方法一节中的说明进行,但截断值为基因组平均值的0.25倍。红点显示了ROH长度和SNP计数在个体内的真实分布。蓝色圆点表示置换后的分布。从图中可以看出,真实分布和基于随机SNP数据在基因组上分布的分布在每个ROH的相对SNP计数0.25倍基因组平均值以下存在显著差异。截止值以下的值以橙色显示为真实分布,以浅蓝色显示为随机分布。

(畅通节能法)

图S7

ROH计算示例。x轴表示染色体上的位置,y轴表示每箱10 Kbp的校正SNP数。蓝色虚线表示染色体平均值,紫色线2*表示平均值。突变率μ=2.5*10−8(=0.0025 SNP/10 kbp),错误发现率为0.0002(2 SNP/bin)。在这种情况下,ROHbin中的最大SNP计数为0.25*10=2.5,因为(2+0.0025)<2.5。星号表示ROH内有一个箱子,SNP计数为20。由于局部最大值不超过2*,平均值(=20)和周围10个垃圾箱的最大平均值(=(9*2.5+20)/10)=4.3)不超过平均值(=6.67)的2/3倍,因此垃圾箱被纳入ROH1。由于ROH1和ROH2之间的料仓局部确实超过了这个最大值,因此它们不被视为ROH的一部分。

(TIF)

表S1

所有测序个体的汇总统计。前两列“背景”和“组”定义了个人的背景。欧洲品种中包含的个体属于杜洛克、汉普郡、长白猪、大白猪和皮特兰品种。中国的品种有剑曲海、梅山和湘。欧洲野猪是荷兰、法国和意大利的个体,亚洲野猪来自日本和中国。这个巴巴多斯苏斯、塞比夫隆苏斯、塞勒宾苏斯、疣状苏斯和沃索格(非洲Phacochoerus africanus)聚在其他物种群中。“单个”列显示每个清管器的代码。第4列显示了个体内ROH的平均大小(单位:bp)。第5列显示了一个人体内检测到的ROH总数。第6列显示了ROH以外个体基因组中的平均核苷酸多样性。第七列显示每个排序个体的平均读取深度覆盖率。最后一列显示了每个个体基因组的相对覆盖率,每个碱基的读取深度至少为7,最大读取深度为平均覆盖率的2倍。

(XLS)

表S2

Illumina猪60K iSelect Beadchip上所有基因型个体的汇总统计数据。前两列“背景”和“组”定义了个人的背景。PLINK检测到的ROH总数如第四列所示。最后一列显示基因组中ROH的总数。

(XLS)

表S3

在大型白色ROH中过度出现的GO-ID列表。提取了所有大白鲨纯合子基因组区域的基因。第1列中的GO-ID在这些ROH区域中过度表达(B列中的p值,Benjamini和Hochberg校正了C列中的p值)。相应生物过程的描述如D列所示,所有参与GO组的基因均列在E列。

(XLS)

表S4

欧洲野猪ROH中过度出现的GO-ID列表。提取了所有欧洲野猪纯合子基因组区域的基因。第1列中的GO-ID在这些ROH区域中过度表达(B列中的p值,Benjamini和Hochberg校正了C列中的p值)。相应生物过程的描述如D列所示,所有对GO组有贡献的基因如E列所示。

(XLS)

致谢

我们要感谢猪基因组测序协会预先发布构建的参考基因组10.2。DNA样本由中国农业大学李宁博士提供;Alain Duvro博士,UMR INRA-ENVT,法国;意大利帕达诺Parco Technologico公司Sem Genini;Gono Semiadi博士,Puslit Biologi,印度尼西亚;Okumura Naohiko博士,工作人员研究所446-1 Ippaizuka,日本;苏格兰爱丁堡大学罗斯林研究所和皇家(迪克)兽医学院的阿兰·阿奇博尔德博士;荷兰猪遗传研究所;奥利弗·莱德博士,美国圣地亚哥动物园;谢丽尔·莫里(Cheryl L.Morri)博士,美国奥马哈亨利·杜利动物园(Henry Doorly Zoo,USA)。我们感谢遗传学实验室的Bas J.Zwaan博士和瓦格宁根(Wageningen UR)动物育种和基因组学组的Gus Rose博士的编辑和讨论。

资金筹措表

该项目由欧洲研究委员会根据欧洲共同体第七框架计划(FP7/2007-2013)/ERC拨款#ERC-2009-AdG:249894(SelSweep项目)和Illumina Inc.(加利福尼亚州圣地亚哥)提供财政支持。资助者在研究设计、数据收集和分析、出版决定,或手稿的准备。

工具书类

1Auton A、Bryc K、Boyko AR、Lohmueller KE、Novembere J等人(2009年)基因组多样性的全球分布突显了大陆人口丰富复杂的历史基因组研究 19: 795–803.[PMC免费文章][公共医学][谷歌学者]
2vonHoldt BM、Pollinger JP、Earl DA、Knowles JC、Boyko AR等人(2011年)神秘狼类犬科动物进化史的全基因组研究基因组研究 21: 1294–1305.[PMC免费文章][公共医学][谷歌学者]
三。Ku CS、Naidoo N、Teo SM、Pawitan Y(2011)纯合子区域及其对复杂疾病和性状的影响人类遗传学 129: 1–15. [公共医学][谷歌学者]
4Nalls MA、Guerreiro RJ、Simon-Sanchez J、Bras JT、Traynor BJ等(2009年)扩展纯合子域确定与晚发性阿尔茨海默病相关的新候选基因神经遗传学 10: 183–190.[PMC免费文章][公共医学][谷歌学者]
5Vine AE、McQuillin A、Bass NJ、Pereira A、Kandaswamy R等(2009)没有证据表明双相情感障碍的纯合子过度运行精神病学遗传学 19: 165–170. [公共医学][谷歌学者]
6Lencz T、Lambert C、DeRosse P、Burdick KE、Morgan TV等(2007)纯合子序列揭示精神分裂症中高度渗透的隐性基因座美国国家科学院院刊 104: 19942–19947.[PMC免费文章][公共医学][谷歌学者]
7赖特·S(1921)配对系统。二、。近交对群体遗传组成的影响遗传学 6: 124–143.[PMC免费文章][公共医学][谷歌学者]
8Pryce JE、Hayes BJ、Goddard ME(2012年)利用基因组信息最大化遗传增益的同时最小化子代近交的新策略乳品科学杂志 95: 377–388. [公共医学][谷歌学者]
9Shaffer ML(1981年)物种保护的最小种群规模生物科学 第31页,第2页: 131–134.[谷歌学者]
10Allendorf FW,Hohenlohe PA,Luikart G(2010年)基因组学与保护遗传学的未来Nat Rev基因 11:697–709。[公共医学][谷歌学者]
11Laikre L、Allendorf FW、Aroner LC、Baker CS、Gregovich DP等人(2010年)在执行生物多样性公约时忽视遗传多样性保护生物 24: 86–88. [公共医学][谷歌学者]
12Keller MC、Visscher PM、Goddard ME(2011年)利用密集单核苷酸多态性数据对远祖近亲交配的量化及其检测遗传学 189: 237–249.[PMC免费文章][公共医学][谷歌学者]
13Nothnagel M、Lu TT、Kayser M、Krawczak M(2010)SNP定义的欧洲人纯合子序列的基因组和地理分布人类分子遗传学 19: 2927–2935. [公共医学][谷歌学者]
14MacLeod IM、Meeuwissen THE、Hayes BJ、Goddard ME(2009)一种新的多位点单倍型纯合性预测因子:与现有预测因子的比较遗传学研究 91: 413–426. [公共医学][谷歌学者]
15Pemberton TJ、Absher D、Feldman WM、Myers RM、Rosenberg NA等人。世界人口纯合子的基因组模式。(2012)美国人类遗传学杂志 91: 275–292.[PMC免费文章][公共医学][谷歌学者]
16Vonholdt BM、Pollinger JP、Lohmueller KE、Han E、Parker HG等(2010年)全基因组SNP和单倍型分析揭示了狗驯化的丰富历史性质 464: 898–902.[PMC免费文章][公共医学][谷歌学者]
17Howrigan DP、Simonson MA、Keller MC(2011)通过纯合子序列检测纯合子:三种纯合子检测算法的比较BMC基因组 12: 460.[PMC免费文章][公共医学][谷歌学者]
18Tortereau F、Servin B、Frantz L、Megens H、Milan D等人(2012)在猪中观察到的性别特异性重组率差异与GC含量相关BMC基因组新闻界。[PMC免费文章][公共医学][谷歌学者]
19Larson G、Cucchi T、Fujita M、Matisoo-Smith E、Robins J等人(2007)苏斯的系统发育和古代DNA为东南亚和大洋洲岛屿新石器时代的扩张提供了见解美国国家科学院院刊 104: 4834–4839.[PMC免费文章][公共医学][谷歌学者]
20Mona S、Randi E、Tommaseo-Ponzetta M(2007)从细胞色素b序列推断Sus属的进化史Mol系统发育演化 45: 757–762. [公共医学][谷歌学者]
21Groenen MAM、Archibald AL、Uenishi H、Tuggle CK、Takeuchi Y等人(2012)对猪基因组的分析为猪的人口统计和进化提供了见解性质按。[PMC免费文章][公共医学][谷歌学者]
22Larson G、Dobney K、Albarella U、Fang M、Matisoo Smith E等人(2005年)世界野猪的谱系地理学揭示了养猪的多个中心科学类 307: 1618–1621. [公共医学][谷歌学者]
23Scandura M、Iacolina L、Crestanello B、Pecchioli E、Di Benedetto MF等(2008)欧洲野猪遗传变异的形成因素是古代与近代的过程:上次冰川作用的影响仍然可以检测到吗?分子生态学 17: 1745–1762. [公共医学][谷歌学者]
24Zachos J、Pagani M、Sloan L、Thomas E、Billups K(2001)到目前为止全球气候的趋势、节律和异常科学类 292: 686–93. [公共医学][谷歌学者]
25Larson G、Albarella U、Dobney K、Rowley-Convy P、Schibler J等人(2007)古代DNA、养猪和新石器时代传入欧洲美国国家科学院院刊 104: 15276–15281.[PMC免费文章][公共医学][谷歌学者]
26Nei M,Li WH(1979)用限制性内切酶研究遗传变异的数学模型美国国家科学院院刊 76: 5269–5273.[PMC免费文章][公共医学][谷歌学者]
27Ferraz ALJ、Ojeda A、López-Béjar M、Fernandes LT、CastellóA等人(2008)猪组织的转录组结构BMC基因组学 173: 1–20.[PMC免费文章][公共医学][谷歌学者]
28Kirin M、McQuillan R、Franklin CS、Campbell H、McKeigue PM等人(2010)纯合子基因组序列记录了人口历史和血缘关系公共科学图书馆一号 5:e13996。[PMC免费文章][公共医学][谷歌学者]
29Ramachandran S、Deshpande O、Roseman CC、Rosenberg NA、Feldman MW等人(2005)人类群体中遗传和地理距离的关系支持源自非洲的一系列创始人效应美国国家科学院院刊 102: 15942–15947.[PMC免费文章][公共医学][谷歌学者]
30李JZ、Absher DM、Tang H、Southwick AM、Casto AM等(2008)从全基因组变异模式推断的全球人类关系科学类 319: 1100–1104. [公共医学][谷歌学者]
31Habier D,Götz K(2009)巴伐利亚州Piétrain猪育种计划,估计遗传趋势和有效种群规模畜牧科学 123,问题2–3: 187–192.[谷歌学者]
32Ramírez O、Ojeda A、Tomás A、Gallardo D、Huang LS等(2009)整合Y染色体、线粒体和常染色体数据分析猪品种的起源分子生物学进化 26: 2061–2072. [公共医学][谷歌学者]
33Giuffra E、Kijas JM、Amarger V、Carlborg O、Jeon JT等人(2000年)家猪的起源:独立驯化和随后的渐渗遗传学 154:1785年至1791年。[PMC免费文章][公共医学][谷歌学者]
34Megens HJ、Crooijmans RPMA、San Cristobal M、Hui X、Li N等(2008)从混合DNA样本评估中国和欧洲猪品种的生物多样性:两个驯化地区微卫星变异的差异基因选择进化 40: 103–128.[PMC免费文章][公共医学][谷歌学者]
35SanCristobal M、Chevalet C、Haley CS、Joosten R、Rattink AP等人(2006年)利用微卫星标记研究欧洲猪品种内部和之间的遗传多样性动画基因 37: 189–198. [公共医学][谷歌学者]
36Goedbloed D、Megens H、van Hooft P、Lutz W、Crooijmans RPMA等人(2012)全基因组SNP分析揭示了最近家猪向西北欧野猪群体的基因渗入分子生态学新闻界。[公共医学][谷歌学者]
37Megens HJ、Crooijmans RP、Bastiaansen JW、Kerstens HH、Coster A等人(2009年)鸡宏、微染色体连锁不平衡和单倍型多样性的比较BMC基因 10: 86.[PMC免费文章][公共医学][谷歌学者]
38Lohmueller KE、Albrechtsen A、Li Y、Kim SY、Korneliussen T等(2011)自然选择影响人类基因组中假定中性位点遗传变异的多个方面公共科学图书馆-基因 7:e1002326。[PMC免费文章][公共医学][谷歌学者]
39Andolfatto P(2005)果蝇非编码DNA的适应性进化性质 437: 1149–1152. [公共医学][谷歌学者]
40Curtis D、Vine AE、Knight J(2008)扩展纯合子区域的研究为探索人类群体的单倍型结构提供了强有力的方法安·哼·杰奈特 72:261–278。[PMC免费文章][公共医学][谷歌学者]
41Sun HF、Ernst CW、Yerle M、Pinton P、Rothschild MF等(1999)人类3号染色体和猪13号染色体表现出完全的共有保守性,但存在广泛的基因顺序差异细胞遗传学细胞遗传学 85: 273–278. [公共医学][谷歌学者]
42Rohrer GA、Alexander LJ、Hu Z、Smith TP、Keele JW等(1996)猪基因组的综合图谱基因组研究 6:371–391。[公共医学][谷歌学者]
43Esteve-Codina A、Kofler R、Himmelbauer H、Ferretti L、Vivancos AP等人(2011年)高度近交伊比利亚猪的部分短读测序及其基因组学推断遗传 107: 256–264.[PMC免费文章][公共医学][谷歌学者]
44Herrero-Medrano JM、Megens HJ、Crooijmans RP、Abellaneda JM、Ramis G.对微卫星、mtDNA和SNP基因型数据的农场无标记分析表明,近亲繁殖和杂交对西班牙本地猪种的生存构成威胁。正在印刷中。[公共医学]
45Nie H、Crooijmans RP、Lammers A、van Schothorst EM、Keijer J等人(2010年)鸡的基因表达与陆生脊椎动物的结构基因组特征和保守转录模式相关公共科学图书馆一号 5 8:e11900。[PMC免费文章][公共医学][谷歌学者]
46Wernersson R、Schierup MH、Jörgensen FG、Gorodkin J、Panitz F等人(2005)序列空间中的猪:基于鸟枪测序的0.66×覆盖猪基因组调查BMC基因组 6: 70.[PMC免费文章][公共医学][谷歌学者]
47Leutenger A、Prum B、Génin E、Verny C、Lemainque A等(2003)利用基因组数据估算近交系数美国人类遗传学杂志 73: 516–523.[PMC免费文章][公共医学][谷歌学者]
48Ramos AM、Crooijmans RPMA、Afara NA、Amaral AJ、Archibald AL等人(2009年)利用新一代测序技术鉴定和表征的SNP设计猪的高密度SNP基因分型检测公共科学图书馆一号 4:e6524。[PMC免费文章][公共医学][谷歌学者]
49Li H、Handsaker B、Wysoker A、Fennell T、Ruan J等(2009)序列对齐/映射格式和SAMtools生物信息学 25: 2078–2079.[PMC免费文章][公共医学][谷歌学者]
50Purcell S、Neale B、Todd-Brown K、Thomas L、Ferreira MAR等人(2007年)PLINK:用于全基因组关联和基于人群的连锁分析的工具集美国人类遗传学杂志 81: 559–575.[PMC免费文章][公共医学][谷歌学者]
51Felsenstein J.(2005)。PHYLIP(系统发育推断包)3.6版。由作者分发。西雅图华盛顿大学基因组科学系。
52Li H,Durbin R(2011)从个体全基因组序列推断人类种群历史性质 475:493–496。[PMC免费文章][公共医学][谷歌学者]
53Myers S、Bottolo L、Freeman C、McVean G、Donnelly P(2005)人类基因组重组率和热点的精细地图科学类 310: 321–324. [公共医学][谷歌学者]
54Shifman S、Bell JT、Copley RR、Taylor MS、Williams RW等(2006)小鼠基因组高分辨率单核苷酸多态性遗传图谱公共科学图书馆生物 4:e395。[PMC免费文章][公共医学][谷歌学者]
55Arias JA、Keehan M、Fisher P、Coppieters W、Spelman R(2009)牛基因组的高密度连锁图BMC基因 10: 18.[PMC免费文章][公共医学][谷歌学者]
56Haider S、Ballester B、Smedley D等人(2009年)BioMart Central Portal–统一访问生物数据核酸研究 37: 23–27.[PMC免费文章][公共医学][谷歌学者]
57Maere S、Heymans K、Kuiper M2005.BiNGO:一个用于评估生物网络中基因本体类别过度表达的Cytoscape插件生物信息学 21: 3448–3449. [公共医学][谷歌学者]
58Shannon P、Markiel A、Ozier O、Baliga NS、Wang JT、Ramage D、Amin N、Schwikowski B、Ideker T(2003)Cytoscape:生物分子相互作用网络集成模型的软件环境基因组研究 13: 2498–2504.[PMC免费文章][公共医学][谷歌学者]

来自的文章PLOS遗传学由以下人员提供多环芳烃