跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2015年10月1日;526(7571):68-74.
doi:10.1038/nature15393。

人类基因变异的全球参考

合作者

人类遗传变异的全球参考

1000基因组项目联盟等。 自然. .

摘要

1000基因组项目旨在通过对来自多个群体的不同个体进行全基因组测序,全面描述人类常见的遗传变异。在这里,我们报告了该项目的完成,使用低覆盖率全基因组测序、深层外显子组测序和密集微阵列基因分型相结合的方法,从26个群体中重建了2504个个体的基因组。我们描述了广泛的遗传变异,共有超过8800万个变异(8470万个单核苷酸多态性(SNP)、360万个短插入/缺失(indels)和60000个结构变异),所有这些都是分阶段的高质量单倍型。该资源包括>99%的SNP变异体,各种祖先的频率>1%。我们描述了全球样本中遗传变异的分布,并讨论了对常见疾病研究的影响。

PubMed免责声明

利益冲突声明

D.M.A.隶属于Vertex Pharmaceuticals,E.A.是Illumina的发言人办公室,P.A.是Iillumina和Ancestry.com的顾问,D.R.B.、B.B.、M.B.、R.K.C.、A.C.、M.E.、s.H.、s.K.、L.M.、J.P.和R.s.隶属于Illumana,J.K.B.隶属于Ancestry.com,A.C.是Biogen Idec科学咨询委员会的成员。Affymetrix科学咨询委员会A.W.C.隶属于DNAnexus,D.C.隶属于Personalis,C.J.D.,J.G.,J.P.S.,T.W.,B.W.,Y.Z隶属于Affymmetrix,E.T.D.是DNAnexos的顾问,F.M.D.L.V.受雇于Real Time Genomics,M.A.D.隶属于SynapDx,P.D.是Genomics的联合创始人和董事,也是Peptide Groove的合伙人,R.D.是Congenica的创始人和燕尾服的顾问,E.E.E.是DNAnexus科学咨询委员会的成员,也是昆明理工大学1000中国人才计划的顾问,P.F.是Omicia科学咨询委员会的成员,M.G.是Bina和DNAnexus的顾问,F.C.L.H.隶属于ThermoFisher scientific,N.H.隶属Life Technologies,C.L.是BioNano Genomics的科学顾问,H.Y.K.L.隶属Bina Technologies(罗氏测序的一部分),E.R.M.持有Life Technologies的股份,G.M.是Genomics的联合创始人,也是Peptide Groove的合作伙伴。

数字

图1
图1。人口抽样。
a、,抽样群体中的多态性变体。每个饼的面积与群体中多态性的数量成正比。馅饼分为四个部分,代表一个群体专有的变体(群体特有的深色)、一个大陆区域专有的变体(整个大陆群体共享的浅色)、一个大陆区域共享的变体(浅灰色)和一个所有大陆共享的变体(深灰色)。虚线表示在其祖先大陆区域以外采集的种群。b中,每个基因组的变异位点数量。c、,每个基因组的平均单线态数。PowerPoint幻灯片
图2
图2。人口结构和人口统计学。
a、,使用8个聚类的最大似然方法推断人口结构。b中,使用PSMC推断的有效种群规模随时间的变化。直线表示人口中位PSMC估计值,通过拟合穿过bin中点的三次样条进行平滑。PowerPoint幻灯片
图3
图3。人口分化。
a、,在全球样本中发现变异罕见(<0.5%),但在人群中常见(>5%)。b中,在一对密切相关的群体之间表现出强烈分化的基因。垂直轴给出了F类装货单-基于种群分支统计(PBS),将选定的基因着色以指示达到最大值的种群。PowerPoint幻灯片
图4
图4。插补和eQTL发现。
a、,插补准确性与六个群体的等位基因频率有关。插入部分使用所有样本(实线)和相交样本(虚线)比较第3阶段和第1阶段之间的插补精度。b中,标记变体的平均数量(第页2>0.8)作为普通(顶部)、低频(中部)和罕见(底部)变体物理距离的函数。c、,在每个群体的69个样本中发现的SNP和indels的顶级eQTL变异的比例。日期:,TFBS中eQTL的百分比,在第一个群体中进行了发现,并通过包括来自第二个群体的额外69个样本进行了精细定位(*P(P)< 0.01, **P(P)< 0.001, ***P(P)<0.0001,McNemar试验)。对角线表示使用原始发现样本的TFBS中eQTL的百分比。PowerPoint幻灯片
扩展数据图1
扩展数据图1。调用集生成管道的摘要。
方框表示过程中的步骤,数字表示补充信息中的相应部分。
扩展数据图2
扩展数据图2。发现的力量和杂合子基因型不一致。
a、,在由完整基因组学(CG)测序到高覆盖率的284个基因组的重叠样本中确定的SNP和indels的主要数据集中的发现能力,以及单倍型参考联盟(HRC)构建的>60000个单倍型的小组。为了测量不确定性,为每条染色体绘制一条曲线。b中,与第1阶段相比,第3阶段的发现能力有所提高,这是在第1阶段和第3阶段包含的170个完整基因组样本中进行的评估。c、,与284个完整基因组相比,SNP、indels和SVs第3阶段的杂合子不一致。日期:,交叉样本中相3与相1的杂合子不一致。e、,检测完整基因组SNP的敏感性与测序深度的关系。f、,与完整基因组学数据相比,杂合子基因型不一致是测序深度的函数。
扩展数据图3
扩展数据图3。变量计数。
a、,第3阶段样本中的变异数量是替代等位基因频率的函数。b中,全样本等位基因频率<0.5%(灰条)的每个基因组检测到的平均变异数,单子染色体的平均数用颜色表示。
扩展数据图4
扩展数据图4。按种群和变异类别划分的每个基因组变异位点的标准化数量。
对于每个类别,z(z)-得分的计算方法是减去每个基因组的平均位点数(在整个样本中计算),然后除以标准偏差。从左起:具有衍生等位基因的位点,具有衍生等位基因的同义位点,具有衍生等位基因的非同义位点,具有功能丧失等位基因的位点,具有HGMD疾病突变等位基因的位点,具有ClinVar致病性变体的位点,以及携带GWAS风险等位基因的位点。
扩展数据图5
扩展数据图5。使用混合程序推断的人口结构K(K)=5至12。
扩展数据图6
扩展数据图6。等位基因共享。
a、,基因型协方差(对角线以上)和共享(f)2成对个体之间的变体(对角线以下)。b中,平均值的量化(f)2群体之间的共享。每行表示(f)2左侧所示的种群个体与每个抽样种群个体之间共享的变体。c、,平均数量(f)2每个单倍体基因组的变异。日期:,推断的年龄(f)2变异,根据共享单倍型长度估计,黑点表示中值。
扩展数据图7
扩展数据图7。PSMC曲线不光滑。
a、,每个群体的PSMC中值曲线。b中,对1000个基因组样本中的所有个体单独估计的PSMC曲线。c、,比较低覆盖率数据(虚线)和高覆盖率无PCR数据(实线)估计值的非光滑PSMC曲线。显著的差异仅限于最近的时间间隔,通过深度测序确定的其他罕见变异表明种群规模较大。
扩展数据图8
扩展数据图8。在每个大陆群中,显示出非常强烈的成对近亲种群分化模式的基因。
在每个大陆组内,从大陆组内所有成对种群与所有可能的大陆外种群的比较中选择最大PBS统计值。请注意x个axis显示了最大比较范围内多态位点的数量。
扩展数据图9
扩展数据图9。插补的表现。
a、,使用第3阶段的子集作为参考面板,在6个人群中进行插补(n个=2445),第1阶段(n个=1065),以及来自两个相位的交叉样本中的相应数据(n个= 1,006).b中,第三阶段变量类插补的表现。
扩展数据图10
扩展数据图10。作为物理距离函数的连锁不平衡衰退。
在每个群体中随机选择10000个多态位点计算连锁不平衡,首先将每个群体缩小到相同的样本大小(61个个体)。绘制的线表示5 kb的移动平均值。

中的注释

类似文章

  • 人类基因组测序时代的基因组分析。
    Lappalainen T、Scott AJ、Brandt M、Hall IM。 Lappalainen T等人。 单元格。2019年3月21日;177(1):70-84. doi:10.1016/j.cell.2019.02.032。 单元格。2019 PMID:30901550 免费PMC文章。 审查。
  • 2504个人类基因组结构变异的综合图。
    Sudmant PH、Rausch T、Gardner EJ、Handsaker RE、Abyzov A、Huddleston J、Zhang Y、Ye K、Jun G、Fritz MH、Konkel MK、Malhotra A、Stütz AM、Shi X、Casale FP、Chen J、Hormozdiari F、Dayama G、Chen K、Malig M、Chaisson MJP、Walter K、Meiers S、Kashin S、Garrison E、Auton A、Lam HYK、Mu XJ、Alkan C、Antaki D、Bae T、Cerveira E、Chines P、Chong Z、,Clarke L、Dal E、Ding L、Emery S、Fan X、Gujral M、Kahveci F、Kidd JM、Kong Y、Lameijer EW、McCarthy S、Flicek P、Gibbs RA、Marth G、Mason CE、Menelaou A、Muzny DM、Nelson BJ、Noor A、Parrish NF、Pendleton M、Quitadamo A、Raeder B、Schadt EE、Romanovitch M、Schlattl A、Sebra R、Shabalin AA、Untergasser A、Walker JA、Wang M、Yu F、Zhang C、Zhan J、,Zheng-Bradley X、Zhou W、Zichner T、Sebat J、Batzer MA、McCarroll SA;1000基因组项目联盟;Mills RE、Gerstein MB、Bashir A、Stegle O、Devine SE、Lee C、Eichler EE、Korbel JO。 Sudmant PH等人。 自然。2015年10月1日;526(7571):75-81. doi:10.1038/nature15394。 自然。2015 PMID:26432246 免费PMC文章。
  • 1092个人类基因组遗传变异的综合图。
    1000基因组项目联盟;Abecasis GR、Auton A、Brooks LD、DePristo MA、Durbin RM、Handsaker RE、Kang HM、Marth GT、McVean GA。 1000基因组项目联盟等。 自然。2012年11月1日;491(7422):56-65. doi:10.1038/nature11632。 自然。2012 PMID:23128226 免费PMC文章。
  • 复杂表型的分子遗传学研究。
    玛丽安·亚杰(Marian AJ)。 玛丽安·亚杰(Marian AJ)。 Transl Res.2012年2月;159(2):64-79. doi:10.1016/j.trsl.2011.08.001。Epub 2011年8月31日。 Transl Res.2012年。 PMID:22243791 免费PMC文章。 审查。
  • 人群规模测序的人类基因组变异图。
    1000基因组项目联盟;Abecasis GR、Altshuler D、Auton A、Brooks LD、Durbin RM、Gibbs RA、Hurles ME、McVean GA。 1000基因组项目联盟等。 自然。2010年10月28日;467(7319):1061-73. doi:10.1038/nature09534。 自然。2010 PMID:20981092 免费PMC文章。

引用人

工具书类

    1. 1000基因组项目联盟。人群规模测序的人类基因组变异图。《自然》4671061–1073(2010)-项目管理咨询公司-公共医学
    1. 1000基因组项目联盟。1092个人类基因组遗传变异的综合图。《自然》491,56–65(2012)-项目管理咨询公司-公共医学
    1. Voight BF等人代谢组,一种用于代谢、心血管和人体测量特征遗传研究的定制基因分型阵列。公共科学图书馆-遗传学。2012;8:e1002793。doi:10.1371/journal.pgen.1002793。-DOI程序-项目管理咨询公司-公共医学
    1. Trynka G等。密集基因分型识别和定位乳糜泻中多种常见和罕见的变异关联信号。自然遗传学。2011;43:1193–1201. doi:10.1038/ng.998。-DOI程序-项目管理咨询公司-公共医学
    1. Howie B,Fuchsberger C,Stephens M,Marchini J,Abecasis GR.通过预阶段化在全基因组关联研究中快速准确的基因型插补。自然遗传学。2012;44:955–959. doi:10.1038/ng.2354。-DOI程序-项目管理咨询公司-公共医学

出版物类型

MeSH术语

赠款和资金