跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

政府意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府网站。

Https公司

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2005年10月27日;437(7063):1299-320.
doi:10.1038/nature04226。

人类基因组的单倍型图谱

人类基因组的单倍型图谱

国际HapMap联盟. 自然. .

摘要

遗传遗传变异在人类疾病中起着关键的作用,但迄今为止基本上还没有特征化。在这里,我们报告了一个人类基因组常见变异的公共数据库:在来自四个群体的269个DNA样本中,已经获得了超过一百万个单核苷酸多态性(SNPs)的准确和完整的基因型,包括10个500千碱基区域,其中基本上提取了所有关于常见DNA变异的信息。这些数据记录了重组热点的普遍性,一种连锁不平衡和低单倍型多样性的块状结构,导致SNP与许多相邻SNP之间存在大量相关性。我们展示了HapMap资源如何指导遗传关联研究的设计和分析,阐明结构变异和重组,以及识别在人类进化过程中可能受到自然选择的基因座。

PubMed免责声明

数字

图1
图1。一段时间内dbSNP中SNP的数量
非冗余SNP的累积数量(每一个都映射到基因组中的一个位置)以实线显示,以及通过基因分型(虚线)和双命中状态(虚线”)验证的SNP数量。年份分为季度(第一季度至第四季度)。
图2
图2。新南威尔士州之间距离的分布
显示了HapMapable基因组(在方法中定义)和所有常见SNPs(MAF≥0.05)的每个分析面板的分布。
图3
图3。ENCODE区域dbSNP的等位基因频率和完整性
a–c,dbSNP中SNP的比例,或dbSNP的代理,显示为每个分析面板的次要等位基因频率的函数(、YRI;b条,CEU;c,CHB+JPT)。单体是指在单个个体中观察到的杂合子,并从MAF<0.05的其他SNP中分离出来。因为所有ENCODE SNP都存放在dbSNP中,所以对于这个图,如果SNP位于dbSNP构建125中,而与HapMap ENCODE重新排序项目无关,那么我们将SNP定义为“在dbSNP'中”。所有剩余的SNP(不在dbSNP中)仅通过ENCODE重新排序发现;它们按相关性分类(第页2)到dbSNP中的那些。请注意,每个频率箱中的SNP数量在分析面板之间不同,因为并非所有SNP在所有分析面板中都是多态的。
图4
图4。ENCODE数据中SNP的次要等位基因频率分布及其对杂合性的贡献
该图显示了根据次要等位基因频率(蓝色)来自HapMap ENCODE区域的多态性SNP,最低次要等位酶频率bin(<0.05)分为单倍体(仅一个个体中的SNP杂合,以灰色显示)和多个杂合个体的SNP。对于该分析,MAF是在分析面板上取平均值。图中还显示了每个MAF bin对ENCODE区域总杂合度的贡献之和(橙色)。
图5
图5。常染色体SNP的等位基因频率分布
对于每个分析面板,我们绘制了频率大于零的所有第一阶段SNP的MAF分布(条形图)。实线显示ENCODE SNP的MAF分布,虚线显示标准中性种群模型预期的MAF分配,该模型具有恒定的种群规模和随机交配,无需确定偏差。
图6
图6。所有成对分析面板的ENCODE数据中以及CHB和JPT样本集之间的等位基因频率比较
对于每个多态SNP,我们确定了所有面板中的次要等位基因(d日)然后计算该等位基因在每个分析面板/样本集中的频率。每个箱子中的颜色代表显示每个给定等位基因频率组的SNP数量。紫色区域表明,在一个面板中很少有SNP是常见的,但在另一个面板上却很少见。红色区域表明,在每对分析面板/样本集中,有许多SNP具有相似的低频率。
图7
图7。单倍型和第页2无专性重组事件区域的值
ENr131.2q37中的第2染色体区域(234876004–234884481 bp;NCBI构建34)包含36个SNP,CEU样本中的专性重组事件为零。图的左侧显示了在该区域观察到的七种不同的单倍型(等位基因仅在SNP处显示),以及数据中各自的计数。在这些单倍型的下面是相同数据的二进制表示,单倍型在SNP位置有彩色圆圈,单倍体在该位置有较不常见的等位基因。由单个标签SNP捕获的所有SNP组(带有第页2≥0.8)使用成对标记算法,具有相同的颜色。与七种不同颜色相对应的七个标签SNP捕获了该区域的所有SNP。在右边,这些SNP被映射到与该地区数据的七个单倍型相关的系谱树上。
图8
图8。两个ENCODE区域连锁不平衡和重组的比较
对于每个地区(ENr131.2q37.1和ENm014.7q31.33),D类'显示了YRI、CEU和CHB+JPT分析面板的图:白色,D类′<1,LOD<2;蓝色,D类′=1,LOD<2;粉红色,D类′<1,LOD≥2;红色,D类′=1,检测限≥2。在这些图的下方,显示了必须发生不同专性重组事件的间隔(蓝色和绿色表示相邻间隔)。叠加间隔表示样本历史中存在多个重组事件的区域。下图显示了估计的重组率,热点显示为红色三角形。
图9
图9。ENCODE区域重组事件的分布
包含十个ENCODE区域(彩色线)和组合(黑线)所有重组的给定部分的序列比例。对于每一条线,SNP区间按估计重组率的降序排列,并在分析面板上进行组合,然后根据序列的累积比例绘制累积重组分数。如果重组率是恒定的,每一条线都会精确地沿着对角线,因此右边的线显示了重组在局部更集中的区域的比例。
图10
图10。重组率、单倍型长度和基因位置之间的关系
重组率(单位:cM Mb)−1(蓝色)。在组合样本(条形)和基因(黑色片段)中频率至少为5%的非冗余单倍型显示在19号染色体(19q13)的示例性基因密集区中。单倍型的颜色取决于它们所跨越的可检测重组事件的数量,红色表示许多事件,蓝色表示很少。
图11
图11
代理SNP的数量(第页2≥0.8)作为ENCODE数据中MAF的函数。
图12
图12
ENCODE数据中每个SNP的代理数是相关阈值的函数(第页2).
图13
图13
第一阶段HapMap中声明代理之间相关性的阈值与捕获的所有SNP的比例之间的关系。
图14
图14。标签SNP信息捕获
第页2≥0.8是相位ENCODE数据的平均标签SNP间距的函数,为Tagger优先排序的标签SNP(多标记和成对)和随机选取的标签SNPs绘制(从左到右)。对所有ENCODE区域的结果进行平均。
图15
图15。LD跨度长度
我们拟合了一个简单的模型,将连锁不平衡衰减到分布在整个基因组中的100万个碱基的窗口。通过绘制拟合结果,总结了CHB+JPT分析面板的模型拟合结果第页2SNP值以30 kb分隔。其他分析小组的总体变化模式非常相似(见补充信息)。
图16
图16。用于自然选择的长程单倍型(LRH92)检验统计量的分布
在YRI分析面板中乙型肝炎病毒基因以红点突出显示。在CEU分析小组中LCT公司基因区域同样突出显示。

中的注释

  • 基因组学:了解人类多样性。
    Goldstein DB,Cavalleri GL公司。 Goldstein DB等人。 自然。2005年10月27日;437(7063):1241-2. doi:10.1038/4371241a。 自然。2005 PMID:16251937 没有可用的摘要。

类似文章

  • 【单倍型在法医学中的分析与应用】。
    Ye Y、Luo HB、Hou YP。 叶毅等。 《法衣学杂志》。2009年4月;25(2):133-7. 《法医学杂志》。2009 PMID:19537256 审查。 中国人。
  • 超过310万SNP的第二代人类单倍型图谱。
    国际HapMap联合会;Frazer KA、Ballinger DG、Cox DR、Hinds DA、Stuve LL、Gibbs RA、Belmont JW、Boudreau A、Hardenbol P、Leal SM、Pasternak S、Wheeler DA、Willis TD、Yu F、Yang H、Zeng C、Gao Y、Hu H、Hu W、Li C、Lin W、刘S、Pan H、Tang X、Wang J、Wang W、Yu J、Zhang B、ZhangQ、Zhao H、Zhou J、Gabriel SB、Barry R、Blumenstiel B、Camargo A、Defelice M、,Faggart M、Goyette M、Gupta S、Moore J、Nguyen H、Onofrio RC、Parkin M、Roy J、Stahl E、Winchester E、Ziaugra L、Altshuler D、Shen Y、Yao Z、Huang W、Chu X、He Y、Jin L、Liu Y、Shen Y、Sun W、Wang H、Wang Y、Xue X、Xu L、Waye MM、Tsui SK、Xue H、Wong JT、Galver LM、Fan JB、Gunderson K、Murray SS、Oliphant AR、Chee MS、Montpetit A、,Chagnon F、Ferretti V、Leboeuf M、Olivier JF、Phillips MS、Roumy S、Sallée C、Verner A、Hudson TJ、Kwok PY、Cai D、Kobolt DC、Miller RD、Pawlikowska L、Taillon Miller P、Xiao M、Tsui LC、Mak W、Song YQ、Tam PK、Nakamura Y、Kawaguchi T、Kitamoto T、Morizono T、Nagashima A、Ohnishi Y、Sekine A、Tanaka T、Tsunoda T、Deloukas P、Bird CP、Delgadd o月,Dermitzakis ET、Gwilliam R、Hunt S、Morrison J、Powell D、Stranger BE、Whittaker P、Bentley DR、Daly MJ、de Bakker PI、Barrett J、C… 完整作者列表参见摘要 国际HapMap联盟等。 自然。2007年10月18日;449(7164):851-61. doi:10.1038/nature06258。 自然。2007. PMID:17943122 免费PMC文章。
  • 欧洲人在CYP2C和CYP2D细胞色素P450基因区域的重组率和连锁不平衡方面的相似性表明了选择的迹象,在群体分离物中使用tagSNP没有优势。
    Pimenoff VN、Laval G、Comas D、Palo JU、Gut I、Cann H、Excoffier L、Sajantila A。 Pimenoff VN等人。 药物基因基因组学。2012年12月;22(12):846-57. doi:10.1097/FPC.0b013e32835a3a6d。 药物基因基因组学。2012 PMID:23089684
  • 人类癌症相关基因的单倍型和连锁不平衡结构。
    Bonnen PE、Wang PJ、Kimmel M、Chakraborty R、Nelson DL。 Bonnen PE等人。 基因组研究,2002年12月;12(12):1846-53. doi:10.1101/gr.483802。 基因组研究,2002年。 PMID:12466288 免费PMC文章。
  • HapMap和心血管疾病基因定位。
    穆苏努鲁K,卡西里桑S。 Musunuru K等人。 循环心血管遗传学。2008年10月;1(1):66-71. doi:10.1161/CIRCGENETICS.108.813675。 循环心血管遗传学。2008 PMID:20031544 免费PMC文章。 审查。

引用人

工具书类

    1. Lechler R,Warrens A.健康与疾病中的HLA。2.学术出版社;加利福尼亚州圣地亚哥:2005年。
    1. Strittmatter WJ、Roses AD、载脂蛋白E和阿尔茨海默病。《神经科学年鉴》。1996;19:53–77.-公共医学
    1. Dahlbäck B.对因子V R506Q突变引起的活化蛋白C的耐药性是静脉血栓形成的常见危险因素。血栓止血。1997;78:483–488.-公共医学
    1. Altshuler D等。常见的PPARγPro12Ala多态性与2型糖尿病风险降低相关。自然遗传学。2000;26:76–80.-公共医学
    1. Deeb SS等。PPARγ2中的Pro12Ala替代与受体活性降低、体重指数降低和胰岛素敏感性改善相关。自然遗传学。1998;20:284–287.-公共医学

出版物类型