跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2007年10月18日;449(7164):851-61.
doi:10.1038/nature06258。

超过310万个SNPs的第二代人类单倍型图谱

国际HapMap联盟 1 凯莉·弗雷泽丹尼斯·巴林格大卫·R·考克斯大卫·A·欣兹劳拉·L·斯图夫理查德·吉布斯约翰·W·贝尔蒙特安德鲁·布德劳保罗·哈登波尔苏珊·米·利尔希兰·帕斯捷尔纳克大卫·A·惠勒托马斯·D·威利斯傅立余(Fuli Yu)究所杨焕明曾长庆杨高胡浩然胡伟涛李朝华魏琳刘思奇郝磐唐晓丽王健(Jian Wang)王伟(音译)于军(Jun Yu)张波张庆润赵宏斌赵慧(音)周军(音)斯泰西·B·加布里埃尔雷切尔·巴里布伦丹·布鲁门斯蒂尔艾米·卡玛戈马修·德弗里斯莫拉·法加特玛丽·戈耶特苏普里亚·古普塔杰米·摩尔Huy Nguyen(胡恩·阮)罗伯特·C·奥诺弗里奥梅丽莎·帕金杰西卡·罗伊埃里希·斯塔尔埃伦·温切斯特刘达·齐奥格拉大卫·阿特舒勒严慎姚志坚魏黄荀楚何云岗李进刘扬帆沈雅云孙伟伟王海峰王毅(Yi Wang)王颖(音)熊晓燕梁旭玛丽·米·韦伊斯蒂芬·K·W·徐洪雪王子菲Luana M Galver公司建平风机凯文·冈德森萨拉·S·穆雷阿诺德·奥利芬特马克·S·切亚历山大·蒙佩蒂范妮·查格农文森特·费雷蒂马丁·勒博夫Jean-François Olivier女士迈克尔·S·菲利普斯圣埃芬妮·鲁米Clémentine Sallée安德烈·维纳托马斯·哈德森郭培炎蔡冬梅丹尼尔·科波尔特雷蒙德·米勒卢德米拉·鲍利科夫斯卡帕特里夏·泰隆-米勒明晓徐立之威廉·马克游强歌保罗·K·H·谭中村由介川口高久北本拓哉森野孝志(Takashi Morizono)长岛Atsushi Nagashima大西洋三秋弘Sekine田中俊弘津田达彦帕诺斯·德卢卡斯克里斯汀·伯德马尔科斯·德尔加多Emmanouil T Dermitzakis公司瑞安·格威廉莎拉·亨特乔纳森·莫里森唐·鲍威尔Barbara E陌生人帕梅拉·惠塔克大卫·本特利马克·J·戴利保罗·德巴克杰夫·巴雷特Yves R Chretien公司朱利安·马勒史蒂夫·麦卡罗尼克·帕特森Itsik Pe洱阿尔克斯价格肖恩·珀塞尔丹尼尔·理查德帕迪斯·萨贝蒂里查·萨塞纳史蒂芬·F·沙夫纳Pak C Sham公司帕特里克·瓦里利大卫·阿特舒勒林肯·D·斯坦拉利塔·克里希南阿尔伯特·弗农·史密斯马塞拉·K·特洛·鲁伊斯古德蒙杜尔·托利森阿拉文达·查克拉瓦蒂彼得·E·陈大卫·J·卡特勒卡尔·S·卡舒克新林(Shin Lin)Gonçalo R Abecasis公司关伟华李云(Yun Li)希瑟·M·蒙罗赵辉Steve Qin达里尔·J·托马斯吉利安·麦克韦亚当·奥顿莱昂纳多·波托洛尼尔·卡丹苏珊娜·伊赫拉曼迪科林·弗里曼乔纳森·马奇尼西蒙·麦尔斯克里斯·斯宾塞马修·斯蒂芬彼得·唐纳利Lon R Cardon公司杰拉尔丁·克拉克大卫·M·埃文斯安德鲁·莫里斯布鲁斯·S·威尔津田达彦詹姆斯·穆利金斯蒂芬·T·雪莉迈克尔·费奥罗安德鲁·斯科尔张厚灿曾长庆赵慧(音)松田一郎福岛吉米通Darryl R Macer公司苏田英子查尔斯·罗蒂米克莱门特·阿德巴莫沃艾克·阿贾伊Toyin Aniagwu公司帕特里夏·A·马歇尔Chibuzor Nkwodimmah公司Charmaine D M皇家马克·F·勒佩特狄克逊小姐安迪·佩弗任宗秋阿拉斯泰尔·肯特加藤(Kazuto Kato)新川诏夫艾萨克·F·阿德沃尔Bartha M Knoppers公司莫里斯·福斯特埃伦·赖特·克莱顿杰西卡·沃特金理查德·吉布斯约翰·贝尔蒙特唐娜·穆兹尼林恩·拿撒勒艾丽卡·索德格伦乔治·温斯托克大卫·A·惠勒伊姆塔兹·雅库布斯泰西·B·加布里埃尔罗伯特·C·奥诺弗里奥丹尼尔·里希特刘达·齐奥格拉布鲁斯·W·伯伦马克·J·戴利大卫·阿特舒勒理查德·威尔逊卢辛达·L·富尔顿简罗杰斯柏恩翰奈杰尔·卡特克里斯托弗·M·克莱格里菲思马修·琼斯克里斯汀·麦克雷罗伯特·W·普拉姆马克·T·罗斯莎拉·西姆斯大卫·L·威利朱晨华汉乐康马丁·戈布特约翰·瓦伦堡保罗·拉切维奇盖·贝勒马尔Koji Saeki公司王红光稻长安傅洪波李青(音)王震(音)王仁武亚瑟·L·霍尔顿丽莎·D·布鲁克斯让·E·麦克尤恩马克·S·盖尔薇薇安·奥塔·王简·L·彼得森迈克尔·施杰克·斯皮格尔劳伦斯·M·宋Lynn F Zacharia公司弗朗西斯·柯林斯凯伦·肯尼迪露丝·杰米森约翰·斯图尔特
附属公司

超过310万SNP的第二代人类单倍型图谱

国际HapMap联盟等。 自然. .

摘要

我们描述了第二阶段HapMap,它描述了来自四个不同地理群体的270名个体中310多万人类单核苷酸多态性(SNP)基因型的特征,包括25-35%的受调查人群常见SNP变异。据估计,该图捕获了非类型的常见变异,根据人口的不同,平均最大r2在0.9到0.96之间。我们证明,当前一代商业全基因组基因分型产品捕获了常见的第二阶段SNP,非洲人群的平均最大r2高达0.8,非非洲人群的最大r2达0.95,并且可以通过插补获得关联研究的潜在收益。这些数据还揭示了连锁不平衡结构的新方面。我们表明,一个种群中10-30%的成对个体至少共享一个由最近的祖先产生的扩展遗传身份区域,所有常见变体中高达1%是不可标记的,主要是因为它们位于重组热点内。我们表明,重组率在基因周围和不同功能基因之间有系统地变化。最后,我们证明,与同义SNPs相比,非同义SNPs的分化增加,这是由于种群之间自然选择的强度或功效的系统性差异造成的。

PubMed免责声明

数字

图1
图1。第二阶段HapMap中的SNP密度
,整个基因组的SNP密度。颜色表示一致数据集中每kb多态SNPs的数量。部件中的间隙显示为白色。b,17号染色体上100-kb区域SNP密度的精细结构示例,显示了Perlegen扩增子(黑色条)、一致性数据集中多态性第一阶段SNP(红色三角形)和一致性数据集多态性第二阶段SNPs(蓝色三角形)。请注意,第一阶段SNP的间距相对均匀。c(c),共有II期HapMap数据(蓝线和左轴)中编码区周围多态性SNP的分布。图中还显示了基因周围(红线和右轴)dbSNP释放125中SNP的密度。从编码起始点(左虚线)5′和编码结束点(右虚线)3′处分别计算值,并在编码单元的中点位置(中心虚线)连接。
图2
图2。根据第二阶段HapMap估计单倍体结构和重组率
,β-珠蛋白周围100kb区域YRI的单倍型(乙型肝炎病毒)基因。阶段I中键入的SNP显示为深蓝色。第二阶段HapMap中的其他SNP以浅蓝色显示。只有衍生等位基因可以通过简约(与外群序列比较)明确识别的SNP才会显示出来(该区域89%的SNP);衍生的等位基因以颜色显示。b根据第一阶段(深蓝色)和第二阶段HapMap(浅蓝色)数据估计同一区域的重组率(线)和热点位置(水平蓝色条)。图中还显示了该区域内基因的位置(灰色条)和实验验证的重组热点的位置,位于乙型肝炎病毒基因(黑条)。
图3
图3。HapMap个体间最近共同祖先的范围
,三对具有不同程度的同一性-亲缘关系(IBD)共享的个体说明了极近和极远亲缘关系之间的连续性及其与分段共享的关系。这三对个体是:高度共享(YRI的NA19130和NA19192;以前被认定为二级亲属3),中度共享(CEU的NA06994和NA12892)和低共享(CEU的NA12006和NA12155)。根据补充文本5中描述的HMM方法,沿着每条染色体绘制至少共享一条染色体IBD的概率。红色部分表示被称为片段的区域:通常,片段中基因组的比例与每对估计的全球相关性相似。b,每个分析小组中每个个体的每个染色体上的纯合度。不包括小于106 kb的片段和男性的X染色体。星号,NA12874,长度=107 Mb。YRI,绿色;CEU,橙色;CHB,蓝色;JPT,洋红。
图4
图4。不可标记SNP的属性
a–e,围绕不可标记SNP的基因组区域的特性:,共识数据集中多态SNP的密度;b多态性SNP的平均次要等位基因频率;c(c),最大值第页2第二阶段数据中SNPs与任何其他SNPs的比值;估计重组热点的密度(根据热点中心定义);e(电子),估计的平均重组率。YRI,绿色;CEU,橙色;CHB+JPT,紫色。
图5
图5。基因周围的重组率
、重组率、重组hotspot-associated基序密度(所有基序与公认的CCTCCCTNNCCAC差异达1 bp)和基因周围的G+C含量。蓝线表示平均值。对于重组率,灰色线表示分布的四分位数。分别从转录起始点(第一条虚线)5′和转录结束点(第三条虚线。请注意,转录单元内的重组率急剧下降,转录起始点周围的局部增加,以及远离基因3′端的广泛减少。这些模式仅部分反映了G+C含量和热点相关基序的分布,表明其他因素会影响基因周围的重组率。b,不同分子功能基因内的重组率。图表显示了与基因组平均值相比,每个类别的增加或减少。P(P)通过类别排列估计值;括号中显示了基因的数量。
图6
图6。非同义和同义SNPs的性质
,每个分析面板中所有SNP(黑色)、同义SNP(绿色)和非同义SNPs(红色)的衍生等位基因频率(DAF)谱。请注意,编码序列SNP的罕见变体过多,但高频衍生变体没有过多。b,非同义SNP在基因SNP中的富集显示出高度分化。对于十类衍生等位基因频率中的每一类(分析面板的平均值),该类中非同义(红色)和同义(绿色)变体的分数显示F类装货单>图中显示了0.5。注意到在中等至高衍生等位基因频率的SNPs中非同义SNPs的强烈富集(星号,P(P)< 0.05; 双星号,P(P)< 0.01).c(c),在显示长程单倍型结构的非同义SNP中缺乏富集。计算每个分析面板(YRI,绿色;CEU,橙色;CHB+JPT,紫色)中非同义和同义SNP的综合扩展单倍型纯合度(iEHH)统计。对于十个衍生的等位基因频率类别中的每一个,显示了非同义SNP在显示5%最极端统计数据(在等位基因频度类别内)的比例(点)。还显示了每个频率类别(虚线)编码序列中非同义SNP在SNP中的比例。使用列联表测试测试同义和非同义SNP之间的差异。

类似文章

引用人

工具书类

    1. 国际HapMap联盟将伦理和科学纳入国际HapMap项目。《自然·遗传学评论》。2004;5:467–475。-项目管理咨询公司-公共医学
    1. 国际HapMap联盟国际HapMap项目。自然。2003;426:789–796.-公共医学
    1. 国际单体型图联盟人类基因组的单倍型图。自然。2005;437:1299–1320.-项目管理咨询公司-公共医学
    1. 鲍科克AM。基因组学:联想的罪恶感。自然。2007;447:645–646.-公共医学
    1. Altshuler D,Daly M.毫无疑问地感到内疚。自然遗传学。2007;39:813–815.-公共医学

出版物类型