跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2014年3月;32(3):261-266.
doi:10.1038/nbt.2833。 Epub 2014年2月23日。

使用长阅读和统计方法进行全基因组单倍型分析

附属公司

使用长阅读和统计方法进行全基因组单倍型分析

沃洛德米尔·库列舍夫等。 Nat生物技术. 2014年3月.

摘要

测序技术的快速发展极大地促进了我们对人类遗传学的理解。然而,尽管有了这样的增长,主流技术还不能完全解决人类基因组的二倍体性质。在这里,我们描述了统计辅助的长阅读单倍型(SLRH),这是一种快速、准确的方法,它使用统计算法来利用短阅读测序分析的长基因组片段中包含的部分阶段信息。对于人类样本,通过50×覆盖全基因组测序确定的基因型,只需要30 Gbp的额外测序数据。使用SLRH,我们将三个人类基因组中99%的单核苷酸变体分为长单倍型区块0.2-1 Mbp。我们应用我们的方法来确定人类基因组中的等位基因特异甲基化模式,并确定数百个以前未知的差异甲基化区域。SLRH应促进人类基因组的群体规模单倍型。

PubMed免责声明

数字

图1
图1
统计辅助的长阅读单倍型(a)库准备协议概述。受试者的DNA(1)被剪切成约10 kbp(2)的片段,然后稀释并放入384个孔中,每个孔约3000个片段(3)。在每个井内,片段通过长距离PCR扩增,切割成短片段并条形码(4),然后最终汇集在一起并测序(5)。(b)生物信息学管道概述。使用条形码适配器(1)将序列短读取对齐并映射回其原始井。在每个孔内,阅读被分组为片段(2),这些片段在重叠的杂合SNV处组装成单倍型块(3)。根据相位参考面板(4),这些区块在统计上被分配了一个相位,该相位参考面板产生了很长的单倍型连续体(5)。
图2
图2
单体型分析在几个精度阈值下产生结果。在置信度低于某个阈值(x轴)的位置切割长的统计构建的单倍型连续体,形成较短但更准确的单倍体块。我们在一系列阈值下评估较小块的完整性(顶部面板)和切换准确性(底部面板)。块仅在SNV上进行评估。
图3
图3
30 Gbp测序的单体型性能。我们在样本NA12878的两个30 Gbp复制库上独立运行了生物信息学管道。由此得到的单倍型块几乎与两个阶段库中得到的块一样准确,只有100 kbp短。此外,两个重复的结果高度一致。
图4
图4
H19基因启动子差异甲基化区域的基因组浏览器视图。H19基因座周围显示了两个父母等位基因的DNA甲基化水平(绿色轨道,D)和绝对DNA甲基化程度的差异(父亲甲基化的蓝色轨道(P)和母亲甲基化的红色轨道(M))。阴影区域显示出两个亲本等位基因之间DNA甲基化水平的显著差异(P<0.05;Fisher精确检验),并被确定为DMR。

类似文章

引用人

工具书类

    1. Tewhey R、Bansal V、Torkamani A、Topol EJ、Schork NJ。相位信息对人类基因组学的重要性。Nat Rev基因。2011;12:215–223.-项目管理咨询公司-公共医学
    1. Browning SR,Browning BL。单倍型定相:现有方法和新发展。Nat Rev基因。2011;12:703–714.-项目管理咨询公司-公共医学
    1. Roach JC等。人类家族遗传阶段的染色体单倍型。Am.J.Hum.遗传学。2011;89:382–397.-项目管理咨询公司-公共医学
    1. Fan HC,Wang J,Potanina A,Quake SR。单细胞的全基因组分子单倍型。国家生物技术。2010;29分51秒至57秒。-项目管理咨询公司-公共医学
    1. 杨浩、陈旭、王伟。通过染色体分类进行全阶段基因组测序。美国国家科学院院刊。2011;108:12–17.-项目管理咨询公司-公共医学

出版物类型

关联数据