跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2015年12月1日16时259分。
doi:10.1186/s13059-015-0831-x。

HiC-Pro:用于Hi-C数据处理的优化且灵活的管道

附属公司

HiC-Pro:用于Hi-C数据处理的优化且灵活的管道

尼古拉斯仆人等。 基因组生物学. .

摘要

HiC-Pro是一种优化且灵活的管道,用于处理从原始读取到标准化接触图的Hi-C数据。HiC-Pro图谱读取、检测有效的结扎产物、执行质量控制并生成染色体内和染色体间接触图谱。它包括迭代校正方法的快速实现,并基于Hi-C接触图的节省内存的数据格式。此外,HiC-Pro可以使用分阶段基因型数据构建等位基因特异性接触图。我们将HiC-Pro应用于不同的Hi-C数据集,证明其能够在合理的时间内轻松处理大数据。源代码和文档位于http://github.com/nservant/HiC-Pro .

PubMed免责声明

数字

图1
图1
HiC-Pro和hiclib处理的比较。这两条管道在处理步骤中生成一致的结果。唯一对齐的读取对的分数是根据初始读取的总数计算的。根据对齐读取对的总数计算自圆分数和悬挂分数。染色体内和染色体间的接触被计算为过滤的有效相互作用的一部分。b条两条管线以不同分辨率生成的染色体内和染色体间图谱的Spearman相关系数的箱线图。c(c)hiclib生成的6号染色体接触图(顶部)和HiC-Pro(底部)以不同的分辨率。两条管道产生的染色质相互作用数据非常相似
图2
图2
等位基因特异性分析。GM12878细胞系的等位基因特异性分析。阶段数据来自Illumina Platinum Genomes项目。总共使用GM12878数据中的2239492个高质量SNP来区分这两个等位基因。大约6%的阅读对被分配给每个父母等位基因,并用于构建等位基因特异性接触图。b条在500kb分辨率下,GM12878细胞系的非活性和活性X染色体的染色体内接触图谱。X染色体的非活性拷贝被分割成两个在活性X染色体上看不到的巨域。两个巨域之间的边界位于DXZ4微型卫星附近
图3
图3
HiC-Pro工作流。读数首先与参考基因组对齐。只保留唯一对齐的读取并将其分配给限制片段。然后对交互进行分类,并丢弃无效对。如果提供了分阶段基因分型数据和N-屏蔽基因组,HiC-Pro将校准读数并将其分配给父母基因组。对于基于限制性内切酶消化的Hi-C协议,读取对将被分配给限制性片段,无效的连接产物将被过滤掉。对于每个读取块,可以并行执行这些第一步。然后将来自多个区块的数据合并并装箱,以生成单个基因组范围的交互图。对于等位基因特异性分析,仅使用具有至少一个等位基因特异性读数的配对来构建接触图。归一化最终用于消除全基因组接触图上的Hi-C系统偏差。MAPQ公司映射质量,体育课成对端
图4
图4
读取对对齐和过滤。读取对首先使用端到端算法与参考基因组独立对齐。然后,在结扎部位修剪第一步未对齐的跨越结扎连接处的读数,并在基因组上重新对齐其5′末端。这两个步骤之后的所有对齐读取都用于进一步分析。b条根据Hi-C方案,将消化的片段连接在一起以产生Hi-C产物。有效的Hi-C产品应包含两个不同的限制性片段。在同一限制片段上对齐的读取对被分类为悬空端或自圈产品,并且不用于生成接触图。体育课成对端,LS连接位点
图5
图5
HiC-Pro质量控制。HiC Pro报告的质量控制(IMR90,Dixon等人数据)。读取对齐和配对的质量控制。低质量对齐、单次和多次点击通常在此步骤中删除。b条读对过滤。读对被分配给一个限制片段。无效的对,如dangling-end和self-circle,是库质量的良好指示器,会被跟踪,但在随后的进一步分析中会被丢弃。还报告了重复读取的分数,以及短距离与长距离交互

类似文章

引用人

工具书类

    1. de Wit E,de Laat W。3C技术的十年:对核组织的洞察。基因开发2012;26:11–24. doi:10.1101/gad.179804.111。-内政部-项目管理咨询公司-公共医学
    1. Barutcu AR、Fritz AJ、Sayyed KZ、van Wijnen AJ、Lian JB、Stein JL等。《基因组:研究高阶染色质组织的染色体构象捕获方法简编》。细胞生理学杂志。2015;1097–4652. doi:10.1002/jcp.25062。-项目管理咨询公司-公共医学
    1. Lieberman-Aiden E、van Berkum NL、Williams L、Imakaev M、Ragoczy T、Telling A等。长程相互作用的综合绘图揭示了人类基因组的折叠原理。科学。2009;326(5950):289–293. doi:10.1212/science.1111369。-内政部-项目管理咨询公司-公共医学
    1. Ma W,Ay F,Lee C,Gulsoy G,Deng X,Cook S等。精细染色质相互作用图揭示了人类细胞中lincRNA基因的顺调控景观。自然方法。2015;12:71–78. doi:10.1038/nmeth.3205。-内政部-项目管理咨询公司-公共医学
    1. Nora EP、Lajoie BR、Schulz EG、Giorgetti L、Okamoto I、Servant N等。x灭活中心调控景观的空间划分。自然。2012;485(7398):381–385. doi:10.1038/nature11049。-内政部-项目管理咨询公司-公共医学

出版物类型