×

关贸总公司

swMATH ID: 12019
软件作者: A.McKenna、M.Hanna、E.Banks等人。
描述: 基因组分析工具包:用于分析下一代DNA测序数据的MapReduce框架。下一代DNA测序(NGS)项目,如1000基因组项目,已经在彻底改变我们对个体间遗传变异的理解。然而,NGS-1000 Genome试点产生的大量数据集包括近五个TB,这使得即使是计算复杂的个人也很难使用功能丰富、高效且健壮的写作分析工具。事实上,由于访问和操作这些机器产生的数据的复杂性,许多专业人员在回答科学问题的范围和容易程度上都受到了限制。在这里,我们讨论了我们的基因组分析工具包(GATK),这是一个结构化编程框架,旨在利用MapReduce的函数编程原理,为下一代DNA测序器简化高效且健壮的分析工具的开发。GATK提供了一组小而丰富的数据访问模式,涵盖了大多数分析工具的需求。将特定分析计算与通用数据管理基础设施分离,使我们能够优化GATK框架的正确性、稳定性、CPU和内存效率,并实现分布式和共享内存并行化。我们通过描述覆盖计算器和单核苷酸多态性(SNP)调用等健壮、规模容限工具的实现和应用来突出GATK的功能。我们的结论是,GATK编程框架使开发人员和分析人员能够快速、轻松地编写高效、健壮的NGS工具,其中许多工具已被纳入大规模测序项目,如1000基因组项目和癌症基因组图谱。
主页: http://genome.cshlp.org/content/20/9/1297
相关软件: Samtools公司;Trimmomatic公司;;BWA公司;STAR公司;蝴蝶结2;快速质量控制;香皂;VarScan公司;PyClone(密码克隆);SciClone(科学克隆);MAFFT公司;俾斯麦;鲑鱼;HISAT公司;顶帽;KEGG公司;边缘R;深渊;快速x
引用于: 16文件

按年份列出的引文