盖特

基因组分析工具包:一个用于分析下一代DNA测序数据的MapReduce框架。下一代DNA测序(NGS)项目,如1000个基因组计划,已经在彻底改变我们对个体间遗传变异的理解。然而,NGS生成的海量数据集1000个基因组试验包括近5个terabase,这使得编写功能丰富、高效和健壮的分析工具对于计算复杂的个人来说都很困难。事实上,由于访问和操作这些机器产生的数据的复杂性,许多专业人员在回答科学问题的范围和容易程度上受到限制。在这里,我们将讨论我们的基因组分析工具包(GATK),这是一个结构化的编程框架,旨在利用MapReduce的功能编程原理,为下一代DNA测序器轻松开发高效和健壮的分析工具。GATK提供了一组小而丰富的数据访问模式,这些模式包含了大多数分析工具的需求。将特定的分析计算从公共数据管理基础设施中分离出来,使我们能够优化GATK框架的正确性、稳定性、CPU和内存效率,并实现分布式和共享内存的并行化。我们通过描述诸如覆盖计算器和单核苷酸多态性(SNP)调用等健壮的、可伸缩的工具的实现和应用,来突出GATK的功能。我们的结论是,GATK编程框架使开发人员和分析人员能够快速、方便地编写高效、健壮的NGS工具,其中许多工具已经被纳入大规模测序项目中,比如1000个基因组项目和癌症基因组图谱。


zbMATH中的参考文献(参考文献16条)

显示第1到16个结果,共16个。
按年份排序(引用)

  1. Akalin,Altuna:计算基因组学与R.在Verdan Franke,Bora Uyar和Jonathan Ronen的协助下(2021年)
  2. 卡姆,杰克;特霍斯特,乔纳森;德宾,理查德;Song,Yun S.:利用等位基因计数数据有效推断许多人群的人口统计学历史(2020年)
  3. 周天健;森古普塔,苏哈吉特;米勒,彼得;季媛:TreeClone:基于突变对的肿瘤亚克隆系统发育的新一代测序数据重建(2019年)
  4. 罗宾逊,彼得·N。;迈克尔·罗萨皮罗;Jäger,Marten:计算外显子组和基因组分析(2018)
  5. Wolff,Alexander:通过开发新一代测序数据的方法分析表达谱和基因变异(2018)
  6. 巴图伦,吉勒莫;奥利弗,何塞。;Hackenberg,Michael:NGS亚硫酸氢盐协议甲基化分析的错误修正(2017)
  7. 波尼佐尼,保拉;德拉维多娃,詹卢卡;皮罗拉,尤里;普雷维塔利,马可;Rizzi,Raffaella:字符串图构造的外部内存算法(2017)
  8. 傅蓉;王、裴;马伟平;田口、阿育木;黄志红;张青;加兹达尔,阿迪;哈纳什,萨米尔M。;周庆华;钟华;冯子鼎:基于下一代RNA序列数据检测差异表达SNV的统计方法(2017)
  9. 刘永超;Schmidt,Bertil:CUSHAW suite:NGS读取对齐的并行高效算法(2017)
  10. 最大值Shpak;倪,杨;陆洁;Müller,Peter:高覆盖与低覆盖测序下估计成对遗传距离的方差:连锁不平衡的贡献(2017)
  11. 纪、元;森古普塔,苏哈吉特;李,朱熙;米勒,彼得;Gulukota,Kamalakar:用贝叶斯特征分配模型估计潜在细胞亚群(2015)
  12. 李,朱熙;米勒,彼得;古鲁科塔,卡马拉卡尔;季媛:肿瘤异质性的贝叶斯特征分配模型(2015)
  13. 麦卡伦,肯尼斯J。;Ionita Laza,Iuliana:用于检测遗传研究中疾病风险变体簇的经验贝叶斯扫描统计(2015)
  14. Daugelaite,陪审团成员;奥德里斯科,艾斯林;Sleator,Roy D.:生物信息学中的多序列比对和云计算概述(2013)
  15. 赵志根;王伟;魏志:下一代测序数据分析中检测变异的经验贝叶斯检验方法(2013)
  16. 乌姆卡尔Muralidharan;纳索利斯,乔治;贝尔,约翰;纪汉利;Zhang,Nancy R.:使用经验贝叶斯方法检测混合样本测序数据中的突变(2012)