pCAP

pCAP:一个全基因组组装程序。我们描述了一个全基因组组装程序名为PCAP,用于处理数以千万计的读取。PCAP程序有几个特点来解决装配中的效率和精度问题。多个处理器用于在组装中执行耗时的计算。使用更敏感的方法来避免由测序误差引起的缺失重叠。重复读取区域的基础上,许多重叠与其他阅读,而不是许多较短的单词匹配与其他阅读。识别并移除读取的污染末端区域。对于重叠群的一致序列的生成是基于重叠群中的读取对齐,其中使用基本质量值和覆盖信息来确定每个一致性基。在3000万个读取的小鼠全基因组数据集和170万个读取的人类染色体20数据集上测试pCAP程序。该计划是免费提供的学术用途。