彩虹

Rainbow:一个集成的工具,用于高效地聚类和组装RAD seq reads。限制性位点相关DNA测序(RAD-seq)方法的创新充分利用了下一代测序技术。通过将成对的尾端短读物聚类成具有唯一标记的组,将RAD-seq装配问题划分为子问题。快速准确地聚类和组装数百万个具有测序错误、不同杂合度和重复序列的RAD-seq阅读是一个具有挑战性的问题。结果:Rainbow的开发提供了一种超快速和内存高效的解决方案来聚类和组装RAD-seq产生的短读。首先,彩虹簇使用间隔种子方法进行读取。然后,Rainbow实施了一种杂合子呼叫式策略,以自上而下的方式将潜在群体划分为单倍型。并且沿着一个引导树,它迭代地以自下而上的方式合并兄弟树叶,如果它们足够相似的话。这里,通过比较RAD段的第二次读取来定义相似性。这种方法试图在识别重复序列的同时折叠杂合子。最后,Rainbow使用一种贪婪算法将合并后的读局部组装成contigs。Rainbow不仅输出最优装配结果,而且输出次优装配结果。基于仿真和一个真实的guppy RAD-seq数据,我们证明Rainbow在处理RAD-seq数据方面比其他工具更有效。可用性:Rainbow的源代码可以从http://sourceforge.net/projects/bio-Rainbow/files免费获得/