星码

星码:基于所有对搜索的序列聚类。动机:测序技术的不断增长为计算生物学提供了新的应用和挑战。在许多这样的应用程序中,排序错误需要纠正。当测序从一个未知的参照物(如随机的DNA条形码)读取时,这一点尤其重要。在这种情况下,可以通过对所有条形码进行成对比较来进行纠错,这是一个计算复杂的问题。结果:在这里,我们解决了这个挑战,并描述了一个精确的算法来确定在给定的Levenshtein距离内的序列对。为了纠错或减少冗余,匹配对然后被合并成相似序列的簇。星码的效率归功于poucet搜索,这是一种在trie节点上执行的Needleman-Wunsch算法的新实现。在随机条码匹配方面,星码在速度和精度上都优于序列聚类算法。可用性和实现:C源代码可从http://github.com/gui11aume/starcode获得。

此软件的关键字

这里的任何内容都将在支持canvas元素的浏览器上被替换