RAP搜索2 swMATH ID: 23045 软件作者: 赵毅、唐浩、叶毅 描述: RAPSearch2:用于下一代测序数据的快速且内存高效的蛋白质相似性搜索工具。摘要:随着下一代测序(NGS)技术的广泛应用,可扩展到大型查询数据集和大型数据库的快速蛋白质相似性搜索工具非常理想。在之前的一项工作中,我们开发了RAPSearch,这是一种相对于BLAST实现20-90倍加速的算法,同时对来自NGS数据的短蛋白片段仍实现了类似的灵敏度水平。然而,RAPSearch由于使用后缀数组数据结构,因此需要大量内存来标识对齐种子。这里我们介绍了RAPSearch2,它是RAPSearch算法的一种新的节省内存的实现,它使用无冲突哈希表来索引相似性搜索数据库。优化数据结构的使用进一步加快了相似性搜索的速度,提高了2-3倍。我们还在RAPSearch2中实现了多线程,多线程模式实现了显著的加速(例如,四线程模式的加速倍数为3.5X)。RAPSearch2在单线程模式下运行时需要高达2G的内存,在4线程模式下则需要高达3.5G的内存。可用性和实现:源代码用C++实现,可在RAPSearch2网站免费下载:http://omics.informations.indiana.edu/mg/RAPSearch2/。 主页: https://www.ncbi.nlm.nih.gov/pubmed/2039206 相关软件: UniProt公司;BLAT(爆炸);生物蟒蛇;生物++;UniNovo公司;KNIME公司;编程辅助工具;RazerS(剃须刀);增强C++库;生物蟒蛇;柠檬;巴基斯坦;SeqLib(序列库);libsequence(库序列);石匠;马耳他;出租车司机-tk;柔性杆;志贵;基因组工具 引用于: 4文件 全部的 前5名8位作者引用 1 亚历克斯·德库西 1 Farzaneh,Elahifasaee 1 汉内斯·豪斯代尔 1 乔纳森·基思(Jonathan M.Keith)。 1 李,范 1 李素军 1 唐海旭 1 杨明(Yang,Ming) 3篇连载文章中引用 1 医学中的计算和数学方法 1 计算生物学 1 分子生物学方法 在4个字段中引用 4 生物学和其他自然科学(92-XX) 1 总体主题;集合(00-XX) 1 统计学(62-XX) 1 运筹学、数学规划(90-XX) 按年份列出的引文