LocARNAscan公司 swMATH ID: 23118 软件作者: Will S、Siebauer MF、Heyne S等人 描述: LocARNAscan:将热力学稳定性纳入序列和基于结构的RNA同源性搜索。背景:寻找远距离同源基因已成为基因组注释中的一个重要问题。一个特殊的困难是,不同的同源序列失去了可识别的序列相似性。同样的问题也出现在大类RNA的新成员的识别中,如snoRNAs或microRNAs,它们由与共同血统无关的家族组成。目前结构化RNA的同源性搜索工具要么完全基于序列相似性(如blast或hmmer),要么结合序列和二级结构。后一类工具中最突出的例子是Infinal。替代方法是基于描述符的方法。然而,在迄今为止发布的大多数实际应用中,协方差模型或手动指定的搜索模式中包含的信息主要由序列信息控制。这里我们提出两个相关的问题:(1)二级结构本身是否能为同源搜索和检测RNA类新成员提供信息?(2) 目标序列折叠成正确的二级结构的热力学倾向在多大程度上有助于这项任务?结果:序列结构比对可以作为一种替代搜索策略。在这种情况下,查询由一个基本配对概率矩阵组成,该矩阵可以从单个序列或表示一组已知代表的多重比对中导出。可以选择将序列信息添加到查询中。对目标序列进行预处理,以获得局部碱基配对概率。作为搜索引擎,我们设计了一种用于序列结构对齐的LocARNA算法的半全局扫描变体。LocARNA扫描工具针对速度和低内存消耗进行了优化。在人工数据的基准测试实验中,我们观察到热力学稳定性的加入是有帮助的,尽管只是在查询中序列信息极低的情况下。此外,我们观察到,灵敏度特别受到目标序列的预测局部结构的有限精度的限制。结论:尽管我们证明纯基于结构的同源性搜索原则上是可行的,但在大多数应用场景中,它不太可能优于Infernal等工具,因为在大多数应用场景中,通常可以获得大量的序列信息。然而,LocARNAscan方法将从高通量方法中获益,以确定RNA二级结构。在转录本范围的应用中,这些方法将在目标端提供准确的结构注释。可用性:免费软件LocARNAscan 1.0的源代码和补充数据可在http://www.bioinf.uni-leipzig.de/Software/LocARNAscan。 主页: http://www.bioinf.uni-leipzig.de/Software/LocARNAscan/ 相关软件: 布拉特;合并对齐;模因;DIALIGN公司;脚印机;打开DMAP;NoFold公司;卡纳;记录仪;RNA集群;IgRepertoire构造函数;GraphClust(图形俱乐部);RNA表面;Rnall公司;梅维;RNA链;格拉维斯托;墨卡托;INDDGO公司;树向导 引用于: 2文件 3位作者引用 1 乔纳森·基思(Jonathan M.Keith)。 1 南希·雷茨拉夫 1 彼得·斯塔德勒(Peter F.Stadler)。 2篇连载文章中引用 1 计算机科学中的数学 1 分子生物学方法 在3个字段中引用 1 总体主题;集合(00-XX) 1 计算机科学(68至XX) 1 生物学和其他自然科学(92-XX) 按年份列出的引文