摘要

动机:在生物序列中发现基序是一个重要的问题。结果:本文提出了一种新的生物序列刚性模式(基序)发现算法。我们的方法本质上是组合的,能够产生出现在至少一个(用户定义的)最少数量的序列中的所有模式,但它通过避免枚举整个模式空间而非常有效。此外,报告的模式是最大的:任何报告的模式都不能变得更具体,并且仍然会出现在输入序列中的相同位置。提出的方法的有效性在一些测试用例上得到了展示,这些测试用例旨在:(i)通过发现以前报告的模式来验证方法;(ii)证明能够自动识别特定于所考虑序列的高度选择性模式。最后,实验分析表明,该算法对输出敏感,即其运行时间与生成的输出大小呈准线性。

此内容仅以PDF格式提供。