PMS5

PMS5:一个有效的(*,D)-基序发现问题的精确算法。背景:基序是在生物序列中发现的模式,这些模式对于理解基因功能、人类疾病、药物设计等有重要意义。它们有助于寻找转录调控元件、转录因子结合位点等。因此,识别基序的问题在生物学中是非常重要的。结果:在文献中已经找到了许多主题搜索问题的方面。其中一个是(*,D)-基序搜索(或种植基序搜索(PMS))。PMS问题得到了很好的研究,并被证明是NP-难。任何在给定输入集上总是找到所有(x,d)基元的PMS算法称为精确算法。在本文中,我们只专注于精确算法。PMS中的所有已知精确算法在最坏情况下的一些基础参数中花费指数时间。但这并不意味着我们不能在精确的时间内设计精确的算法来解决实际的问题。在本文中,我们提出了一个快速算法,可以解决众所周知的挑战性的PMS:(21, 8)和(23, 9)的实例。没有以前的精确算法可以解决这些实例。特别地,我们提出的算法在挑战性实例(21, 8)上花费约10小时,并且在具有挑战性的实例(23, 9)上花费约54小时。该算法已在一台具有3GB RAM的2.4GHz PC机上运行。PMS5的实现在Web上可以在HTTP://www. PMS.Eng.UnC.EdU/DeLooSts/PMS5.Zip中免费获得。结论:提出了一种高效的PMS5算法,并将其与已知的PMS1和PMSPune算法相结合。PMS5可以解决大型挑战性实例(21, 8)和(23, 9)。因此,我们希望PMS5有助于生物学家在期货中发现更长的主题。