摘要

一个隐马尔可夫模型(HMM)已经被开发出来用于寻找蛋白质编码基因大肠杆菌DNA使用大肠杆菌Kenn Rudd维护的EcoSeq6数据库中的基因组DNA序列。该HMM包括模拟密码子及其频率的状态大肠杆菌基因,以及在基因间区域发现的模式,包括重复的外源回文序列和Shine–Delgarno基序。为了解释原始基因组DNA序列中潜在的测序错误和/或移码,它允许(极不可能的)密码子中单个核苷酸的插入和删除。HMM的参数是使用EcoSeq6中约100万个带注释DNA的核苷酸进行估计的,模型是在包含约325000个核苷酸的不相交连接体上进行测试的。HMM发现了大约80%的已知位置大肠杆菌基因和大约10%的位置。它还发现了几个潜在的新基因,并定位了几个可能存在插入或删除错误和/或移码的位置。

此内容仅以PDF格式提供。

评论

0条评论
提交评论
您输入了无效代码
感谢您对本文发表评论。您的评论将由杂志自行审查并发表。请通过电子邮件查看进一步的通知。