摘要

动机:隐马尔可夫模型(HMM)是一种有价值的技术对于基因识别,特别是因为它的灵活性使包含各种序列特征。最近的计划细菌基因发现包括核糖体结合信息站点(RBS)以提高起始密码子的识别准确性,使用此功能。我们在这里报告了我们扩展模型的尝试到总转录单位中,可以预测操纵子结构。

结果:首先,我们提高了编码的预测准确性序列(CDS),采用“典型”模型,“非典型”和“阴性(假阳性)”以及RBS及其下游垫片的模型。这个实验证实准确预测204的灵敏度在客观测试中,CDS达到90.2%。根据预测CDS结果显示,启动子和终止子的位置为预测。我们的模型可以准确识别390个已知对象中的60%转录单位。因此,这一点的准确性和重要性预测问题绝非无足轻重。我们想提出这个问题是生物信息学中的一个开放主题,因为或计划的测序后项目将为未来的改进。

可用性:预测转录单位表大肠杆菌将按要求分发。

联系人:knakai@ims.u-tokyo.ac.jp

此内容仅以PDF格式提供。