日记账列表 核酸研究 第27(17)节;1999年9月1日 PMC148603项目 作为一个图书馆,NLM提供了获取科学文献的途径。纳入NLM数据库并不意味着认可或同意,NLM或国家卫生研究院的内容。了解更多信息:PMC免责声明|PMC版权声明 核酸研究。1999年9月1日;27(17): 3577–3582. 数字对象标识:10.1093/nar/27.17.3577PMCID公司:PMC148603项目PMID:10446249细菌起始位点预测。S S汉内哈利,W S海耶斯,A G Hatzigeorgiou公司、和J W菲科特作者信息 版权和许可证信息 PMC免责声明生物信息学,SmithKline Beecham Pharmaceuticals,709 Swedeland Road,PO Box 1539,King of Prussia,PA 19406,USA。hannes00@mh.vs.sbphrd.comPMC版权声明 摘要随着已测序细菌基因数量的不断增加,细菌基因组中基因的准确预测仍然是一个重要问题。尽管现有的工具预测细菌基因组中的基因具有较高的总体准确性,但其精确定位翻译起始位点的能力仍不令人满意。在本文中,我们提出了一种新的细菌起始位点预测方法,该方法考虑了潜在起始位点的多种特征,即核糖体结合位点(RBS)结合能、RBS与起始密码子的距离、最大ORF起始点与起始密码元的距离、,起始密码子本身和起始位点周围的编码/非编码潜能。采用混合整数规划对判别系统进行优化。该方法的准确率高达90%,而在全自动模式下使用最常用的工具时,准确率为70%(即,无需专家人工对结果进行后处理)。使用枯草芽孢杆菌、大肠杆菌和呋喃焦球菌对该方法进行评估。这三个基因组涵盖了广泛的细菌基因组,因为枯草芽孢杆菌是一种革兰氏阳性细菌,大肠杆菌是革兰氏阴性细菌,而糠秕芽孢杆菌则是一种古细菌。在缺乏实验工作的情况下,一个重要的问题是生成一组用于算法训练的“真正”起始点。我们发现,在许多情况下,糠秕金黄色葡萄球菌和相关的霍里克氏球菌之间的序列保持清楚地界定了基因起始点,提供了足够的训练集。全文本文全文可作为PDF格式(225K)。文章来自核酸研究由以下人员提供牛津大学出版社