跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
核酸研究。1999年9月1日;27(17): 3577–3582.
数字对象标识:10.1093/nar/27.17.3577
预防性维修识别码:PMC148603项目
PMID:10446249

细菌起始位点预测。

摘要

随着已测序细菌基因数量的不断增加,细菌基因组中基因的准确预测仍然是一个重要问题。尽管现有的工具预测细菌基因组中的基因具有较高的总体准确性,但其精确定位翻译起始位点的能力仍不令人满意。在本文中,我们提出了一种新的细菌起始位点预测方法,该方法考虑了潜在起始位点的多种特征,即核糖体结合位点(RBS)结合能、RBS与起始密码子的距离、最大ORF起始点与起始密码元的距离、,起始密码子本身和起始位点周围的编码/非编码潜力。采用混合整数规划对判别系统进行优化。该方法的准确率高达90%,而在全自动模式下使用最常用的工具时,准确率为70%(即,无需专家人工对结果进行后处理)。使用枯草芽孢杆菌、大肠杆菌和呋喃焦球菌对该方法进行评估。这三个基因组涵盖了广泛的细菌基因组,因为枯草芽孢杆菌是一种革兰氏阳性细菌,大肠杆菌是革兰氏阴性细菌,而糠秕芽孢杆菌则是一种古细菌。在缺乏实验工作的情况下,一个重要的问题是生成一组用于算法训练的“真正”起始点。我们发现,在许多情况下,糠秕金黄色葡萄球菌和相关的霍里克氏球菌之间的序列保持清楚地界定了基因起始点,提供了足够的训练集。

全文

本文全文可作为PDF格式(225K)。


文章来自核酸研究由以下人员提供牛津大学出版社