基因标记

GeneMarkS:一种预测微生物基因组中基因起始的自我训练方法。在调控区域寻找序列基序的意义。提高基因起始点预测的准确性是计算机预测原核基因的几个尚未解决的问题之一。它的困难是由于缺乏相对强大的序列模式来识别真正的翻译起始点。在本论文中,我们证明了在基于迭代隐马尔可夫模型的算法中,结合蛋白质编码区和非编码区模型以及基因启动附近调控位点的模型,可以提高基因启动预测的准确性。这种被称为GeneMarkS的新的基因预测方法利用了一种无监督的训练过程,可以用于一个新测序的原核基因组,而不需要事先知道任何蛋白质或rRNA基因。GeneMarkS的实现使用了改进的基因发现程序GeneMark.hmm、编码区和非编码区的启发式Markov模型以及Gibbs抽样多重比对程序。GeneMarkS精确地预测了GenBank注释的枯草芽孢杆菌基因的83.2%的翻译起始,以及一组实验验证的大肠杆菌基因中94.4%的翻译起始。我们还观察到GeneMarkS检测原核基因,在识别包含真实基因的开放阅读框方面,其精确度与目前使用的最好的基因检测方法的水平相匹配。精确的翻译起始预测,除了细化蛋白质序列N端数据外,还可以精确定位位于基因起始点上游的序列区域。因此,与转录和翻译调控位点相关的序列模体可以更精确地揭示和分析。这些模体具有显著的变异性,讨论了它们之间的功能和进化联系。


zbMATH参考文献(参考 5篇文章

显示第1到第5个结果,共5个。
按年份排序(引用)

  1. 基思,乔纳森M.(编辑):生物信息学。第一卷:数据、序列分析和进化(2017)
  2. 高婷婷;杨志霞;王勇;景玲:利用支持向量机识别原核生物翻译起始位点(2010)
  3. Li,Li Jia;Fei Fei,Li:OPTIMOL:基于增量模型学习的在线图像自动采集(2010)ioport公司
  4. Warren,Andrew S.;Archuleta,Jeremy S.;Feng,Wu Chun;Setubal,João Carlos:原核基因组注释中的缺失基因(2010)ioport公司
  5. Mitrophanov,Alexander Yu.;Lomsadze,Alexandre;Borodovsky,Mark:隐马尔可夫模型的敏感性(2005)