易基因

EasyGEN是一个具有统计学意义的ORF的原核基因查找器。背景:与序列分析的其他领域相反,尚未设计出一个假定基因的统计学意义的度量,以帮助区分真基因与原核基因组中的随机开放阅读框(ORF)的质量。因此,许多基因组中有太多的短ORF被注释为基因。结果:本文提出了一种新的自动化基因发现方法EASYGEN,该方法估计预测基因的统计学意义。基因查找器是基于一个隐马尔可夫模型(HMM),它自动估计一个新的基因组。在瑞士PROT中使用相似性的扩展,从基因组中自动提取高质量的基因训练集并用于估计HM。然后用HMM对推定基因进行评分,并根据ORF的得分和长度计算统计显著性。ORF的统计意义的度量是在相同的显著水平或更好的一兆位随机序列中的预期的ORF数,其中随机序列具有与第三阶马尔可夫链意义上的基因组相同的统计量。结论:结果是一个灵活的基因查找器,其整体性能匹配或超过其他方法。从一个基因组或一组重叠群的原始输入到具有重要意义的假定基因列表的计算机处理的整个管道是自动化的,使得很容易将EasyGein应用于新测序的生物体。具有预训练模型的EasyGein可以在HTTP://www. CBSdtu.dk/ServES/EasyGein上访问。


ZBMaCT中的参考文献(7篇文章中引用)

显示结果1至7的7。
按年份排序(引文

  1. 基思,Jonathan M.(ED):生物信息学。数据I.数据、序列分析和进化(2017)
  2. Axelson Fisk,玛丽娜:比较基因发现。模型、算法与实现(2015)
  3. 凯悦,道格;陈,Gwo Liang;Loassio,Philip F.;土地,Miriam L.;Larimer,Frank W.;豪泽,豪泽:浪子回头:原核基因识别和翻译起始位点识别(2010)伊波尔特
  4. 沃伦,Andrew S.;阿丘利塔,Jeremy S.;冯,吴尊;Stuubar,Jo Soo-卡洛斯:原核基因组注释中缺失的基因(2010)伊波尔特
  5. 沃伦,Andrew S.;StuuBabe,Jo Sango卡洛斯:基因组反向编译器:一种探索性注释工具(2009)伊波尔特
  6. Shmilovici,阿明,Ben Gal,Irad:利用VoM模型重建EST序列中的潜在编码区(2007)
  7. 拉森,Thomas Schou;Krkh,安德斯:EasyGEN——一个以统计学意义排列ORF的原核基因查找器(2003)伊波尔特