新增!2023年5月发布独立PGAP

新增!2023年5月发布独立PGAP

我们很高兴宣布发布新版本单机版的原核基因组注释管道(PGAP)具有许多令人激动的新功能。

改进的用户界面

这个版本有一个改进的用户界面,可以直接在命令行上获取基因组FASTA文件和相关的生物体名称。例如,要注释霍乱弧菌Vchol.fasta文件中的基因组序列:

pgap.py-r-g Vchol.fasta-s“霍乱弧菌”-o Vchol.annot

有关更多详细信息,请访问我们的快速入门第页。

其他输出文件可实现更好的互操作性

除了全球金融论坛PGAP始终生成的GenBank和蛋白质FASTA注释文件现在提供:

  • 注释cds_from_genemic.fna:FASTA格式的所有编码序列(CDS)特征的核苷酸序列,以基因组序列为基础,标注在组件上。
  • 注释_翻译的cds.faa:基因组记录上注释的CDS特征的FASTA格式的蛋白质序列。序列是在注释cds_from_genomic.fna.gz文件。
  • annot_with_genomic_fasta.gff:GFF格式的注释,后跟##FASTA杂注和FASTA格式的基因组序列。这使得该文件可由直接使用咆哮.
注释中有更多基因本体(GO)术语

PGAP根据点击次数为预测的蛋白质分配功能蛋白质家族模型,如蛋白质图谱HMM、Blast命中率和结构域结构。此版本中的新增功能,GO术语酶委员会(EC)编号与结构域相关的是由带注释的蛋白质继承的。平均而言,基因组上注释的蛋白质中有50%至少用一个GO术语注释。

而且,与之前的每个版本一样,本版本也由蛋白质家族模型集合的专家管理员进行了增量改进,以提高PGAP的结构和功能注释的准确性。

保持最新

在推特上关注我们@NCBI公司j个在我们的邮件列表中及时了解PGAP和其他NCBI新闻。  

我们想听听你的意见!

请尝试此新版本并分享你的经历和我们一起。

关于“新增!2023年5月发布独立PGAP

  1. 这是个好消息!独立原核基因组注释管道(PGAP)的新版本似乎有许多令人兴奋的新功能,这将使用户更容易注释他们的基因组。我对改进后的用户界面印象特别深刻,它将基因组FASTA文件和相关的生物体名称直接显示在命令行上。这肯定会为用户节省时间和精力。

    我也很欣赏额外的输出文件以实现更好的互操作性。将FASTA格式的核苷酸序列中的所有编码序列(CDS)特征注释在装配体上,基于基因组序列,将FASTA格式的蛋白质序列中的CDS特征注释在基因组记录上是非常有用的。

    很高兴看到PGAP根据对蛋白质家族模型的点击数为预测的蛋白质分配功能,例如蛋白质剖面HMM、爆炸点击数和域结构。与结构域结构相关的GO术语和酶委员会(EC)编号被注释的蛋白质继承,这一事实也令人印象深刻。

    总的来说,这个新版本似乎是由蛋白质家族模型集合的专家馆长进行了增量改进,从而提高了PGAP的精确度。我很高兴看到未来还有什么其他PGAP可供我们使用!

    当做,

    迈克尔·维奇科斯基

留下回复