我们很高兴宣布发布新版本单机版的原核基因组注释管道(PGAP)具有许多令人激动的新功能。
改进的用户界面
这个版本有一个改进的用户界面,可以直接在命令行上获取基因组FASTA文件和相关的生物体名称。例如,要注释霍乱弧菌Vchol.fasta文件中的基因组序列:
pgap.py-r-g Vchol.fasta-s“霍乱弧菌”-o Vchol.annot
有关更多详细信息,请访问我们的快速入门第页。
其他输出文件可实现更好的互操作性
除了全球金融论坛PGAP始终生成的GenBank和蛋白质FASTA注释文件现在提供:
- 注释cds_from_genemic.fna:FASTA格式的所有编码序列(CDS)特征的核苷酸序列,以基因组序列为基础,标注在组件上。
- 注释_翻译的cds.faa:基因组记录上注释的CDS特征的FASTA格式的蛋白质序列。序列是在注释cds_from_genomic.fna.gz文件。
- annot_with_genomic_fasta.gff:GFF格式的注释,后跟##FASTA杂注和FASTA格式的基因组序列。这使得该文件可由直接使用咆哮.
注释中有更多基因本体(GO)术语
PGAP根据点击次数为预测的蛋白质分配功能蛋白质家族模型,如蛋白质图谱HMM、Blast命中率和结构域结构。此版本中的新增功能,GO术语和酶委员会(EC)编号与结构域相关的是由带注释的蛋白质继承的。平均而言,基因组上注释的蛋白质中有50%至少用一个GO术语注释。
而且,与之前的每个版本一样,本版本也由蛋白质家族模型集合的专家管理员进行了增量改进,以提高PGAP的结构和功能注释的准确性。
保持最新
在推特上关注我们 @NCBI公司 和j个在我们的邮件列表中及时了解PGAP和其他NCBI新闻。
我们想听听你的意见!
请尝试此新版本并分享你的经历和我们一起。