原核蛋白质注释项目专注于细菌和古细菌特异性蛋白和蛋白质家族的手工注释。
见:我们如何手工注释UnPurtKB条目?
我们目前的主要努力是从已经很好的模型细菌的蛋白质的注释。大肠埃希菌和枯草芽孢杆菌以及病原体的注释,如结核分枝杆菌.
高质量的自动标注传播
由于由于下一代测序和不断增加的全基因组测序率而产生的数据量的增加,不再需要对这些基因组中的一小部分进行手动注释,尽管对校正和注释完整蛋白质组有相当大的需求。为了丰富他们在UniProtKB的诠释,我们开发了哈马普(蛋白质的高质量自动化和手动注释),其目标是自动注释来自全基因组测序项目的大量蛋白质的显著百分比。这种基于家庭概况和手动创建的注释规则集合的自动注释流水线仅适用于能够产生与手动注释意愿相同的质量的情况,即对于定义良好的家庭或亚族的一部分的蛋白质。这意味着蛋白质家族具有明确的功能,并且在序列水平上保存得很好。