该分析基于“毒力因子与基因组岛的关联”研究(Ho Sui、Fedynak、Xiao、Langille和Brinkman(2009),公共科学图书馆).
对2014年12月从国家生物技术信息中心FTP网站下载的1292个致病性和1490个非致病性测序原核基因组的推导蛋白质组进行BLAST相似性搜索。使用10-7的e值截止值排除远距离同源。通过NCBI Complete Microbical Genomes网页(Haft等人,2005)获得每个基因组的病原体或非病原体状态,然后手动整理以确保数据质量和完整性。
“状态”的当前类别为:
1) 病原体:蛋白质只对致病菌株中的蛋白质有BLAST命中。
2) 非病原体:在非致病菌株中,蛋白质只与蛋白质发生BLAST碰撞。
3) 常见:该蛋白对致病菌株和非致病菌株中的蛋白质都有BLAST命中。
“毒力证据?”列指示数据库中是否有任何证据表明该基因与毒力相关(即VFDB、Victors毒力因子、假单胞菌基因组数据库管理等)。
关于此分析的重要注意事项:随着更多基因组测序,被定义为与病原体相关的基因列表将发生变化。该分析将在稍后更新,以反映这一点。