摘要

总结:UniProt Archive(UniParc)是目前最全面的非冗余蛋白质序列数据库。它的蛋白质序列是从主要的公共资源中检索出来的。每天收集所有新的和更新的蛋白质序列,并将其加载到UniParc中进行全面覆盖。为了避免冗余,每个唯一序列只存储一次,并使用稳定的蛋白质标识符,稍后可以在UniParc中使用该标识符来识别所有源数据库中的相同蛋白质。当蛋白质加载到数据库中时,会创建数据库交叉引用,将它们与序列的起源联系起来。因此,对UniParc执行序列搜索相当于对UniParc交叉引用的所有数据库执行相同的搜索。UniParc仅包含蛋白质序列和数据库交叉引用;必须从源数据库检索所有其他信息。

可利用性: http://www.ebi.ac.uk/uniparc/

*

信件应寄给谁。

此内容仅以PDF格式提供。