拉斯科·莱诺宁(Rasko Leinonen)、费德里科·加西亚·迪兹(Federico Garcia Diez)、大卫·宾斯(David Binns)、沃尔夫冈·弗利什曼(Wolfgang Fleischmann)、罗德里戈·洛佩斯(Rodrigo Lopez)、罗尔夫·阿普,生物信息学,第20卷,第17期,2004年11月,第3236–3237页,https://doi.org/10.1093/bioinformatics/bth191
总结:UniProt Archive(UniParc)是目前最全面的非冗余蛋白质序列数据库。它的蛋白质序列是从主要的公共资源中检索出来的。每天收集所有新的和更新的蛋白质序列,并将其加载到UniParc中进行全面覆盖。为了避免冗余,每个唯一序列只存储一次,并使用稳定的蛋白质标识符,稍后可以在UniParc中使用该标识符来识别所有源数据库中的相同蛋白质。当蛋白质加载到数据库中时,会创建数据库交叉引用,将它们与序列的起源联系起来。因此,对UniParc执行序列搜索相当于对UniParc交叉引用的所有数据库执行相同的搜索。UniParc仅包含蛋白质序列和数据库交叉引用;必须从源数据库检索所有其他信息。
可利用性: http://www.ebi.ac.uk/uniparc/
信件应寄给谁。
登录或创建帐户
此PDF仅供订阅者使用
要完全访问此pdf,请登录现有帐户,或购买年度订阅。