蛋白质数据库

来自Proteopedia

跳转到:航行,搜索

这个全球蛋白质数据库(wwPDB)[1][2]是国际公认的唯一仓库[3]在所有已发表的、凭经验确定的原子分辨率大分子三维(3D)结构数据中。由Edgar Meyer博士和Walter Hamilton博士于1971年在布鲁克海文国家实验室[4][5]1994年之前,蛋白质数据库的管理层一直由Tom Koestle领导乔尔·苏斯曼直到1999年,当它被转让给结构生物信息学研究合作实验室(RCSB)RCSB由罗格斯大学和圣地亚哥超级计算机中心管理。它是由海伦·M·伯曼直到2014年7月,Stephen K.Burley接任董事职务[6]2008年,PDB有三个官方分支机构:结构生物信息学研究合作实验室(美国RCSB)、欧洲生物信息学学会(英国PDBe)和日本蛋白质数据库(大阪PDBj)。

目录

新发布周期

wwPDB每周发布一次新条目。单击主页右上角显示的最新发布日期可以查看这些信息PDB。组织2007年,共发布7280条新条目(平均每周140条)。2011年,共发布8101条新条目(平均155/周)。[7]

虽然传统条目包括原子坐标文件分子模型,最近实验数据(在晶体学的情况下,结构因子)已经和模型一起沉积。2008年2月1日之后,需要沉积实验数据以及所有新条目。

许多衍生数据库复制、获取信息或为其增值这个原子坐标文件可从wwPDB获得。通常,在PDB发布新版本后不久,这些数据库会自动每周更新一次数据库。蛋白质体就是一个例子。

PDB统计

pdb.org网站,在主页的右上角,单击PDB统计对于大量有趣的信息,包括通过多种实验方法解决的蛋白质、PDB中的序列冗余、决议、发表了最新大分子结构的100种期刊,以及数据库增长图(根据内容增长).

PDB内容的一些有趣统计数据(最大值、最小值、平均值)总结于信不信由你.

补救

PDB定期修正其存档的数据文件。补救提高了一致性和命名,并纠正了一些错误。补救包括PDB数据格式2007年8月和2009年3月进行了补救。有关详细信息,请访问全球PDB.

以下是影响PDB格式的修正中发生的一些更改示例。

  • DNA:2007年8月之前,DNA和RNA核苷酸均命名为A、C、G、T和U。2007年8月份之后,DNA核苷酸更改为DA、DC、DG、DT和DU,而RNA核苷酸继续使用旧的单字母名称。(同时包含DNA和RNA的模型的一个例子是104天.)此更改需要对软件包进行更改,例如焦耳(Jmol),并保留未维护的包,如蛋白质探索者无法正确处理修复的核酸。
  • 非标准残留物:一些PDB文件将非标准残基表示为标准残基(ATOM记录)和加合物(HETATM记录)。其中一些被更改为非标准残留物的统一名称,以便同一残留物中的所有原子都具有相同的名称(并且都是HETATM记录)。例如,磷酸丝氨酸下午1点是SER加PHO;磷酸苏氨酸THR加PHO。这些问题已纠正至SEP和TPO。在另一个例子中,甲基化核糖核苷酸310天已命名,例如+C1加CH3。这些问题已向OMC进行了补救,以此类推。
  • 原子顺序:在2009年3月的补救中,一些PDB文件中的链和原子顺序以非系统方式发生了变化。这打破了Proteopedia中保存的一些场景,需要重新设计Proteopedia的某些部分(请参阅Proteopedia可避免与补救相关的问题).

数据文件的过时(未修复)版本在每次修复之前由PDB保存,可以获取:请参阅获取未调解的PDB文件.

序列编号异常

PDB中的条目通常包含序列号异常(请参阅同源_建模_服务器#序列_编号_异常).

改进发布的模型

有几个免费的自动化服务器可以改进大多数发布的模型。请参见改进发布的模型分子模型的质量评估.

关于蛋白质数据库的更多信息

另请参阅Proteopedia

外部来源

参考文献和注释

  1. Berman H、Henrick K、Nakamura H宣布建立全球蛋白质数据库。自然结构生物。2003年12月;10(12):980. PMID:14634627数字对象标识:10.1038/nsb1203-980
  2. Berman H、Henrick K、Nakamura H、Markley JL。全球蛋白质数据库(wwPDB):确保PDB数据的单一、统一存档。核酸研究,2007年1月;35(数据库问题):D301-3。Epub 2006年11月16日。PMID:17142228数字对象标识:10.1093/nar/gkl971年10月10日
  3. 蛋白质数据库:3D大分子结构数据的单一全球档案。核酸研究2019年1月8日;47(D1):D520-D528。doi:10.1093/nar/gky949。PMID:30357364数字对象标识:http://dx.doi.org/10.1093/nar/gky949
  4. Bernstein FC、Koetzle TF、Williams GJ、Meyer EF Jr、Brice MD、Rodgers Jr、Kennard O、Shimanouchi T、Tasumi M。蛋白质数据库:基于计算机的大分子结构档案文件。分子生物学杂志。1977年5月25日;112(3):535-42. PMID:875032
  5. Sussman JL,Lin D,Jiang J,Manning NO,Prilusky J,Ritter O,Abola EE。蛋白质数据库(PDB):生物大分子三维结构信息数据库。晶体学报D生物晶体。1998年11月1日;54(第6部分第1部分):1078-84。PMID:10089483
  6. 领导层转型,RCSB新闻稿,2014年秋季。
  7. 2012年5月,RCSB发布日期的高级搜索报告了以下数字。2011: 8,101. 2010: 7907. 2009: 7388. 2008: 6964. 2007: 7199.
  8. Berman HM.蛋白质数据库与社区之间的协同作用。自然结构分子生物学。2021年5月;28(5):400-401. doi:10.1038/s41594-021-00586-6。PMID:33963295数字对象标识:http://dx.doi.org/10.1038/s41594-021-00586-6
个人工具