蛋白质数据库

来自Proteopedia

(重定向自PDB公司)
跳转到:航行,搜索

这个全球蛋白质数据库(wwPDB)[1][2]是国际公认的唯一仓库[3]所有已发布的、经验性确定的原子分辨率大分子三维(3D)结构数据。由Edgar Meyer博士和Walter Hamilton博士于1971年在布鲁克海文国家实验室[4][5]1994年之前,蛋白质数据库的管理层一直由Tom Koestle领导乔尔·苏斯曼直到1999年,当它被转让给结构生物信息学研究合作实验室(RCSB)RCSB由罗格斯大学和圣地亚哥超级计算机中心管理。它是由海伦·M·伯曼直到2014年7月,Stephen K.Burley接任董事职务[6]2008年,PDB有三个官方分支机构:结构生物信息学研究合作实验室(美国RCSB)、欧洲生物信息学学会(英国PDBe)和日本蛋白质数据库(大阪PDBj)。

目录

新发布周期

wwPDB每周发布一次新条目。单击主页右上角显示的最新发布日期可以查看这些信息PDB。组织2007年,共发布7280条新条目(平均每周140条)。2011年,共发布8101条新条目(平均155/周)。[7]

虽然传统条目包括原子坐标文件分子模型,最近实验数据(结晶学中的结构因子)已随模型一起沉积。2008年2月1日之后,需要沉积实验数据以及所有新条目。

许多衍生数据库复制、获取信息或为其增值这个原子坐标文件可从wwPDB获得。通常,在PDB发布新版本后不久,他们会每周自动更新数据库。蛋白质体就是一个例子。

PDB统计

pdb.org网站,在主页面的右上角,单击PDB统计对于大量有趣的信息,包括通过多种实验方法解决的蛋白质、PDB中的序列冗余、决议、发表了最新大分子结构的100种期刊,以及数据库增长图(根据内容增长).

PDB内容的一些有趣的统计数据(最大值、最小值、平均值)总结如下信不信由你.

补救措施

PDB定期修正其存档的数据文件。补救提高了一致性和命名,并纠正了一些错误。补救包括PDB数据格式2007年8月和2009年3月进行了补救。有关详细信息,请访问全球PDB.

以下是影响PDB格式的修正中发生的一些更改示例。

  • DNA:2007年8月之前,DNA和RNA核苷酸均命名为A、C、G、T和U。2007年8月份之后,DNA核苷酸更改为DA、DC、DG、DT和DU,而RNA核苷酸继续使用旧的单字母名称。(包含DNA和RNA的模型示例如下104天.)此更改需要对软件包进行更改,例如焦耳(Jmol),并保留未维护的包,如蛋白质探索者无法正确处理修复的核酸。
  • 非标准残留物:一些PDB文件将非标准残基表示为标准残基(ATOM记录)和加合物(HETATM记录)。其中一些被更改为非标准残留物的统一名称,以便同一残留物中的所有原子都具有相同的名称(并且都是HETATM记录)。例如,磷酸丝氨酸下午1点是SER加PHO;磷酸苏氨酸THR加PHO。这些问题已纠正至SEP和TPO。在另一个例子中,甲基化核糖核苷酸310天已经被命名为例如+C1加CH3。这些问题已向OMC进行了补救,以此类推。
  • 原子顺序:在2009年3月的补救中,一些PDB文件中的链和原子顺序以非系统方式发生了变化。这打破了Proteopedia中保存的一些场景,需要重新设计Proteopedia的某些部分(请参阅Proteopedia可避免与补救相关的问题).

数据文件的过时(未修复)版本在每次修复之前由PDB保存,可以获取:请参阅获取未调解的PDB文件.

序列编号异常

PDB中的条目通常包含序列号异常(请参阅同源_建模_服务器#序列_编号_异常).

改进已发布的模型

有几个免费的自动化服务器可以改进大多数发布的模型。请参阅改进发布的模型分子模型的质量评估.

关于蛋白质数据库的更多信息

另请参阅Proteopedia

外部来源

  • 全球蛋白质数据库
  • RCSB PDB公司
  • 维基百科中的蛋白质数据库
  • “蛋白质数据库与社区之间的协同作用”,2021年[8].
  • Berman H、Henrick K、Nakamura H、Markley JL。全球蛋白质数据库(wwPDB):确保PDB数据的统一存档。核酸研究35:D301-3。(2007年)PMID:17142228.
  • 伯曼HM等。,蛋白质数据库,生物结晶学报58:8899-907(2002)。PMID:12037327
  • H.M.Berman、J.Westbrook、Z.Feng、G.Gilliland、T.N.Bhat、H.Weissig、I.N.Shindyalov、P.E.Bourne:蛋白质数据库。《核酸研究》,第28页,第235-242页(2000年)。PMID:10592235.
  • Sussman JL、Lin D、Jiang J、Manning NO、Prilusky J、Ritter O、Abola EE(1998)。“蛋白质数据库(PDB):生物大分子三维结构信息数据库”。《水晶学报》 第54页:1078-1084.项目管理标识10089483.
  • 高分子晶体结构的最早解决方案
  • 另请参见理论模型.

参考文献和注释

  1. Berman H、Henrick K、Nakamura H宣布建立全球蛋白质数据库。自然结构生物。2003年12月;10(12):980. PMID:14634627数字对象标识:10.1038/nsb1203-980
  2. Berman H、Henrick K、Nakamura H、Markley JL。全球蛋白质数据库(wwPDB):确保PDB数据的统一存档。核酸研究,2007年1月;35(数据库问题):D301-3。Epub 2006年11月16日。PMID:17142228数字对象标识:1997年10月1093/nar/gkl
  3. 蛋白质数据库:3D大分子结构数据的单一全球档案。核酸研究2019年1月8日;47(D1):D520-D528。doi:10.1093/nar/gky949。PMID:30357364数字对象标识:http://dx.doi.org/10.1093/nar/gky949
  4. Bernstein FC、Koetzle TF、Williams GJ、Meyer EF Jr、Brice MD、Rodgers Jr、Kennard O、Shimanouchi T、Tasumi M。蛋白质数据库:基于计算机的大分子结构档案文件。分子生物学杂志。1977年5月25日;112(3):535-42. PMID:875032
  5. Sussman JL,Lin D,Jiang J,Manning NO,Prilusky J,Ritter O,Abola EE。蛋白质数据库(PDB):生物大分子三维结构信息数据库。晶体学报D生物晶体。1998年11月1日;54(第6部分第1部分):1078-84。PMID:10089483
  6. 领导层过渡,RCSB新闻稿,2014年秋季。
  7. 2012年5月,RCSB发布日期的高级搜索报告了以下数字。2011: 8,101. 2010: 7907. 2009: 7388. 2008: 6964. 2007: 7199.
  8. Berman HM.蛋白质数据库与社区之间的协同作用。自然结构分子生物学。2021年5月;28(5):400-401. doi:10.1038/s41594-021-00586-6。PMID:33963295数字对象标识:http://dx.doi.org/10.1038/s41594-021-00586-6
个人工具