wwPDB修复

wwPDB的一个主要重点是保持整个存档的一致性和准确性。随着PDB的发展,结构确定方法和技术的发展可能会对所有结构的表示方式提出挑战。wwPDB通过定期审查数据处理程序来应对这些挑战,并协调补救工作以改进数据表示。

2023肽残留物化学成分词典修复

2023年10月,wwPDB将更新和丰富化学成分词典(CCD)数据文件,其中包括标准化的原子命名和对肽残基中蛋白质骨架和末端原子的附加注释。包含这些更新的CCD的条目将相应更新。这将提高PDB数据的可查找性和互操作性,并为使用更新的肽残基注释开辟新的机会。

点击在这里查看肽残留物化学成分词典修复项目的详细信息,并获取github示例文件以供测试和采用。

2023年非标准坐标系中沉积晶体结构的修复

总共268结构2022年12月至2023年9月,以非标准坐标系或空间组设置存放于PDB的条目已被重新修订和发布。进行了更新,以使用现代图形和细化软件改进模型可视化,并针对沉积的实验数据进行验证。

每个重新版本化的条目都将原子x、y、z坐标转换为标准晶体学框架。非晶体对称矩阵(如果存在)也已转换为在更新的坐标上操作。

坐标转换是从REMARK或SCALE记录中提取的,或者从主要引文中发布的转换中提取的。

已仔细检查所有转换后的结构坐标,以确保晶体填料的完整性,并在可行的情况下,根据沉积的结构因子数据进行验证。

原始保存的坐标/矩阵与PDB版本档案中的上一个主要版本一样,仍然可以访问/下载。

2023年核磁共振抑制数据修复

wwPDB与NMR社区合作,以标准NMR-STAR和NEF格式统一了NMR约束和化学位移数据。以以下格式存放在PDB中的约束数据已尽最大努力标准化:

琥珀色、生物医学、CHARMM、CNS、青灰色、DYNAMO/TALOS/PALES、GROMACS、ISD、ROSETTA、SYBYL和XPLOR-NIH

  • 指定的化学位移和限制均已交给PDB
  • 必须提供有效的拓扑文件或特定注释,以解释特定格式的约束文件(即琥珀色、CHARMM、GROMACS)
  • 核磁共振数据中描述的所有原子(指定的化学位移和限制)与模型的原子一致
  • 模型和约束匹配之间的序列对齐,允许端子序列扩展

统一的NMR数据文件已启用核磁共振抑制验证在wwPDB验证报告中,针对具有指定化学位移和合理限制的NMR条目。

NMR-STAR格式是此NMR约束修复项目中用于处理各种约束的主格式。以“Auth_asym_ID”、“Auth_seq_ID”“Auth_comp_ID”和“Auth_atom_ID”术语开头的数据项,即“_Gen_dist_constraint.Auth_seq_ID_1”,分别指向mmCIF中的等效数据项,“_atom_site.Auth_asym_ID”、“_atom_site.Auth_seq_ID”,“_a汤姆网站.Auth_comp_ID”和“_atom_网站.Auth_atom_ID”。使用“_Assembly”和“_Entity”类别合并完整的原子名称映射信息。结构确定软件使用但NMR-STAR本体未涵盖的NMR约束,如化学平面度、平衡键角、非晶体学对称性等,作为JSON数据存储在“_Other_constraint_list.text_data”标记下,以确保补救过程中不会丢失信息。NEF数据文件作为NMR-STAR主数据文件的最佳转换提供。

2021年突变注释的修正

wwPDB对现有条目中的突变注释进行了标准化。大约11000个条目在mmCIF数据项_struct_ref_seq_dif.details中更新了“工程变异”注释,以符合OneDep沉积验证生物化系统中使用的PDBx/mmCIF字典中定义的当前标准。

2020年碳水化合物修复

wwPDB已经标准化了原子命名法,并与糖科学界合作提供了统一的数据表示和线性描述符,以便于将PDB数据转换为糖生物学家常用的其他表示。

单击此处查看碳水化合物修复项目的详细信息。

本项目的详细信息已在
邵成华(Chenghua Shao)、冯祖康(Zukang Feng)、约翰·德韦斯特布鲁克(John D Westbrook)、埃兹拉·佩萨奇(Ezra Peisach)、约翰·贝里斯福德(John Berrisford)、池川康夫(Yasuyo Ikegawa)、根吉·库里苏(Genji Kurisu)、萨米尔·维兰。(2021)蛋白质数据库中碳水化合物分子的现代化统一表示。糖生物学1–15:doi:10.1093克/立方厘米/立方厘米39.

2017年PDBx/mmCIF档案更新

2017年发布的带有PDB结构输入文件的PDB档案符合数据标准PDBx/mmCIF字典,它已经支持全球wwPDB系统,用于PDB数据的沉积、生物保护和验证-wwPDB OneDep存款系统.

PDB格式文件不包含所有修正的信息,因为PDB格式是旧式格式。提供了这些文件以前供社区审查和测试。

所有实验方法的更新的PDBx/mmCIF和XML结构输入文件都通过当前的PDB FTP存档提供(https://files.wwpdb.org/pub/pdb/data/structures/).

对V5.0的更改包括:

  • 改进审计categories来捕获更改信息,直至条目修订的类别级别。
  • 更好地组织数据内容以及电子显微镜衍生模型的模型文件中更广泛的元数据。
  • 为嵌合蛋白的每个序列片段校正源生物和序列参考。几个类别的数据已经标准化,包括软件名称、检测器名称和检测器类型。
  • 几个类别的标准化数据,包括软件名称、检测器名称和检测器类型。

描述了完整的更改列表在这里.

2016年3DEM条目修正

wwPDB和EMDataBank/3DEM项目的统一数据资源合作更新了PDB档案中所有电子显微镜和电子晶体学衍生结构的实验方法描述。随着这项工作的完成,所有3DEM衍生条目都具有更好的组织内容,并符合EMDataBank团队开发的修订数据模型,用于wwPDB OneDep系统OneDep系统自2016年1月起支持3DEM结构的沉积、注释和验证,并完全集成了3DEM地图和模型坐标的沉积。

新的wwPDB ftp目录中提供了3DEM模型文件的示例(已修正的和来自OneDep系统的)(https://files.wwpdb.org/pub/pdb/test_data/EM/). 提供了补救期间所做更改的数据项级描述在这里可以查看更新的PDBx/mmCIF字典中的3DEM术语在这里.

2017年,当前PDB ftp档案中的文件将替换为与更新的PDBx/mmCIF字典相对应的新文件。鼓励用户查看和测试示例数据文件。

2014年大型结构与主要PDB档案的整合

以PDBx/mmCIF和PDBML格式表示为单个文件的大型结构(包含超过62条链和/或99999条ATOM线集成到主PDB FTP存档中。以前,大型结构用多个“SPLIT”条目表示,现在已删除(已作废)。在wwPDB成员网站搜索“SPLIT”条目ID代码的用户将自动重定向到条目。文件大_分割_映射.tsv列出了在此修正过程中创建的单个大型结构ID以及相应的废弃ID分割条目。在此修复之后,大型结构将仅分布在PDBx/mmCIF和PDBML中的主PDB FTP目录中格式,包括生物部件文件。此外,PDB FTP存档中的单独目录提供对包含以下内容的TAR文件的访问表示所有大型结构的最小PDB格式文件的集合。

2013年补救

2012年,wwPDB审查了档案中的结构因子文件,以确保格式一致性以及与坐标数据的一致性。因此,更新了约43800个结构因子文件,以使格式标准化并纳入数据更正。结构因子文件的audit.details记录中描述了所做的更改。这些修改后的条目在2013年全年每周发布1000批。

2011年补救

2011年7月发布的PDB档案4.0版涉及修复复杂的问题,包括生物组件、残留B因子、肽抑制剂和抗生素的代表性,以及非标准晶框中的条目。有关审查以及由此产生的更改和更正的描述,请参见PDF文档。对数据所做的任何更改都会记录在PDBX_VERSION数据类别和为此版本创建的修订日志中(XLS公司CSV文件).

2008年补救

2009年3月发布的PDB存档3.2版包括对数据的改进和增强,包括聚合物的化学和与其结合的配体、生物组装以及配体与金属离子的结合位点。概述(PDF)提供了。

2007年补救

2007年8月,wwPDB发布了所有PDB条目的修正文件,以确保存档中的数据。作为该项目的一部分,档案中的许多条目都已更新并保持一致,重点关注序列(数据库和分类的参考,以及化学和大分子序列);主要引文;以及汇编和病毒信息。化学成分中字典中,单体和配体的化学和命名标准化。此版本的已修正数据极大地提高了整个PDB归档的搜索和报告功能。


本项目的详细信息已在

K.Henrick、Z.Feng、W.Bluhm、D.Dimitropoulos、J.F.Doreleijers、S.Dutta、J.L.Flippen-Anderson、J.Ionides、C.Kamada、E.Krisinel、C.L.Lawson、J.L.Markley、H.Nakamura、R.Newman、Y.Shimizu、J.Swaminathan、S.Velankar、J.Ory、E.L.Ulrich、W.Vranken、J.Westbrook、R.Yamashita、H.Yang、J.Yousufuddin和H.Berman(2008)蛋白质数据库档案的修复。核酸研究36(数据库问题):D426-D433。

C.L.Lawson、S.Dutta、J.D.Westbrook、K.Henrick和H.M.Berman(2008)修复PDB档案中的病毒表示。《水晶学报》。D64:874-882。

补救项目的全部范围也可在概述文档(PDF)。