PDB版本存档

自2017年10月以来,wwPDB对PDB条目进行了版本化,并通过FTP-versioned.wwPDB.org及其在美国、英国和日本的镜像上可访问的版本化FTP档案分发每个条目的最新版本和之前版本。

PDB版本存储库

PDB版本存储库将于每周三UTC 00:00更新。

wwPDB(世界野生动植物数据库):ftp版本。www.pdb.org,文件-版本.wwpdb.org, rsync://rsync-versioned.wwpdb.org
RCSB PDB(美国):ftp版本.rcsb.org,文件版本rcsb.org, rsync://rsync-versioned.rcsb.org
PDBe(英国):ftp.ebi.ac.uk/pub/databases/pdb版本/
PDBj(日本):ftp://ftp版本.pdbj.org,https://files-versioned.pdbj.org, rsync://rsync-versioned.pdbj.org

什么是PDB条目版本控制

PDB条目首次发布后所做的更改被视为“主要”或“次要”。对坐标文件中的原子坐标、聚合物序列或化学描述的更新会触发主要版本增加,保留最初发布的PDB加入代码。坐标文件中元数据的其他更改被视为次要更改。目前,不允许对导出坐标的实验数据进行任何更改。为了跟踪版本之间的更改,在PDBx/mmCIF字典中定义了一组新的修订类别(http://mmcif.wwpdb.org/dictionaries/mmcif_pdbx_v50.dic/Groups/audit_group.html). 修订轨迹包含在PDBx/mmCIF格式的坐标文件中。

除了包含新的修订审核类别外,传统的PDB存档(ftp.wwpdb.org网站)不会产生任何影响。它继续使用熟悉的命名样式,并且只包含每个条目的最新版本。

版本化的FTP存档包含PDB结构的所有主要版本。 

扩展的PDB加入代码

为了规划PDB档案的未来增长,并更紧密地符合FAIR数据管理的“可查找性”原则,我们将PDB登录代码从常见的四字符样式扩展到以“PDB”为前缀的8个字符。例如,条目1abc的PDB登录代码变为PDB_00001abc。PDB加入代码的这种新格式将在稍后的日期包含在坐标文件中。版本化的FTP树在文件命名中使用扩展的PDB登录代码。

版本化PDB FTP树的目录结构

与传统的FTP树不同,在版本树中,特定条目的所有文件都存储在单个目录中(例如,“pdb_00001abc”)。这些目录在PDB代码的两个倒数第二个字符的2字符散列下分组(对于“PDB_00001abc”示例,散列将为“ab”):

../pdb_versioned/data/entries/<双字母散列>/<pdb_accession_code>/<entry_data_File_names>

因此,条目pdb_00001abc的所有文件都将存储在以下目录中:

../pdb_versioned/data/entries/ab/pdb_00001abc/

版本化PDB FTP树中的文件名

版本化FTP存档中的文件名符合新的命名方案,使用户可以轻松查看主要版本号和次要版本号:

<PDB_ID>_<content_type>_v<major_version>-<minor_version><文件格式类型><文件压缩类型>

例如,在新的文件命名方案下,PDB条目1abc的第一个初始版本将具有以下形式:

pdb_00001abc_yz_v1-0.cif.gz

其中“xyz”表示坐标内容;“cif”表示文件格式;“gz”表示压缩的UNIX存档文件。

PDB条目1abc的第一次次要修订(例如,更新引文元数据)将具有以下名称:

pdb_00001abc_xyz_v1-1.cif.gz

如果PDB条目1abc有一个主要更新(例如,作者重新定义以更好地代表配体),它将具有以下名称:

pdb_00001abc_xyz_v2-0.1if.gz(注意:每次新的进行了重大更新。)

版本化存储库的多个视图

为方便存储库用户,为内容类型和格式提供了不同的存储库视图。

要访问坐标mmCIF文件的绝对最新版本,应完全忽略文件名中的版本号。例如,对于条目pdb_00001abc:

../pdb_versioned/views/latest/coordinates/mmcif/ab/pdb_00001abc/pdb_0001abc_xyz.cif.gz(注意文件中缺少版本号)→../pdb_versioned/data/entries/ab/pdb_00001abc/pdb.0001abc_xyz_v2-0.1if.gz(如果版本2-0是最新)

要访问条目的坐标文件的特定主版本,应在文件名中省略次版本。例如,对于条目pdb_00001abc:

../pdb_versioned/views/all/coordinates/mmcif/ab/pdb_00001abc/pdb_0001abc_xyz_v1.cif.gz(注意缺少次要版本号)→../pdb_versioned/data/entries/ab/pdb_00001abc/pdb_00001abc/pdb_00001abc_xyz_v1-2.cif.gz(如果版本1自发布以来进行了两次小更新)。

../pdb_versioned/views/all/coordinates/mmcif/ab/pdb_00001abc/pdb_0001abc/pdb2.0001abc_xyz_v2.cif.gz→../pub/pdb_versioned/data/entries/ab/pdb_0001abc/pdb_00001abc_xyz_v2-0.1if.gz(如果版本2没有发布后的次要更新)