wwPDB存放政策和wwPDB生物保护程序

A部分:wwPDB存款政策

由wwPDB注释人员编写

2024年4月5.3版

目录

  1. PDB进入要求
  2. 条目作者
  3. PDB条目的发布
  4. PDB ID和配体代码的分配
  5. 条目的更改

前言

本文件概述了wwPDB的注释程序和政策。鉴于处理过程中可能出现的一些问题的复杂性,wwPDB董事/负责人会根据具体情况考虑政策的例外情况。

完整文档中的两个部分是:

  • A: wwPDB存款政策
  • B: wwPDB生物保护程序

有关这些章节的更多信息,请参阅每个章节的简介。

2021年9月:主版本5.0,公开条目PI的联系信息。

1.PDB进入要求

接受PDB条目的要求是什么?

OneDep证词

wwPDB将接受所有通过实验确定的符合最低要求的生物大分子结构。这些要求包括:三维原子坐标、有关结构组成的信息(研究的样品序列、源生物体、分子名称、化学等)、有关所进行实验的信息,结构确定步骤的细节和作者联系信息对于沉积也是必要的。此外,X射线提交需要结构因子或强度数据,核磁共振提交需要限制和化学位移。对于3DEM模型的PDB沉积,必须将体积沉积映射到EMDB。如果存放在模型坐标中的实验数据不遵循传统的处理程序,则应通过提供现有档案为原始实验数据分配的DOI(例如SBGrid公司内部风险管理委员会).

强制性X射线结构因子数据和核磁共振约束数据沉积始于2008年2月1日。强制性核磁共振化学位移数据沉积始于2020年12月6日。强制性EM图体积沉积始于2016年9月5日。

对于由X射线晶体学确定的结构,所有原子必须具有完整的B因子。如果在细化过程中使用TLS,则必须将剩余的B因子转换为完整的B因子。TLS记录中描述的所有原子必须具有相关的ANISOU记录。

有时,wwPDB被要求存档在实验数据沉积成为强制性之前确定的结构,并且实验数据不再可用。没有实验数据很难验证这种结构。

在这种情况下,wwPDB董事/负责人将决定是否可以将结构存放到PDB。接受由实验方法确定但没有实验数据的结构的标准如下:1月1日之前有一份同行评审的出版物标准2008年描述了相应的结构聚合物序列和/或实体没有在PDB档案中表示,或者沉积包括一个或多个配体,目前在PDB化学成分词典中没有表示。

整体结构沉积

生物大分子系统的整体结构是通过结合不同类型的信息来计算的,包括各种实验数据、物理理论、统计偏好和/或先前的模型。实验数据可以通过传统的结构测定方法(即大分子X射线晶体学(MX)、核磁共振(NMR)光谱和三维电子显微镜(3DEM))以及其他生物物理和蛋白质组学方法(如小角散射(SAS)、原子力显微镜(AFM)、,化学交联与质谱联用、Förster共振能量转移(FRET)光谱、电子顺磁共振(EPR)光谱和氢/氘交换(HDX)与质谱或核磁共振光谱联用。

PDB通过PDB-IHM公司(PDB-Dev)系统。可以使用灵活的模型表示来描述集成结构,包括多尺度、多状态和有序模型的集合。除了建模系统的原子和/或粗粒度坐标外,沉积还需要包括起始模型、空间约束、建模协议以及特定元数据信息(例如引文、作者、软件、外部存储库中的相关数据和参考序列信息)。

wwPDB接受哪些类型的实验确定的结构?

自2006年10月15日起,PDB沉积被限制在原子坐标范围内,而原子坐标基本上是由含有生物大分子的实际样品的实验测量确定的1目前,通过X射线晶体学、核磁共振、电子显微镜、中子衍射、粉末衍射和纤维衍射产生的坐标集可以沉积到PDB中,前提是所研究的分子满足最小尺寸要求。

非晶体学对称性(NCS)的使用:
对于晶体结构,即使使用非晶体学对称性(NCS),也应提供完整非对称单元的坐标。唯一的例外是产生高度对称组件的模型(例如病毒、螺旋对称等),其中只有一部分不对称单元用于优化。存款人必须在标准晶体框架中提供模型以及NCS矩阵。

对于显微镜方法,如果需要对称操作符从模型坐标创建完整的生物组装,则必须提供此类操作符。

示例:在PDB条目2wbh中,通过应用_pdbx_struct_oper_list(REMARK 350)记录中提供的60个运算符,从三条沉积链(A、B、C)生成完整的MS2噬菌体衣壳生物组装。2wbh的晶体不对称单元对应于完整衣壳的三分之一,通过应用_struct_NCS_oper(MTRIX)记录中提供的20个NCS操作从三个沉积的链产生。

https://files.wwpdb.org/pub/pdb/data/structures/divided/pdb/wb/pdb2wbh.ent.gz
https://files.wwpdb.org/pub/pdb/data/structures/divided/mmCIF/wb/wbh.cif.gz

纯粹确定的理论模型沉积生物信息学例如,使用同源或从头算方法不再被接受。

之前发布的理论模型或2006年10月15日之前存放的理论模型将继续通过历史模型档案公开,网址为https://files.wwpdb.org/pub/pdb/data/strustructures/models/。

由PDB目前不支持的方法确定的结构将与专家团体协商进行审查,以确定由该方法确定的构筑物原则上是否应被PDB接受。一旦做出这样的决定,将开发一个新的模板,用于从该方法派生的PDB条目。

如何以及在哪里提交实验数据?

所有实验方法的OneDep沉积场地可在以下wwPDB场地获得:

为了沉积额外的核磁共振实验数据,接入点位于:

对于集成结构的沉积,访问PDB-IHM(PDB-Dev)https://pdb-dev.wwpdb.org/deposit.html.

沉积的格式要求是什么?

为确保所有wwPDB和相关沉积工具在数据保真度损失最小的情况下运行,存款人应在支持的情况下,从其精炼程序中输出PDBx/mmCIF格式的文件。A类PDBx/mmCIF准备指南可用。沉积结构的格式要求如下:

坐标和元数据

  • PDBx/mmCIF格式:可以以PDBx/mmCIF交换格式准备存款。定义和字典以HTML、ASCII和XML格式提供(请参阅http://mmcif.wwpdb.org/详细信息)。
  • PDB格式:定义和格式内容指南提供PDF和HTML格式(请参阅http://wwpdb.org/documentation/file-format有关详细信息).

结构因素

约束数据

什么类型的结构可以存放到PDB?

生物分子聚合物,包括满足以下标准的多肽、多核苷酸、多糖及其复合物,是可以接受的:

  • 对于多肽结构
    • 基因产品
    • 起源于非核糖体的天然多肽
    • 较大聚合物(如纤维和淀粉样聚合物)的胃蛋白酶重复单元
    • 聚合物链中至少有24个残基的合成肽(也可接受较小的生物相关寡肽)
  • 多核苷酸结构
    • 四个或更多残留物
  • 多糖结构
    • 四个或更多残留物
不符合上述标准的任何聚合物链中残基少于24个的肽的晶体结构应存放在剑桥晶体数据中心(CCDC,http://www.ccdc.cam.ac.uk/products/csd/deposit/). 此类分子的核磁共振结构应通过小分子结构沉积(SMSdep,http://smsdep.protein.osaka-u.ac.jp/bmrb-adit/)系统。

较小的寡核苷酸(二核苷酸和三核苷酸)的结构可以存放在核酸数据库(NDB,http://ndbserver.rutgers.edu).

不符合这些指南的分子,但之前沉积在PDB中的分子不会被移除。

重新定义的结构可以存放到PDB吗?

基于不同于贡献者的研究小组或实验室生成的数据重新定义的结构,只有在有相关的同行评审出版物描述重新定义结构的详细信息时,才能存放到PDB。

重新定义的条目可以在发布前存放,但在相关的同行评审出版物公开可用之前,不会进行处理(将具有REFI状态)或发布。寄存人必须向世界遗产保护委员会提供相关的出版细节,并留出处理和发布这些条目所需的额外时间。为了便于期刊稿件提交,需要提前处理条目的作者应联系wwPDB,这些条目的处理将根据具体情况进行。

此外,将在pdbx/mmCIF文件中添加一条专用注释(_pdbx_database_remark,id=0),以及原始PDB条目的主要引用(在_ctation下,id=original_data_1)。

有关重新定义的PDB条目注释的详细信息,请访问http://wwpdb.org/documentation/procedure.

2.条目作者

与PDB条目关联的作者有三种类型:条目作者、联系作者和引文作者。

结构确定工作开始的研究小组主管,称为首席研究员(PI)或等效团队负责人,负责最终PDB条目中所代表的作者身份。如果一名以上的PI/同等团队负责人负责进入,他们需要就所有问题达成共同决定。

联系作者

保存时指定的联系人作者负责保存结构,在处理过程中响应wwPDB的任何查询,并指示何时可以发布条目。

至少应指定一名联系人“负责通信”,包括提交数据和回答wwPDB的问题。PI/团队负责人等效人员必须列为联系人作者,并将在所有通信中复制。在某些情况下,可以直接联系PI/团队负责人。存款人有责任正确标记作者角色。

如有任何更改或更改/废弃/删除条目的请求,将通知所有联系人作者。如果Contact Authors之间发生冲突,wwPDB将遵循PI/团队负责人等同级人员的请求,最终由他们做出最终决定。PI/团队负责人等价物是指在PDB条目中指定为PI/团队领导的个人,该条目由联系人作者批准。

条目作者

PI/团队负责人等效人员应作为条目作者。此外,建议将参与PI/团队负责人确定的结构确定的所有人员指定为条目作者。商业实体应包括公司名称以及任何其他相关名称。

条目作者可以与主要引文中列出的作者相同,也可以是引文作者的子集。或者,列出的条目作者可能多于引文作者。

PI/同等团队负责人有责任确保条目作者列表适当,并且所有列出的条目作者已批准数据的最终版本,并同意PDB提交。

对于2021年9月24日起保存或修改的条目,在发布这些条目时,主要研究者的姓名、电子邮件地址和ORCiD id将公开。

引文作者

引文作者是指描述条目的主要出版物上列出的作者。引文作者列表可能与上述条目作者列表不同。

如果条目要作废,则相当于PI/团队负责人的责任是通知论文的相应作者。

作者和重新定义的条目

PDB中可用数据的重新定义必须通过引用重新定义PDB条目中的PDB条目(以及相应的引用,如果可用)来确认原始数据集。在沉积时可以注意到这些信息。重新定义的条目可以在发布前存放,但在相关出版物公开之前不会被处理(将具有REFI状态)或发布。有关更多信息,请参阅wwPDB处理程序文件(第A.9节)。

3.PDB条目的发布

PDB条目的作者请求状态代码是什么?

REL公司一旦作者批准了处理后的文件,条目将立即发布。

HPUB(等待发布应用程序)参赛作品在出版前或自交存之日起一年内被搁置,以先到者为准。

HOLD(保持)条目被搁置一年,从存款之日算起。

PDB条目的发布策略是什么?

REL公司在作者批准处理后的文件后,计划发布条目。如果在向作者提供验证报告后的三周内没有收到回复,世界野生动植物保护局将认为该条目已被作者批准。如果当时没有悬而未决的问题2有了条目,条目将被释放。有关有未决问题的条目,请参阅下面的“问题结构”部分。条目可以在没有引文信息的情况下发布,并在以后使用此信息进行更新。

HPUB/保持条目将在作者或期刊要求发布时发布,或者当wwPDB意识到描述该条目的出版物时发布。

HPUB/保持参赛作品的保存时间不得超过保存日期后的一年。如果条目在保留期结束时仍未发布,则必须发布或撤销。在宣誓作证十个月后,wwPDB将与未发布条目的作者进行沟通,询问他们是否希望在宣誓作证一周年前发布或撤回条目。

一旦wwPDB了解到描述PDB条目的出版物(电子版或印刷版,以较早发布的为准),wwPDC将不会延迟发布或允许撤回该条目。发布后对PDB条目的任何修订都将在PDB档案版本管理系统下进行管理-请参阅“发布后可以进行哪些更改?'了解更多详细信息。

wwPDB从作者、一些期刊和用户社区接收出版日期和引文信息。此外,wwPDB还扫描文献中的出版物。虽然wwPDB尽一切努力及时跟踪引文和发布条目,但作者最终有责任在发布时通知wwPDB。提交给公共预印本档案馆的文件被视为出版物。

通常情况下,作者在发布前审查和批准策划的条目。如果联系作者在向其提供验证报告后的三周内没有回复,并且假设沉积没有任何悬而未决的问题,wwPDB将认为该条目已经作者批准。当wwPDB知道描述该条目的出版物可用时,将发布该条目。有未决问题的条目将按照下面的问题结构部分进行处理。

作者可以撤回未发布的作品,前提是引用该作品的出版物尚未出版。撤回条目时,将向作者提供已处理文件的最新版本,以备将来重新存储条目时使用。撤回的条目将保留在PDB存档的未发布条目列表中(状态西部数据编号).

问题结构如世界野生动植物保护局生物化工作人员所确定或世界野生动生物保护局验证报告的内容所述,将与作者进行讨论,以解决诸如异常结构化学、遥远的水分子、长/短共价键、某些序列错配或其他冲突等问题。无法解决这些问题的条目将在为期一年的封存期满后被撤回,除非有描述该条目的出版物。在这种情况下,该条目将由wwPDB工作人员发布,并带有数据库_PDB_caveat记录。如果文献中出现描述最近撤回的条目的出版物,则wwPDB可能会撤销条目的撤回状态(由wwPDB工作人员确定)。

实验数据可以与坐标文件分开发布吗?

坐标和实验数据共享相同的发布状态(REL、HPUB或HOLD)。因此,坐标和实验数据文件只能同时发布。

申请发布参赛作品的截止日期是什么?

PDB条目由wwPDB成员(RCSB-PDB、PDBe和PDBj)处理。它们要么在相应论文发表时立即发布(REL),要么在特定日期发布(HOLD)。

每周,所有计划发布或修订的文件都要接受最终数据完整性检查。在准备发布参赛作品时,可能会要求联系作者解决出现的问题。

当要求发布HPUB结构时,wwPDB工作人员会定期检查主要引文。为了包含在即将到来的更新中,任何所需的作者通信都应在周四中午12:00之前(处理地点的当地时间)发送给相应的wwPDB成员。有时,在某些情况下,请求截止日期可能会更改。在这些截止时间之后收到的请求将在稍后的更新周期中处理。

存款人应通过相关存款中的网络通信联系wwPDB,而普通PDB用户应通过deposit-help@mail.wwpdb.org关于发布和/或发布。

所有为发布设置的条目都被传输到RCSB-PDB(当前的档案保管人),以便最终打包到主PDB ftp档案中。每周将数据条目添加到PDB档案中,并在RCSB-PDB、PDBe和PDBj的FTP站点之间进行同步。

每周发布PDB存档数据的过程,以及咨询委员会发送至全球蛋白质数据库,如下所示:

第一阶段:每个星期六UTC 3:00,对于每个新条目,将从wwPDB网站上提供以下信息:每个不同聚合物的序列(氨基酸或核苷酸),以及在适当情况下,每个不同配体的InChI字符串和结晶pH值。

第二阶段:每周三00:00 UTC后,所有新的和修改的数据条目都将在每个wwPDB FTP站点上更新。

修订日期(数据库_数据库_版本日期,pdbx版本)修订日期表示条目的发布日期。修订日期将设置为预定发布日期,即周三。

谁有权访问未发布的数据?

未发布的坐标集仅分发给该条目的作者。期刊提交的审阅者可能无法从wwPDB获取未发布的坐标集。wwPDB强烈鼓励期刊编辑和审稿人在稿件提交和审查过程中要求作者提交wwPDP验证报告。

未发布条目有哪些可用信息?

PDB档案中未发布的条目包含标题、作者、状态、PDB ID、实验数据状态和序列可用性。根据联系人作者的要求,条目标题和作者身份可能会被禁止,但状态和PDB ID不能公开禁止。

4.PDB ID和配体代码的分配

可以请求PDB ID或配体代码吗?

既不能请求单个PDB ID/配体代码,也不能请求一系列PDB ID/配体代码。wwPDB保留更改作者配体代码的权利。PDB ID和配体代码是自动分配的,不携带识别信息。

何时分配PDB ID?

当作者完成其证词后(即作者至少填写了证词的最低信息并按下了证词和确认按钮),证词软件工具会自动分配PDB ID

5.条目更改

发布前可以进行哪些更改?

作者可以在发布之前随时更新坐标、实验数据和相关标题信息。

如果存款人在电子或纸质出版物发布前不久或发布时发送新的条目坐标,条目的发布可能会延迟,因为文件必须重新处理。

一旦条目标记为发布,作者必须在上述截止时间(见第3节,请求发布条目的截止时间)之前提交修订或请求不发布条目。

发布后可以进行哪些更改?

次要更改可以进行。这些定义为:

  • 更新元数据部分,如引文、作者姓名等。
  • 在坐标保持不变的情况下,由于格式更正或添加数据集,对结构因子或约束文件进行更新或更改。

重大变更可以通过存款人启动或wwPDB启动的更新来调整改变结构几何形状或化学成分的坐标(例如聚合物序列或配体身份的改变)。主要修订包括:

  • 替换任何现有坐标(x、y、z值本身)。
  • 化学成分的变化(例如SO4PO4或SERCYS)。
  • 坐标部分的变化,包括链ID、编号、原子名称、分子和/或配体的顺序。
  • 更改样本序列,包括添加或删除坐标中未观察到的区域,例如端子或循环区域。

存款人启动或wwPDB启动的坐标更新将进行版本控制,同时保留相同的PDB加入代码。条目将立即处理和发布。

如果实验数据发生变化(这些数据是新的,或以某种方式进行了修改),则必须用需要新PDB ID的新存款来替换条目。然后,旧条目被废弃(如果存款人愿意),并被新条目替换(取代)。

过时的条目通过ftp存档向公众开放。通过主web搜索界面搜索过时结构的用户将自动重定向到替代条目。在任何情况下都不能撤回已释放的结构。

在一些罕见的情况下,过时的结构不会被新结构取代。该条目必须包含一条语句,指定废弃该结构的原因(在_pdbx_database_PDB_obs_spr.details下)。

  • 出版物已收回。如果日记账要求,相关的PDB条目将作废。如果没有收到请求,wwPDB将尽最大努力联系存款人、合著者、(前)PI、期刊编辑等,当他们知道撤销时。如果撤回的原因是相关的PDB条目需要作废,则wwPDB将作废该条目。过时条目中的引文是已发表期刊的撤回。
  • 没有相关的出版物,条目作者废弃了条目(例如,结构不正确)。
  • 第三方(如雇主)要求将条目作废(例如,在渎职的情况下)。在这种情况下,如果该结构的主要引文被撤回,或者该地区适当的政府或超国家机构(如美国研究诚信办公室)发布了正式报告,wwPDB将淘汰该条目。

wwPDB修复

wwPDB定期审查整个存档,并根据需要修正PDB数据。坐标本身永远不会改变,但元数据和术语可能会发生变化,以确保文件中的一致性和一致性。wwPDB网站上的公共文档中描述了更改的性质。在全球补救的情况下,不会联系个别作者。在每个文件的_pdbx_version mmCIF类别中分配并记录一个版本号。旧版本作为FTP站点上的快照进行维护。



1H.M.Berman、S.K.Burley、W.Chiu、A.Sali、A.Adzhubei、P.E.Bourne、S.H.Bryant、J.Roland L.Dunbrack、K.Fidelis、J.Frank、A.Godzik、K.Henrick、A.Joachimiak、B.Heymann、D.Jones、J.L.Markley、J.Moult、G.T.Montelione、C.Orengo、M.G.Rossmann、B.Rost、H.Saibil、T.Schwede、D.M.Standley和J.D.Westbrook(2006)生物大分子结构模型归档研讨会的成果。结构.14: 1211-1217

2注:注释过程中出现的任何阻碍提交标准处理的问题都被视为未决问题。例如,这些可能包括不寻常的几何和立体化学、序列相关问题、溶剂结构等等。