PDB识别码

来自Proteopedia

(重定向自PDB代码)
跳转到:航行,搜索

每个分子模型(原子坐标文件)在中蛋白质数据库(PDB)具有唯一的登录或识别码。这些代码的长度始终为4个字符。第一个字符是1-9范围内的数字,而最后三个字符可以是数字(0-9范围内)或字母(a-Z范围内拉丁字母表). 计划扩展识别码系统,以处理更多条目已宣布.

目录

小写与大写

PDB代码通常以大写形式编写。然而,为了避免将零(0)与字母“O”混淆,小写是有帮助的,例如1点1分比1O1O更清晰,并且2个月比2OU0更清晰。(Proteopedia中大写代码的链接也不起作用!例如,10亿.)根据字体的不同,数字1也可能与大写“I”或小写“L”混淆。所以1亿比1IMO更清晰,但1X9L比1x9升.

Proteopedia中的PDB代码

PDB中的每个发布条目在Proteopedia中都有一个自动生成的页面。要找到它,只需在Proteopedia中这个(以及每个)页面左侧的搜索槽中输入PDB代码。Proteopedia每周更新一次,紧随PDB每周新发布周期之后。要链接到Proteopedia中的PDB代码标题页面,请在wiki文本框中,在代码周围使用双方括号。例如,在编辑Proteopedia文章时键入[[1vot]]会生成链接1/吨.

PDB代码示例

较新的PDB代码是连续的

多年来,模型的存放者可以要求一个可用的PDB代码,该代码代表所代表的分子的缩写。上述所有示例都是这样的情况。随着每周新条目数量的增加,PDB不再允许此选项。近年来,所有PDB代码都是由PDB从可用代码池中按顺序升序分配的,而没有参考分子的名称。

PDB代码与单个结构永久关联

一旦PDB代码被分配给给定的结构,它就永远是这样的,即使在结构被撤回(从数据库中退出)的情况下也是如此,比如3卢或被更新或更正的结构取代,如1次。如果请求被取代结构的页面,如1阿克,Proteopedia将自动显示最新结构2节。请在每页的“结构亮点”部分查找解释。

2017年5月,PDB宣布了版本控制系统的计划。该规定于2019年7月生效[1]。它允许同一条目的多个版本保留单个PDB代码。请参阅在下面.

有限数量的4字符PDB代码

有419904个可能的4字符PDB识别码[2]。如果允许数字“0”作为第一个字符,则可以将其增加到466560[3]因此,2017年年中约有170000个条目(加上撤回和被取代的条目)已用完了近一半的可用代码。大约2027年后[4],需要一个能够容纳更多条目的方案,需要修改在线获取数据的大分子可视化和建模软件程序,所有这些都需要4个字符的PDB代码。请参阅下一节中的扩展系统计划。

扩展PDB代码的未来计划

2017年5月蛋白质数据库宣布计划在2017年晚些时候引入带有版本控制的扩展PDB加入代码[5].新代码的格式为

pdb_00001abc

其中,5个字符“00001”可以分别是数字、0-9,并且3个尾随字符“abc”可以各自是数字或字母。除了将可能的加入码数量从4 x 10增加之外4至>109,这将有助于“对已发表文献中的PDB条目进行文本挖掘检测”[5]PDB还承诺“只要可行wwPDB将继续分配可以无损截断的PDB代码到当前的四字符样式。"[5]当4个字符的代码用完时,新条目将出现在mmCIF格式只是,自从遗产PDB格式将不容纳12个字符的ID。

2024年wwPDB网站计划在2026年推出12个字符的测试版ID档案[4]2024年,wwPDB估计到2029年将使用4个字符的ID[4].

版本控制

随着加入代码的扩展,版本控制系统于2019年年中引入[5][1].

目前,修改了现有发布PDB的原子坐标条目被分配了一个新的登录代码,之前的条目是已废弃。这项长期存在的wwPDB政策与出版物断开联系的后果和前一组原子坐标。。。。[5]

登录的版本将包含在其文件名中,因此:

pdb_00001abc_xyz_v1-2.cif.gz

其中“v1”表示主要版本,“-2”表示次要版本。[5]“xyz”是一个常量,表示原子坐标文件。其他类型的数据文件将来可能会使用相同的PDB加入代码。

PDB条目的文档对象标识符(DOI)

每个PDB条目都可以通过DOI访问例如,6ef8可以作为doi.org/10.2210/pdb6ef8/pdb.

另请参见

工具书类

  1. 1 1.1PDB新闻2019年7月31日:改进您以前发布的坐标并在OneDep中保留您的原始PDB ID
  2. 十个数字加上26个字母=36。第一个字符是1-9。(9)(36) = 419,904.
  3. 2013年4月。据新泽西州罗格斯市RCSB的雷切尔·克莱默·格林(Rachel Kramer Green)表示,没有计划使用以0开头的PDB代码。然而,2017年7月,WWPDB FAQ指出“四字母PDB标识符当前由数字(0-9)后跟3个字母或数字组成”。
  4. 4 4.1 4.2 支持扩展PDB ID格式的资源(PDB_00001abc),《RCSB PDB时事通讯》2024年春季版。
  5. 5 5.1 5.2 5.3 5.4 5.5PDB新闻2017年5月17日:在不更改PDB访问代码和FTP档案的相关更改的情况下修改结构.
个人工具