跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
核酸研究。2000年1月1日;28(1): 235–242.
数字对象标识:10.1093/nar/28.1.235年10月10日
预防性维修识别码:PMC102472项目经理
PMID:10592235

蛋白质数据库

摘要

蛋白质数据库(PDB;网址:http://www.rcsb.org/pdb/)是全球唯一的生物大分子结构数据档案。本文描述了PDB的目标、数据存储和访问的现有系统、如何获取更多信息以及资源未来开发的近期计划。

简介

蛋白质数据库(PDB)成立于布鲁克海文国家实验室(BNL)(1)1971年作为生物大分子晶体结构的档案。起初,档案馆有七座建筑,每年都会有少量建筑被保存下来。20世纪80年代,沉积构造的数量开始急剧增加。这是因为结晶过程各个方面的技术得到了改进,增加了核磁共振(NMR)方法确定的结构,以及社区对数据共享的看法发生了变化。到20世纪90年代初,大多数期刊都要求PDB加入代码,并且至少有一个资助机构(国家普通医学科学研究所)采用了国际结晶学联合会(IUCr)发布的指南,要求对所有结构进行数据沉积。

多年来,由于技术的改进,PDB数据的访问模式发生了变化,特别是WWW取代了仅通过磁性介质进行分发的可用性。此外,分析各种数据集的需要需要开发现代数据管理系统。

PDB的最初使用仅限于参与结构研究的少数专家组。如今,PDB储户在X射线晶体结构测定、核磁共振、冷冻电子显微镜和理论建模技术方面拥有不同的专业知识。用户是一个由生物、化学和计算机科学家、教育工作者以及各级学生组成的多元化研究群体。结构基因组学倡议很快将推动数据的大量涌入,以及人们对数据在理解生物功能方面的价值的日益认识,需要新的方法来收集、组织和分发数据。

1998年10月,PDB的管理成为结构生物信息学研究合作实验室(RCSB)的责任。一般来说,RCSB的愿景是创建一种基于最现代技术的资源,以促进结构数据的使用和分析,从而为生物研究创造有利资源。特别是在本文中,我们描述了RCSB对PDB数据进行数据存储、数据处理和数据分发的当前程序。此外,我们还解决了数据一致性问题。最后,我们介绍了PDB的一些最新发展。

数据采集和处理

创建公共信息档案的一个关键组成部分是数据数据处理的有效捕获和管理。数据处理包括数据沉积、注释和验证。这些步骤是图中所示的完整记录和集成数据处理系统的一部分图11.

保存图片、插图等的外部文件。对象名称为gkd09001.jpg

PDB数据处理的步骤。椭圆表示动作,矩形定义内容。

在当前系统中(图。(图2),2)数据(原子坐标、结构因子和核磁共振约束)可以通过电子邮件或AutoDep输入工具(ADIT;http://pdb.rutgers。edu/adit/)由RCSB开发。ADIT也用于处理条目,它建立在mmCIF字典之上,该字典包含1700个术语,用于定义大分子结构和晶体学实验(2,)以及一个名为MAXIT(MAcromollecular EXchange Input Tool)的数据处理程序。该集成系统有助于确保提交的数据与mmCIF字典一致,该字典定义了数据类型,尽可能枚举了允许值的范围,并描述了数据值之间的允许关系。

保存图片、插图等的外部文件。对象名称为gkd09002.jpg

PDB数据处理系统的集成工具。

使用ADIT放置结构后,PDB标识符会自动立即发送给作者(图。(图1,1,步骤1)。这是有关结构的信息加载到内部核心数据库的第一个阶段(请参阅PDB数据库资源部分)。然后按照下面的验证部分所述对条目进行注释。此过程涉及使用ADIT来帮助诊断文件中的错误或不一致。将出现在PDB资源中的完整注释条目连同验证信息一起发送回存款人(步骤2)。审阅处理过的文件后,作者发送所有修订(步骤3)。根据这些修订的性质,可以重复步骤2和3。一旦收到作者的批准(步骤4),内部核心数据库中的条目和表就可以分发了。这个核心数据库的模式是mmCIF字典指定的概念模式的子集。

数据处理的所有方面,包括与作者的通信,都记录并存储在通信档案中。这使得PDB工作人员能够检索有关沉积过程任何方面的信息,并密切监控PDB操作的效率。

当前状态信息由作者列表、标题和发布类别组成,存储在核心数据库中的每个条目中,可通过WWW界面进行查询(http://www.rcsb.org/pdb/status.html ). 发布前的条目分为“处理中”(PROC)、“储户审查中”(WAIT)、“在发布前保留”(HPUB)或“在储户指定日期之前保留”(hold)。

PDB收集的数据内容

PDB从存款人处收集的所有数据都被视为主要数据。除坐标外,主要数据还包含所有沉积结构所需的一般信息以及结构确定方法的特定信息。表11包含PDB为所有结构收集的一般信息以及为X射线方法确定的结构收集的附加信息。核磁共振结构所列的其他项目来自国际纯粹化学和应用化学联合会(IUPAC)的建议(4)并将在不久的将来实施。

表1。

PDB中的数据内容
保存图片、插图等的外部文件。对象名为gkd090t01.jpg

随着数据收集、结构确定和细化的新方法的发展和进步,存款人提交的数据的信息内容可能会发生变化。此外,随着结构确定和优化软件生成必要的数据项作为其输出的一部分,捕获这些数据的方式可能会发生变化。ADIT是PDB的数据输入系统,其设计便于将这些可能的更改合并。

验证

验证是指评估沉积原子模型的质量(结构验证)以及评估这些模型与实验数据的拟合程度(实验验证)的程序。PDB使用公认的社区标准验证结构,作为ADIT集成数据处理系统的一部分。进行以下检查,并在直接传达给存款人的信函中进行总结:

共价键距离和角度将蛋白质与Engh和Huber的标准值进行比较(5); 将核酸碱基与克洛尼的标准值进行比较等。(6); 糖和磷酸盐与Gelbin的标准值进行比较. (7).

立体化学验证检查蛋白质和核酸的所有手性中心的立体化学是否正确。

原子命名法检查所有原子的命名是否符合IUPAC标准(8)并在必要时进行调整。

密切联系人计算了晶体结构不对称单元内所有原子与核磁共振结构唯一分子之间的距离。对于晶体结构,还检查了对称性相关分子之间的接触。

配体和原子命名法.残留物和原子命名法与PDB字典进行了比较(ftp://ftp.rcsb。org/pub/pdb/data/单体/het_dictionary.txt)用于所有配体以及标准残基和碱。未识别的配体基团被标记,已知配体中的任何差异都被列为多余或缺失的原子。

序列比较将PDB SEQRES记录中给出的序列与从坐标记录中导出的序列进行比较。此信息显示在表格中,其中标记了任何差异或缺失的残留物。在结构处理期间,检查DBREF和SEQADV提供的序列数据库参考的准确性。如果未给出参考,则为BLAST(9)搜索用于查找最佳匹配。PDB SEQRES记录和从坐标记录导出的序列之间的任何冲突都可以通过与各种序列数据库进行比较来解决。

遥远的水域计算了不对称单元中大分子、配体和溶剂的所有水-氧原子和所有极性原子(氧和氮)之间的距离。使用晶体对称性重新定位远处的溶剂原子,使其落在大分子的溶剂化范围内。

在几乎所有情况下,通过这些检查发现的严重错误都会通过注释和与作者的通信进行纠正。

也可以在存放构筑物之前对其进行这些验证检查。验证服务器(http://pdb.rutgers.edu/validate/)已用于此目的。除了摘要报告信函外,服务器还提供PROCHECK的输出(10)、NUCheck(罗格斯大学,1998)和SFCHECK(11). 还制作了摘要地图集页面和分子图形。

PDB将持续审查使用的检查方法,并将整合PDB和科学界成员开发的新程序。

其他数据存储中心

PDB正在与其他小组合作建立沉积中心。这使其他站点的用户可以更轻松地通过互联网存储数据。由于最终存档必须保持一致,因此最终文件的内容和格式以及用于检查它们的方法必须相同。目前,欧洲生物信息学研究所(EBI)处理通过AutoDep提交给他们的数据(http://autodep.ebi.ac.uk/ ). 处理完这些数据后,将以PDB格式发送给RCSB,以纳入中央档案。在安装该系统之前,对其进行了测试,以确保PDB存档中的条目之间的一致性。未来,将使用通用交换字典以mmCIF格式交换数据,该字典以及标准化的注释程序将确保档案数据的高度一致性。EBI沉积和处理的结构约占所有沉积数据的20%。

日本大阪大学蛋白质研究所的ADIT网站也将很快提供数据存储。首先,存放在该场地的构筑物将由PDB工作人员处理。大阪的工作人员将及时完成这些条目的数据处理,并将文件发送给PDB进行发布。

核磁共振数据

PDB工作人员认识到NMR数据需要特殊的开发工作。从历史上看,这些数据已被修改为围绕晶体学信息定义的PDB格式。作为改善这种情况的第一步,PDB对当前的核磁共振数据进行了广泛评估,并将其结果提交给由核磁共振研究人员组成的特别工作组。PDB正在与该小组BioMagResBank(BMRB)合作(12)以及NMR社区的其他成员,开发一个NMR数据字典以及针对NMR结构的沉积和验证工具。本词典除其他项目外,还包含溶液组件的描述、实验条件、所用仪器的枚举列表以及有关结构优化的信息。

数据处理统计

RCSB于1999年1月27日开始对PDB条目进行生产处理。从沉积到完成数据处理(包括作者互动)的中间时间不到10天。具有HOLD发布状态的结构物数量保持在所有提交物的22%左右;28%在出版前持有;50%在处理后立即释放。

当RCSB全面负责时,大约有900个结构尚未完全处理。这些结构包括所谓的第1层结构,这些结构已由计算机软件处理,但尚未完全注释。所有这些结构现在都已经过处理,并在作者审查后发布。

PDB中结构类型的分解如表所示表2。2截至1999年9月14日,PDB包含10714个公共可访问结构,另有1169个条目被搁置。其中,8789(82%)通过X射线方法测定,1692(16%)通过核磁共振测定,233(2%)是理论模型。总的来说,35%的条目保存了实验数据。

表2。

PDB中的数据统计
保存图片、插图等的外部文件。对象名称为gkd090t02.jpg

数据一致性

PDB的一个关键目标是使归档尽可能一致且无错误。所有当前的证词在发布之前都要经过工作人员的仔细审查。从内部数据处理数据库生成特征表并进行检查。作者和PDB用户发布后发现的错误将尽快解决。条目的更正和更新应发送至存款@rcsb。rutgers.edu,用于实施更改并重新发布到PDB存档中。

PDB现在面临的最困难的问题之一是遗留文件不统一。从历史上看,现有数据(“遗留数据”)符合几种不同的PDB格式,并且不同格式中不同结构的相同特征描述方式存在差异。PDB的高级查询功能的引入使得加速这些数据的数据一致性过程变得至关重要。我们现在所处的阶段是,查询功能超过了底层数据的质量。目前正在以两种方式处理数据统一性项目。正在使用ADIT对单个结构的族进行重新处理。将数据文件处理为类似结构的组的策略有助于注释器应用生物知识。此外,我们正在检查档案中所有条目的特定记录。例如,我们最近完成了对PDB中所有配体的化学描述的检查和更正。这些更正正在数据库中输入。这样做的实际结果是,很快就可以准确地找到PDB中与特定配体或配体类型结合的所有结构。除了PDB努力纠正旧条目外,EBI还纠正了PDB中的许多记录,作为其“清理”项目的一部分。整合两个站点所做的所有这些更正的任务非常艰巨,必须有一个定义明确的交换格式来完成这项工作;为此,将使用mmCIF。

PDB数据库资源

数据库体系结构

认识到没有一个单一的体系结构能够充分表达和有效地提供PDB的信息内容,因此创建了一个存储和组织结构数据的异构数据库集成系统。目前有五个主要部件(图。(图3):

保存图片、插图等的外部文件。对象名称为gkd09003.jpg

PDB的集成查询接口。

•Sybase管理的核心关系数据库(Sybase SQL server release 11.0,Emeryville,CA)为表中描述的主要实验数据和坐标数据提供了中央物理存储表1。1。核心PDB关系数据库包含以表格形式存储的所有信息,可以跨任意数量的结构访问这些信息。

•最终管理的数据文件(PDB和mmCIF格式)和数据字典是存档数据,并以ASCII文件的形式存在于ftp存档中。

•基于POM(属性对象模型)的数据库,由包含本机(例如原子坐标)和派生属性(例如计算的二级结构赋值和属性配置文件)的索引对象组成。有些性质不需要推导,例如B因子;其他必须衍生,例如,每个氨基酸残基的暴露(13)或Cα接触图。需要大量计算时间的属性,例如结构邻居(14),是在数据库增加时预先计算的,以节省大量的用户访问时间。

•生物大分子结晶数据库(BMCD;15)在Sybase中组织为一个关系数据库,包含三大类文献衍生信息:大分子、晶体和摘要数据。

•Netscape LDAP服务器用于以结构化格式对PDB的文本内容进行索引,并为关键字搜索提供支持。

底层物理数据库的复杂性对用户来说是透明的,这一点至关重要。在当前的实现中,数据库之间的通信是使用公共网关接口(CGI)完成的。集成的Web界面将查询分派到适当的数据库,然后由数据库执行查询。每个数据库都返回满足查询的PDB标识符,CGI程序将集成结果。通过重复该过程并让接口程序对查询结果集合执行适当的布尔操作,可以执行复杂的查询。然后,各种输出选项可用于选定结构的最终列表。

CGI方法[以及未来基于CORBA(Common Object Request Broker Architecture)的方法]将允许其他数据库集成到此系统中,例如不同蛋白质家族的扩展数据。同样的方法也可以应用于包括BMRB中发现的NMR数据或其他社区数据库中发现的数据。

数据库查询

PDB中的数据查询有三个不同的查询接口:状态查询(http://www.rcsb.org/pdb/status.html),SearchLite(http://www.rcsb.org/pdb/searchlite.html)和搜索字段(http://www.rscb.org/pdb/queryForm.cgi ). 表3总结了PDB当前的查询和分析功能。图44说明了各种查询选项的组织方式。

保存图片、插图等的外部文件。对象名称为gkd09004.jpg

PDB可用的各种查询选项。

表3。

PDB的当前查询功能
保存图片、插图等的外部文件。对象名称为gkd090t03.jpg

SearchLite于1999年2月推出,它为关键字搜索提供了一个单一的表单字段。PDB文件中的所有文本信息以及日期和一些实验数据都可以通过简单或结构化查询访问。SearchFields自1999年5月开始使用,是一种可定制的查询表单,允许搜索许多不同的数据项,包括化合物、引文作者、序列(通过FASTA搜索;16)以及释放或沉积日期。

两个用户界面为SearchLite或SearchFields查询的结果集提供了大量信息。“查询结果浏览器”界面允许访问一些一般信息、表格格式的更详细信息,并可以下载由多个PDB条目组成的结果集的整套数据文件。“Structure Explorer”界面提供了有关单个结构的信息以及与许多外部资源的交联,用于高分子结构数据(表(表4)。4). 这两个接口都可以通过下面描述的简单CGI应用程序编程接口(API)访问其他数据资源网址:http://www。rcsb.org/pdb/linking.html

表4。

与PDB当前提供的其他数据资源的静态链接
保存图片、插图等的外部文件。对象名称为gkd090t04.jpg

自1999年2月首次引入该系统以来,网站使用量急剧攀升(表(表5)。5). 截至1999年11月1日,PDB主站点平均每秒收到一次以上的点击,每分钟收到一次以上的查询。

表5。

主要RCSB站点的Web查询统计信息(网址:http://www.rcsb.org )
保存图片、插图等的外部文件。对象名称为gkd090t05.jpg

数据分发

PDB分发坐标数据、结构因子文件和NMR约束文件。此外,它还提供文档和衍生数据。坐标数据以PDB和mmCIF格式分布。目前,PDB文件是作为数据注释的最终产品创建的;pdb2cif程序(17)用于生成mmCIF数据。此程序用于容纳遗留数据。将来,将分发在数据注释期间创建的mmCIF和PDB格式文件。

数据通过以下方式分发给社区:

•来自UCSD、罗格斯大学和NIST的主要PDB网站和ftp网站,每周更新一次。

•从包含每周更新的所有数据库、数据文件、文档和查询界面的完整的基于Web的镜像站点。

•仅从包含数据文件完整或子集副本的ftp镜像站点,按镜像站点定义的时间间隔进行更新。中描述了创建仅ftp镜像站点所需的步骤http://www.rcsb.org/pdb/ftproc.final.html

•季度CD-ROM。

每周分发一次数据。新数据将于每周三太平洋标准时间凌晨1点正式发布。这遵循了BNL开发的传统,并将过渡对现有镜像站点的影响降至最低。自1999年5月以来,提供了两份ftp档案:网址://ftp.rcsb.org所有PDB数据、软件和文档的重新组织和更合理的组织;ftp://bnlarchive.rcsb.org网站是原始BNL存档的几乎相同的副本,为了向后兼容而进行维护。RCSB型PDB反射镜已在日本(大阪大学)、新加坡(国立大学医院)和英国(剑桥晶体数据中心)建立。计划要求在巴西、澳大利亚、加拿大、德国,可能还有印度使用镜子。

RCSB发行的第一张PDB CD-ROM包含1999年6月30日在PDB中发现的坐标文件、实验数据、软件和文档。数据当前使用压缩实用程序gzip作为压缩文件分发。请参阅http://www.rcsb.org/pdb/cdrom.html有关如何订购CD-ROM套件的详细信息。目前这项服务不收费。

数据存档

PDB正在建立一个中央主归档设施。主档案计划基于五个目标:在发生重大灾难时重建当前档案;在特定日期存在的PDB内容重复;保存软件、衍生数据、辅助数据和所有其他计算机化和打印信息;所有沉积和PDB生产资源的自动存档;和维护PDB通信档案,记录沉积的所有方面。在过渡期间,包括电子媒体和硬拷贝材料在内的所有实物材料都进行了清点和储存,并正在编目。

传统BNL系统的维护

PDB的目标之一是提供从BNL系统到新系统的平稳过渡。因此,由BNL开发的AutoDep(18)对于数据沉积,已被移植到RCSB现场,使存款人能够完成正在进行的沉积以及进行新的沉积。此外,息税前利润使用AutoDep接受数据。同样,BNL开发的用于数据查询和分发的程序(PDBLite、3DBbrowser等)也由剩余的BNL样式镜像进行维护。RCSB以这些镜像可用的形式提供数据。最后,BNL ftp档案的样式和格式保持在ftp://bnlarchive文件。rcsb.org网站

许多资源和程序依赖于它们与PDB的链接。为了消除这些服务中断的风险,在BNL于1999年6月30日关闭运营后,使用RCSB和BNL员工联合实施的网络重定向,BNL与PDB的链接自动重定向至RCSB。虽然将保持此重定向,但建议链接到PDB的外部资源更改http://www.pdb.bnl.gov网站/网址:http://www.rcsb.org/

当前的发展

在接下来的几个月里,PDB计划继续改进和发展数据处理的各个方面。存款将变得更容易,注释将更加自动化。此外,将提供用于数据沉积和验证的软件供实验室使用。

PDB还将继续开发在数据库之间交换信息的方法。PDB正在领导对象管理组生命科学倡议的工作,为大分子结构数据的表示定义CORBA接口定义。这是根据严格程序制定的标准,以确保各学术和工业研究团体成员的最大投入。在这个阶段,接口定义的建议,包括使用标准的工作原型,正在被接受。有关更多详细信息,请参阅http://www.omg.org/cgi-bin/doc?lifesci/ 99-08-15 . 最终确定的标准界面将促进结构信息的查询和交换,不仅是在完整结构层次上,而且在更精细的细节层次上。PDB提出的标准将严格符合mmCIF标准。众所周知,需要其他形式的数据表示,例如使用可扩展标记语言(XML)。PDB将继续使用mmCIF作为底层标准,根据社区的需求,可以从中生成CORBA和XML表示。

PDB还将开发通过网络与广大PDB用户社区进行通信的手段和方法。到目前为止,我们已经开发了原型蛋白质纪录片(19)探索这种描述蛋白质结构-功能关系的新介质。还可以开发使用最新Web浏览器运行的教育材料(20).

最后,人们认识到,公共领域和私人领域都存在结构。为此,我们计划提供一部分数据库工具供本地使用。用户将能够加载公共和专有数据,并使用PDB资源中使用的相同搜索和探索工具。

PDB并不是孤立存在的,而是每个结构代表了从识别开放阅读框架到充分理解该分子的单一或多种生物功能的作用的信息光谱中的一个点。此频谱上存在的可用信息随时间而变化。认识到这一点,PDB开发了一个方案,用于动态更新每个结构上的各种链接,以链接到互联网上可以自动定位的任何其他内容。这些信息本身存储在数据库中,可以查询。这一功能将在未来几个月内出现,以补充现有的静态链接列表中的一小部分更为知名的相关互联网资源。

PDB咨询委员会

PDB有几个咨询委员会。RCSB的每个成员机构都有自己的本地PDB咨询委员会。每个机构都负责执行这些委员会的建议以及国际咨询委员会的建议。最初,RCSB向BNL之前召集的咨询委员会提交了一份报告。根据他们的建议,已经联系了一个新的委员会,其中包括前任成员和新成员。目标是让董事会准确反映存款人和用户群体,从而包括来自多个学科的专家。

严重的政策问题提交给主要的科学学会,尤其是国际自然科学联合会。目标是根据广泛的国际专家团体的意见作出决定。IUCr维护mmCIF字典作为PDB构建的数据标准。

更多信息

PDB试图通过每周网站新闻更新、季度通讯和即将启动的年度报告,让社区了解新的发展。用户可以通过向以下地址发送邮件随时请求信息info@rcsb。组织。最后pdb-l@rcsb.orglistserver为讨论PDB相关问题提供了一个社区论坛。可能影响社区的PDB操作更改(例如,数据格式更改)发布在此处,用户有60天的时间讨论问题,然后才能根据主要共识进行更改。表66指示如何访问这些资源。

表6。

PDB信息源
保存图片、插图等的外部文件。对象名称为gkd090t06.jpg

结论

这是一个激动人心、充满挑战的时代,需要负责收集、管理和分发大分子结构数据。自RCSB于1999年2月承担数据沉积责任以来,沉积的数量平均约为每周50次。然而,随着世界范围内大量结构基因组学倡议的出现,这一数字可能会增加。我们估计,PDB在本文中包含大约10500个结构,在未来5年内,其规模可能会增加三倍或四倍。这对在保持高质量的同时及时分发提出了挑战。PDB使用现代数据管理实践的方法应允许我们进行扩展以适应大量数据涌入。

PDB的维护和进一步发展是社区的努力。其他人分享想法、软件和数据的意愿为无法获得的资源提供了深度。其中一些努力在下文中得到了认可。不断寻求新的意见,PDB邀请您随时通过发送电子邮件至info@rcsb.org

致谢

结构生物信息学研究合作实验室(RCSB)是一个由三个机构组成的联盟:罗格斯大学、圣地亚哥加州大学圣地亚哥超级计算机中心和国家标准与技术研究所。目前的RCSB PDB工作人员包括作者和Kyle Burkhardt、Anke Gelbin、Michael Huang、Shri Jain、Rachel Kramer、Nate Macapagal、Victoria Colphrome、Bohdan Schneider、Kata Schneideer、Christine Zardecki(罗格斯大学);Phoebe Fagan、Diane Hancock、Narmada Thanki、Michael Tung、Greg Vasquez(NIST);彼得·阿兹伯格(Peter Arzberger)、约翰·巴杰(John Badger)、道格拉斯·格里尔(Douglas S.Greer)、迈克尔·格里布斯科夫(Michael Gribskov)、约翰·科瓦尔斯基(John Kowalski)、格伦·奥特罗(Glen Otero)、肖恩·斯特兰德(Shawn Strande)、林恩·腾·艾克(Lynn。感谢Ken Breslauer(罗格斯大学)、John Rumble(NIST)和Sid Karin(SDSC)的持续支持。目前为PDB的未来发展做出贡献的合作者包括BioMagResBank、剑桥晶体学数据中心、HIV蛋白酶数据库组、大阪大学蛋白质研究所、国家生物技术信息中心、ReLiBase开发人员和瑞士生物信息学研究所/Glaso。我们特别感谢EBI的金·亨里克(Kim Henrick)和NCBI的史蒂夫·布莱恩特(Steve Bryant)审阅了我们的文件并发回了建设性的批评。这有助于PDB不断改进其生成条目的程序。感谢BNL PDB员工的合作。本文的部分内容将出现在《国际结晶学表》第F卷中。这项工作得到了国家科学基金会、能源部生物和环境研究办公室以及国家卫生研究院的两个单位(国家普通医学科学研究所和国家医学研究所)的资助。

参考文献

1Bernstein F.C.、Koetzle T.F.、Williams G.J.、Meyer E.E.、Brice M.D.、Rodgers J.R.、Kennard O.、Shimanouchi T.和Tasumi M.(1977)分子生物学杂志。,112, 535–542. [公共医学][谷歌学者]
2Bourne P.、Berman,H.M.、Watenpaugh,K.、Westbrook,J.D.和Fitzgerald,P.M.D.(1997)方法酶制剂。,277,571–590。[公共医学][谷歌学者]
三。Westbrook J.和Bourne,P.E.(2000)生物信息学,正在印刷中。[谷歌学者]
4Markley J.L.、Bax,A.、Arata,Y.、Hilbers,C.W.、Kaptein,R.、Sykes,B.D.、Wright,P.E.和Wüthrich,K.(1998)《生物分子杂志》。核磁共振,12, 1–23. [公共医学][谷歌学者]
5Engh R.A.和Huber,R.(1991)晶体学报.,A47, 392–400.[谷歌学者]
6Clowney L.、Jain,S.C.、Srinivasan,A.R.、Westbrook,J.、Olson,W.K.和Berman,H.M.(1996)美国化学杂志。Soc公司。,118第509页至第518页。[谷歌学者]
7Gelbin A.,Schneider,B.,Clowney,L.,Hsieh,S.-H.,Olson,W.K.和Berman,H.M.(1996)美国化学杂志。Soc公司。,118, 519–528.[谷歌学者]
8IUPAC–IUB生物化学命名联合委员会(1983年)欧洲生物化学杂志.,131, 9–15. [公共医学][谷歌学者]
9张。J.、Cousens,L.S.、Barr,P.J.和Sprang,S.R.(1991)程序。国家科学院。科学。美国,88, 3346–3450.[谷歌学者]
10拉斯科夫斯基R.A.、麦克阿瑟M.W.、莫斯D.S.和桑顿J.M.(1993)J.应用。Crystalogr公司.,26, 283–291.[谷歌学者]
11Vaguine A.A.、Richelle,J.和Wodak,S.J.(1999)《水晶学报》。,D55, 191–205. [公共医学][谷歌学者]
12Ulrich E.L.、Markley、J.L和Kyogoku,Y.(1989)蛋白质序列。数据分析。,2,23–37。[公共医学][谷歌学者]
13Lee B.和Richards,F.M.(1971)分子生物学杂志。,55, 379–400. [公共医学][谷歌学者]
14Shindyalov I.N.和Bourne,P.E.(1998年)蛋白质工程。,11, 739–747. [公共医学][谷歌学者]
15Gilliland G.L.(1988)J.克里斯特。增长,90, 51–59.[谷歌学者]
16Pearson W.R.和Lipman,D.J.(1988)程序。美国国家科学院。科学。美国,24, 2444–2448.[PMC免费文章][公共医学][谷歌学者]
17伯恩斯坦·H.J.、伯恩斯坦、F.C.和伯恩·P.E.(1998)J.应用。Crystalogr公司.,31, 282–295.[谷歌学者]
18实验室B.N.(1998)AutoDep,2.1版。纽约州厄普顿。
19Quinn G.、Taylor,A.、Wang,H.-P.和Bourne,P.E.(1999)生物化学趋势。科学。,24, 321–324. [公共医学][谷歌学者]
20Quinn G.,Wang,H.-P.,Martinez,D.和Bourne,P.E.(1999)太平洋交响乐团。生物成分., 380–391. [公共医学]
21Siddiqui A.和Barton,G.(1996)《蛋白质工程展望》,1996年,第2期(CD-ROM版;Geisow,M.J.编辑),BIODIGM Ltd(英国)。国际标准图书编号0-9529015-0-1。
22Orengo C.A.、Michie A.D.、Jones S.、Jones D.T.、Swindels M.B.和Thornton J.M.(1997)结构,5, 1093–1108. [公共医学][谷歌学者]
23Kabsch W.和Sander,C.(1983年)生物聚合物,22,2277–2637页。[公共医学][谷歌学者]
24Holm L.和Sander,C.(1998)核酸研究。,26, 316–319.[PMC免费文章][公共医学][谷歌学者]
25Nayal M.,Hitz,B.C.和Honig,B.(1999)蛋白质科学。,8, 676–679.[PMC免费文章][公共医学][谷歌学者]
26Dodge C.、Schneider R.和Sander C.(1998)核酸研究。,26, 313–315.[PMC免费文章][公共医学][谷歌学者]
27Suhnel J.(1996)计算。申请。Biosci公司。,12, 227–229. [公共医学][谷歌学者]
28Hogue C.、Ohkawa,H.和Bryant,S.(1996)生物化学趋势。科学。,21, 226–229. [公共医学][谷歌学者]
29Berman H.M.、Olson,W.K.、Beveridge,D.L.、Westbrook,J.、Gelbin,A.、Demeni,T.、Hsieh,S.H.、Srinivasan,A.R.和Schneider,B.(1992年)生物物理学。J。,63, 751–759.[PMC免费文章][公共医学][谷歌学者]
30Weissig H.、Shindyalov,I.N.和Bourne,P.E.(1998年)晶体学报.,D54, 1085–1094.[谷歌学者]
31拉斯科夫斯基R.A.、哈钦森E.G.、米奇A.D.、华莱士A.C.、琼斯M.L.和桑顿J.M.(1997)生物化学趋势。科学。,22, 488–490. [公共医学][谷歌学者]
32Murzin A.G.、Brenner,S.E.、Hubbard,T.和Chothia,C.(1995)分子生物学杂志。,247, 536–540. [公共医学][谷歌学者]
33Neshich G.、Togawa,R.、Vilella,W.和Honig,B.(1998)《蛋白质数据库季刊》,84。
34Westhead D.、Slidel T.、Flores T.和Thornton J.(1998)蛋白质科学。,8, 897–904.[PMC免费文章][公共医学][谷歌学者]
35Gibrat J.-F.、Madej,T.和Bryant,S.H.(1996)货币。操作。结构。生物。,6, 377–385. [公共医学][谷歌学者]
36Hooft R.W.W.、Sander,C.和Vriend,G.(1996)J.应用。结晶器。,29, 714–716.[谷歌学者]

文章来自核酸研究由以下人员提供牛津大学出版社