结晶数据

国际数据周结晶数据库

美国科罗拉多州丹佛市,2016年9月12日

上的会话晶体学和结构数据库在国际数据周期间的SciDataCon会议上组织,向普通观众解释世界上一些最重要的研究数据库如何维护和提供对其个人高质量策划资源的巨大研究价值的访问。

它还表明,在财政压力日益增加的时候,有可能维持一个丰富而强大的资源生态,以不同的方式供资,有时内容重叠,为其目标多学科社区提供最大价值。

[发言人]

John R.Helliwell、Soorya Kabekkodu、Ian Bruno、John Westbrook、Saulius Graíulis。

各个演示文稿的摘要和PDF版本的链接如下所示。


pdf格式

晶体界衍射数据沉积活动概述

约翰·理查德·海利维尔(John Richard Helliwell)、布莱恩·麦克马洪(Brian McMahon)

作为一个领域,晶体学与天文学和粒子物理学等其他领域相比,在确保提供基础数据作为研究出版物的正式要求方面,无论是衍生的、处理的还是原始的(主要)数据。原始数据归档显然具有挑战性,因为它是最庞大的。然而,这并不是唯一的挑战;必须正确描述存储的原始数据的元数据,以便对其进行评估和理解。此外,无论是否与正式出版物相关,其他研究人员都必须能够发现并重用单个原始数据集。

2016年SciDataCon会议概述了现有的晶体数据库。本文描述了IUCr和晶体学界对其数据存档和数据重用活动的积极审查和高度关注。不仅如此,我们还意识到数据数字存储和通信领域的许多技术进步,这些技术现在可用于科学的所有领域。


pdf格式

晶体学开放数据库——新视角

索利乌斯·格拉齐利斯、安德烈乌斯·默基斯、安塔纳斯·瓦特库斯、阿梅尔·勒贝尔、丹尼尔·查泰格纳、亨利·皮利哀、罗伯特·唐斯、卢卡·卢特罗蒂、彼得·莫埃克、彼得·穆雷·鲁斯特、米格尔·奎洛斯·奥洛扎巴尔、沃纳·卡明斯基

总结

当今互联世界的关键在于互联网上数据的开放可用性。维基百科的巨大成功,PDB(伯曼等。或开放序列数据库,如UniProt(UniProt Consortium,2015),展示了数据共享在不受收费墙和复制限制阻碍的情况下的威力。

晶体学开放数据库(COD)以开放数据库的经验为基础,利用社区的力量在网上建立一个开放可用的化学晶体学数据库。COD接收CIF格式的数据,根据IUCr字典和质量标准对其进行验证,并再次以标准CIF格式向COD用户提供合并数据。目前,COD包含36万多条记录,涵盖1915年至今的一年。

COD故事

众多人参与了COD(http://www.crystallography.net网站)COD现在包含来自AMCSD(Rajan)等多个数据库的数据等。,2006年),CrystalEye(日等。,2012年)或PCOD(Le Bail,2005)。以电子格式出版的大多数结构都在COD中表示,只要它们可以在互联网上免费获得,或者是由作者或其机构捐赠的。一些以纸质形式发布的重要结构也被数字化并纳入COD。

化学需氧量数据库存储有机、金属有机和无机化合物及矿物的实验结构。COD收集所有类型的晶体衍射实验的结果(单晶和粉末衍射出的X射线、电子或中子)。然而,近年来,使用DFT和其他方法进行的量子力学计算变得足够强大,可以得出可靠的结构描述从头算或结合实验晶体学技术。这样的结构也被收集并存储在姐妹数据库TCOD(理论晶体学开放数据库)中。由于COD、TCOD和PCOD都使用相同的CIF框架进行数据表示,因此可以使用相同的软件工具搜索和处理所有数据库。

为了使化学需氧量简单而有效,几种成分至关重要。Free/Libre开源软件(F/LOSS)是COD开发的核心,使COD数据和算法易于重用。开放数据标准——结晶交换框架——及其由IUCr维护的本体对于有效的数据交换至关重要(霍尔等。,1991; 伯恩斯坦等。,2016).

COD自成立以来一直保持稳定的REST接口(Graíulis等。,2009; 格拉久利斯等。,2012). '你知道,酷URI不会改变!”(Berners-Lee,1998年)。因此,COD非常适合21世纪开放、互联的世界,为Web上的晶体结构提供稳定的链接。稳定的设置允许在不同站点中即时重用COD数据,并为每个结构使用稳定、唯一的COD编号提供数据引用机制。

COD包含一个简单的搜索和检索Web界面,如图所示。1.除了web搜索,COD还提供使用各种协议(http、svn、rsync)下载所有数据,并使用MySQL客户端直接查询数据库。这在Web界面不够的情况下提供了最大的灵活性,并允许将COD集成到其他网站或独立程序中。



图1。COD搜索结果界面和结构视图页面。

COD中的主要信息是原子坐标和晶体描述。此外,COD系统地存储F类光突发事件和粉末跟踪数据(如果可用)。COD数据条目是手动管理和自动检查的。根据接收的数据,COD制定一个新的CIF文件,该文件保证语法正确,包含所有原始数据和附加的元数据。如果数据管理需要更改COD条目,COD会将所有更改精心存储在版本控制数据库(当前为Subversion)中,从而提供完整的可追溯性和数据来源。随着这些程序的实施,COD最近在汤森路透数据库引用指数中排名第5,现在被自然出版集团推荐用于所有结构沉积物。

COD应用

COD的应用领域不断扩大。教学(Graíulis等。,2015年),粉末鉴定(Lutterotti等。,2015年),计算材料科学数据来源(First&Floudas,2013;Pizzi2016年)是证明COD作为数据来源有用的最新领域之一。此外,化学需氧量的开放性允许将结构描述与材料特性相匹配(Pepponi等。,2012年)首次公开收集了材料属性和属性-结构关系。

在所有情况下,我们都受益于IUCr现有的描述晶体学实体的晶体学CIF词典。我们还发现,制作特定于域的CIF词典非常有用,可以描述材料属性、计算设置和结构元数据。通过这种方式,我们可以不重复地重用现有的CIF词典,并且可以重用现有的软件和数据库结构来进行新的查询领域。

COD新方向

COD的连续性和大量晶体数据的收集使我们能够将其用作工业过程的数据源和管理平台:在最近启动的SOLSA项目中,COD将实时为矿山中的矿物识别提供晶体数据。此外,COD还将吸收在此类识别运行期间获得的公共数据,进一步丰富COD收集并提高识别精度。

在未来一年,COD将继续存储衍射图像数据。存储原始衍射图像目前面临着一个挑战,即如何满足合理的管理和存储成本,以及如何为图像集分配提供足够的带宽。在这里,COD再次追求社区支持的分布式开源解决方案。COD开始使用Tahoe-LAFS存储引擎(Wilcox-O’Hearn&Warner,2008),该引擎目前能够提供可负担得起的PB级冗余存储。

致谢

根据第689868号赠款协议(SOLSA项目),该项目已获得欧盟地平线2020研究与创新项目的资助。

工具书类

Berman,H.、Kleywegt,G.、Nakamura,H.和Markley,J.(2012)。40岁的蛋白质数据库:反思过去,为未来做准备。 结构, 20, 391-396. 内政部:2016年10月10日/j.str.2012.01.010

Berners-Lee,T.(1998)。 酷URI不变。网址:https://www.w3.org/Provider/Style/URI.html[上次访问时间:2016年5月29日]

Bernstein,H.J.、Bollinger,J.C.、Brown,I.D.、Graíulis,S.、Hester,J.R.、McMahon,B.、Spadaccini,N.、Westbrook,J.D.和Westrip,S.P.(2016)。晶体信息文件格式规范,2.0版应用晶体学杂志, 49, 277-284. 内政部:10.1107/1600576715021871

Day,N.、Downing,J.、Adams,S.、England、N.W.和Murray-Rust,P.(2012)。CrystalEye:全球开放晶体学数据的自动聚合、语义化和传播。 应用晶体学杂志, 45: 316-323. 内政部:10.1107/S0021889812006462

首先,E.L.&Floudas,C.A.(2013)《MOFumics:金属-有机骨架的计算孔隙表征》。 微孔和介孔材料, 165, 32-39. 内政部:2016年10月10日/j.micromeso.2012.07.049

Graíulis,S.、Chateigner,D.、Downs,R.T.、Yokochi,A.F.T。,;Quirós,M.、Lutterotti,L.、Manakova,E.、Butkus,J.、Moeck,P.和Le Bail,A.(2009年)。晶体学开放数据库-晶体结构的开放存取集合。 应用晶体学杂志, 42, 726-729. 内政部:10.1107/S0021889809016690

Graíulis,S.、Daškević,A.、Merkys,A.、Chateigner,D.、Lutterotti,L.、QuiróS,M.、Serebryanaya,N.R.、Moeck,P.、Downs,R.T.和Le Bail,A.(2012年)。晶体学开放数据库(COD):一个开放访问的晶体结构集合和全球合作平台。 核酸研究, 40,D420-D427。内政部:10.1093/nar/gkr900

Graíulis,S.、Sarjeant,A.A.、Moeck,P.、Stone-Sundberg,J.、Snyder,T.J.、Kaminsky,W.、Oliver,A.G.、Stern,C.L.、Dawe,L.N.、Rychkov,D.A.、Losev,E.A.、Boldyreva,E.V.、Tanski,J.M.、Bernstein,J.,Rabeh,W.M.和Kantardjieff,K.A.(2015)。21世纪的结晶教育。 应用晶体学杂志, 48, 1964-1975. 内政部:10.1107/S1600576715016830

Hall,S.R.,Allen,F.H.&Brown,I.D.(1991年)。结晶信息文件(CIF):结晶学的新标准存档文件。 结晶学报A辑, 47, 655-685. 内政部:10.1107/S010876739101067X号

Le Bail,A.(2005)。利用GRINSP进行无机结构预测应用晶体学杂志, 38, 389-395. 内政部:10.1107/S0021889805002384

Lutterotti,L.、Chateigner,D.、Pillière,H.和Fontugne,C.(2015)。 使用Crystallography Open Database的全格式搜索匹配:一种互联网工具。网址:http://www.ecole.ensicaen.fr/~chateign/danielc/abstracts/Lutterotti_abstract_RXMatiere2013_FPSM.pdf[上次访问时间:2016年5月29日]

Pepponi,G.,Gražulis,S和Chateigner,D.(2012年)。MPOD:链接到结构信息的材质特性开放数据库。 物理研究中的核仪器和方法B节:束流与材料和原子的相互作用, 284, 10-14. DOI:10.1016/j.nimb.2011.08.070

Pizzi,G.、Cepellotti,A.、Sabatini,R.、Marzari,N.和Kozinsky,B.(2016)。AiiDA:用于计算科学的自动化交互基础设施和数据库。 计算材料科学, 111, 218-230. 内政部:2016年10月10日/j.commatsci.2015.09.013

Rajan,H.、Uchida,H.、Bryan,D.、Swaminathan,R.、Downs,R.和Hall Wallace,M.(2006年)。 构建美国矿物学家晶体结构数据库:构建小型互联网数据库的方法输入:Sinha A.(编辑)地理信息学:数据到知识,美国地质学会。内政部:10.1130/2006.2397(06)

UniProt联盟(2015)。UniProt:蛋白质信息中心。 核酸研究, 43,D204-D212。内政部:10.1093/nar/gku989

Wilcox-O’Hearn,Z.和Warner,B.(2008)。Tahoe:租赁机构文件系统。21-26. 可在https://gnunet.org/sites/default/files/lafs.pdf.


pdf格式

剑桥结构数据库

苏珊娜·沃德,伊恩·布鲁诺

总结

就在50多年前,剑桥大学的一个小型研究小组着手编纂已发表的有机和金属有机晶体结构数据。该小组由奥尔加·肯纳德博士领导,她与伟大的博学家J D·伯纳尔分享了一个愿景,即“集体使用数据将导致发现超越个人实验结果的新知识”(肯纳德,1997年)。后来,这个小型研究小组成为了剑桥晶体数据中心,最初的数据汇编演变为剑桥结构数据库。自早期以来发生了很大变化,本演示文稿将介绍用于维护剑桥结构数据库的系统如何演变以适应新的要求,以及外部服务如何发展以支持对新知识的持续探索。

摘要

剑桥结构数据库(CSD)包含800000多个晶体结构衍射实验的结果,并且每年增长60000多个结构(Groom等人,2016年)。它由剑桥晶体数据中心(CCDC)开发和维护。CCDC提供丰富的沉积服务,促进围绕晶体结构数据发布的社区规范,并使研究人员易于遵守这些规范。许多沉积的结构最终与期刊文章相关,但越来越多的研究人员正在使用CSD作为他们发布晶体结构数据的主要平台。

存放的数据集被分配一个数字对象标识符(DOI),该标识符解析为一个登录页,在该登录页上,可以在web浏览器中交互查看数据并自由下载。CCDC还提供了从期刊文章和其他资源中链接和发现数据的机制。使用自动处理和人工验证的组合,将丰富的元数据与每个数据集相关联。这包括所研究物质的化学表征,这对于收集数据以挖掘新知识至关重要。

CCDC开发的一套丰富的软件应用程序有助于从CSD中的数据中推导新知识。这些使研究人员能够搜索、分析和可视化数据,同时也可以将结构知识应用于包括药物发现和材料科学在内的一系列学科。除了支持研究外,CCDC活动的这一领域还从工业界和学术界吸引了维持其核心社区活动所需的财政收入,而无需直接公共资金。

自1965年成立CSD以来,CCDC的经营环境发生了重大变化。结构确定的速度迅速增加,存储的数据变得更加复杂和多样化。更广泛的经济环境的变化影响了我们的主要收入来源,从而影响了为维持这些收入来源而必须提供的服务。围绕研究数据管理和发现的一般举措带来了新服务和资源之间更大互操作性的机会。

本演示将重点介绍CCDC在过去半个世纪中如何管理其系统,以适应不断变化的环境,同时保持可持续性。它将特别关注内部信息系统最近如何演变以适应不断增加的吞吐量和复杂性。它将描述外部服务是如何发展的,以确保CSD中的数据和知识广泛且适当地提供给广泛的用户社区。它还将反思在变革的背景下从早期保留下来的东西。特别值得注意的是,专家科学家进行了验证和审查,以确保数据能够可靠地用于今天和未来几十年的新知识发现。

工具书类

Groom,C.R.、Bruno,I.J.、Lightfoot,M.P.和Ward S.C.(2016年)。剑桥结构数据库。晶体学报,B72: 171-179. 内政部:http://dx.doi.org/10.107/S2052520616003954

Kennard,O.(1997)。从私人数据到公共知识。收录:Butterworth,I.(编辑)电子出版对学术界的影响。伦敦:波特兰出版社,第159-166页。


pdf格式

粉末衍射文件™75年:材料表征数据库开发概述

Soorya N.Kabekkodu、Thomas N.Blanton、Timothy G.Fawcett

总结

国际衍射数据中心(ICDD®)粉末衍射文件是一个强大的材料鉴定数据库,75年来被科学界广泛使用。在此期间,数据库呈指数级增长,2016年发布的版本中包含了890000多个衍射图案和330000多个晶体结构。从1941年的1000张手写文件卡开始,粉末衍射文件(PDF®)在数据库以及搜索/匹配和数据检索方法方面经历了许多技术发展(Faber&Fawcett,2002)。如今,关系数据库格式(RDB)的粉末衍射文件包含广泛的化学、物理、书目和晶体数据,包括原子坐标,实现定性和定量相分析(Kabekkodu等。, 2002). 在使用任何数据库进行材料表征时,了解数据库中发现的晶体结构或衍射图案的质量非常重要。由于文献中公布的数据质量不同,国际荒漠化委员会数据库编辑审查过程必须采用严格的数据评估方法,根据数据质量对数据进行分类。粉末衍射文件中的每个条目都有质量标记和编辑注释,描述原始数据错误和任何更正。除了X射线衍射图样外,PDF还包含电子和中子衍射图样,使科学家能够使用不同的衍射技术来表征感兴趣的材料。本演示文稿将讨论PDF数据库功能和搜索/匹配算法的最新发展。

粉末衍射锉的研制

粉末衍射文件(PDF)最初是单相材料的X射线粉末衍射图样的集合,提供了化学、晶面间距(d日)和相对强度(). 在粉末衍射文件以印刷形式发布的早期,可以提供的数据量是有限的。1969年,粉末衍射文件通过磁带的形式提供给用户,允许提供一些额外的晶体信息。然而,由于昂贵的磁盘空间、缓慢的计算机速度和数据检索,数据存储仍然是一个问题。如今,人们可以使用个人计算机快速存储和访问千兆字节的数据。在数据存储技术的不断发展过程中,粉末衍射文件开始添加更多的信息,而不仅仅是d-I公司列表添加到数据库中。2000年,粉末衍射文件是使用关系数据库(RDB)概念设计的,该概念最初由E.F.Codd(1970)提出。多年来,关系数据库管理系统(RDMS)以指数级的速度发展,提供了更加健壮和高效的数据库平台。这有助于PDF存储更多数据,包括化学、物理、书目、结构分类、原始粉末模式、电子和中子衍射模式以及晶体数据,包括原子坐标。在解决材料表征难题时,所有这些额外的数据内容都变得至关重要。在过去几年中,ICDD将数据库范围扩展到纯晶体材料以外,以实现非晶、微晶和纳米材料的表征。粉末衍射文件现在包含目标非晶、聚合物、无序粘土和纳米材料的原始衍射图案。将收集的衍射数据与参考原始衍射图案进行比较对于这些材料来说至关重要d-I型列表不足以进行全面的阶段识别。

2011年,ICDD扩展了数据库的设计,以包括调制结构。由于这些结构需要在3中描述+d日尺寸(超空间方法),PDF数据库的设计必须确保它不会改变几位搜索/匹配软件开发人员多年来一直使用的核心格式。

原始数据存档

ICDD已经存档粉末衍射原始数据20多年了。这些实验原始数据存储在粉末衍射文件中,可供数据库用户进行自己的分析。最近,通过粉末衍射文件(Reid)中存档的粉末衍射原始数据,解决了曲多普利的晶体结构., 2016)

质量标志

在处理具有多个实验测定值的大型数据库时,分配给所有PDF数据库条目的质量标记非常重要。了解数据库中发现的晶体结构或衍射图案的质量对于筛选搜索/匹配结果集非常重要。由于文献中公布数据的质量不同,数据库编辑审查过程必须采用严格的数据评估方法,根据衍射数据的质量对其进行分类。所有PDF数据都经过彻底审查、编辑和标准化。ICDD在发布之前对数据进行了100多次质量和错误检查。国际荒漠化委员会的编辑小组开发了广泛的数据验证套件,以丰富编辑过程。ICDD纠正了原始数据中发现的所有可解决错误。如果错误的大小很大,并且没有足够的信息来纠正观察到的错误,则条目将被拒绝。当PDF数据库条目的质量分数降低时,这些条目将填充编辑注释,描述原始数据错误和应用的任何更正。数据验证、更正、分类和质量标记分配是编辑过程中最重要和最耗时的步骤。

本演示文稿将重点介绍粉末衍射文件数据库的各个方面,强调数据验证、分类和搜索/匹配方法。

致谢

作者感谢ICDD成员、编辑和志愿者对粉末衍射文件数据库的贡献。

工具书类

Codd,E.F.(1970)。大型共享数据库的数据关系模型,ACM通信,13(6), 377–387.http://dl.acm.org/citation.cfm?doid=362384.362685

Faber,J.&Fawcett,T.(2002年)。粉末衍射文件:现在和未来,结晶学报。,B部分:结构科学,58, 325-332.http://dx.doi.org/10.107/S0108768102003312

Kabekkodu,S.N.、Faber,J.和Fawcett,T.(2002年)。关系数据库格式的新粉末衍射文件(PDF-4):优势和数据挖掘功能,结晶学报。,B部分:结构科学,58, 333-337http://dx.doi.org/10.107/S0108768102002458

Reid,J.R.、Kaduk,J.A.和Vickers,M.(2016)。川多普利C的晶体结构24H(H)34N个2O(运行)5:粉末衍射文件中原始数据沉积的实用示例,粉末衍射,于CJO2016上提供。doi:10.1017/S0885715616000294.


pdf格式

蛋白质数据库:一种开放获取资源,可用于生物和医学的基础和应用研究与教育

约翰·韦斯特布鲁克

总结

蛋白质数据库(PDB)成立于1971年,是实验确定的生物大分子及其复合物3D结构的唯一全球存储库,是生物科学领域第一个开放存取的数字资源。它由全球蛋白质数据库组织管理。PDB服务于一个不断发展的结构生物学社区,该社区生成输入数据,并为世界各地的研究人员和教育工作者/学生开放访问约120000个档案条目以及基础和应用生物科学和医学的基础和应用研究与教育的核心增值信息。PDB档案还支持农业、畜牧业、生物能源生产、生物化学、生态学、蛋白质设计和纳米技术领域的研究和教学工作。RCSB PDB是全球蛋白质数据库的美国区域数据中心,目前担任PDB档案保管人,负责处理来自美洲和大洋洲结构生物学家的沉积(deposit.wwpdb.org网站). RCSB PDB网站(rcsb.org网站)提供一套全面的“数据输出”资源,并与其他生物数据存储库建立增值链接,支持对PDB存档中的结构数据进行可视化、比较和分析。将讨论开放存取数据共享的重要性,以及科学、技术和全球社区之间的相互关系在四十多年来塑造PDB资源演变的无数方式。

全球蛋白质数据库

蛋白质数据库(PDB)是生物大分子实验确定的原子级结构的唯一全球档案。PDB档案由全球蛋白质数据库组织wwPDB管理;http://wwpdb.org(伯曼等。,2003年),目前包括三个位于美国的成立区域数据中心(RCSB蛋白质数据库或RCSB PDB;http://rcsb.org)日本(日本蛋白质数据库或PDBj;http://pdbj.org)和欧洲(欧洲蛋白质数据库或PDBe;http://pdbe.org)再加上一个全球核磁共振专家数据存储库BioMagResBank,由美国的沉积点组成(BMRB;http://www.bmrb.wisc.edu)和日本(PDBj-BMRB;网址:http://bmrbdep.pdbj.org). 这些wwPDB合作伙伴共同收集、注释、验证标准化PDB数据,并将其传播给公众,对其使用没有任何限制。

wwPDB合作伙伴正在开发下一代沉积和注释工具。这些工具的主要重点是验证提交的原子坐标和主要实验数据以及相关元数据。wwPDB Biocaurators向存款人提供详细的报告,其中包括模型和实验数据验证的结果。根据X射线验证工作组和研讨会专家的建议,制定并改进了验证报告(阅读等。2011年),EM(亨德森等。,2012年),NMR(Montelione等。和配体(Adams等。, 2016). 由于这些wwPDB验证报告使用广泛接受的标准和标准对结构质量进行评估,wwPDB合作伙伴强烈鼓励期刊编辑和审稿人在稿件提交和审查过程中向作者提出要求。这些报告具有日期样本,并显示了世界卫生大会(wwPDB)网站的徽标,该网站是此次沉积的策划者。无论哪个wwPDB站点处理了传入数据,它们都包含相同的信息。已要求提供wwPDB验证报告电子生活生物化学杂志以及国际结晶学联合会(IUCr)期刊,作为其稿件提交过程的一部分。一旦发布了每个新的PDB条目,通常在发布时,wwPDB验证报告将与保存的数据一起公开。

RCSB蛋白质数据库

为了分析PDB数据与其他公开可用注释的关系,RCSB蛋白质数据库(RCSB PDB,http://rcsb.org,(伯曼等。(2000))开发了一个新的数据集成平台,可以跨各种数据集映射3D结构信息。这种整合跨越蛋白质序列和3D结构空间,将人类基因组连接起来。

用户可以从顶部搜索栏执行简单搜索(例如ID、名称、序列、配体)或使用高级搜索构建搜索参数的复杂组合。DrugBank的信息与PDB数据集成,以便于搜索药物和药物目标。其他分类系统用于在层次树中组织PDB结构,以便浏览和搜索(例如mpstruc,基因本体,酶分类)。

蛋白质特征视图提供PDB条目到全长UniProt序列的图形映射。它显示PDB结构、二级结构、结构域结构、蛋白质紊乱、疏水性特征、遗传变异和外显子边界中观察到和未观察到的区域。还显示了来自蛋白质模型门户的可用同源模型的信息。

基因视图支持基因组和3D结构数据之间关系的可视化。该工具允许浏览PDB数据突出显示在相应基因组范围上的人类基因组。与蛋白质特征视图类似,这些数据可以与其他基因组和蛋白质功能注释相关联,例如基因结构注释、DNA重复或序列保护。

基因组定位到结构映射.人类基因定位,例如突变位点,可以映射到人类基因上,并从那里映射到相应的蛋白质序列和3D结构。该工具可用于评估单核苷酸变异对3D结构的影响。

验证和配体电子密度图.wwPDB发布了X射线、最近核磁共振和三维电磁结构的验证报告和相应的图形摘要指标。这些报告评估了每个结构的质量,并强调了具体问题。它们作为wwPDB沉积和注释系统的一部分提供给存款人,以帮助识别PDB沉积与出版之前应解决的潜在问题。对于每个结构,RCSB PDB显示图形验证摘要和相应报告的链接。同样在RCSB PDB网站上,Sigma-weighted 2的3D可视化|F类o(o)|-d日|F类c(c)|配体周围的电子密度“mini-maps”可用于评估配体建模的质量。

致谢

RCSB PDB由国家科学基金会(DBI 1338415)、国家卫生研究院和能源部支持;惠康信托、BBSRC、MRC、欧盟、CCP4和EMBL-EBI的PDBe;JST-NBDC的PDBj;和BMRB(GM109046)。

工具书类

P.D.亚当斯等。 (2016).第一届wwPDB/CCDC/D3R配体验证研讨会结果。结构 24(4), 502-508.

Berman,H.M.、Henrick,K.和Nakamura,H.(2003)。宣布建立全球蛋白质数据库。自然结构。生物.10, 980.

Berman,H.M.、Westbrook,J.、Feng,Z.、Gilliland,G.、Bhat,T.N.、Weissig,H.、Shindyalov,I.N.和Bourne,P.E.(2000)。蛋白质数据库。核酸研究。 28(1), 235-42. PMCID:102472。

亨德森·R、萨利·A、贝克·M·L、卡拉格·B、德夫科塔·B、唐宁·K·H、埃格尔曼·E·H、冯·Z、弗兰克·J、格里戈里夫·N、江·W、卢特克·S·J、梅多利亚·O、彭泽克·P·A、罗森塔尔·P·B、罗斯曼·M·G、施密德·M·F、施罗德·G·F、史蒂文·A·C、斯托克斯·D·L、韦斯特布鲁克·J·D、Wriggers·W、杨·H、杨·J、伯曼,H.M.、Chiu,W.、Kleywegt,G.J.和Lawson,C.L.(2012)。第一次电子显微镜验证工作组会议的结果。结构 20(2), 205-14. PMCID:3328769。

Montelione,G.T.,Nilges,M.,Bax,A.,Guntert,P.,Herrmann,T.,Richardson,J.S.,Schwieters,C.D.,Vranken,W.F.,Vuister,G.W.,Wishart,D.S.,Berman,H.M.,Kleywegt,G.J.&Markley,J.L.(2013)。wwPDB NMR验证工作组的建议。结构 21(9), 1563-70. PMCID:3884077。

Read,R.J.、Adams,P.D.、Arendall III,W.B.、Brunger,A.T.、Emsley,P.、Joosten,R..P.、Kleywegt,G.J.,Krissinel,E.B.、Lutteke,T.、Otwinowski,Z.、Perrakis,A.、Richardson,J.S.、Shefler,W.H.、Smith,J.L.、Tickle,I.J.、Vriend,G.和Zwart,P.H.(2011)。蛋白质数据库的新一代晶体学验证工具。结构 19(10), 1395-412. PMCID:PMC3195755。


会议组织者John R.Helliwell和Brian McMahon