专题评论\(\def\h填{\hskip5em}\def\hfil{\hski p3em}\def\eqno#1{\hfil{#1}}\)

IUCrJ大学
编号:2052-2525

科学在于数据

十字标记_颜色_方形_文本.svg

英国曼彻斯特M13 9PL曼彻斯特大学化学学院,b条英国切斯特CH1 2HU修道院广场5号国际结晶学联合会,c澳大利亚新南威尔士州悉尼市悉尼大学生命与环境科学学院,以及d日晶体和结构化学,荷兰乌得勒支巴杜拉安8号乌得勒克特大学Bijvoet生物分子研究中心,CH 3584
*通信电子邮件:john.helliwell@manchester.ac.uk

美国艾姆斯实验室D.Argyriou编辑(2017年7月18日收到; 2017年9月24日接受; 2017年10月6日在线)

应该通过自己的眼睛来理解已发表的研究结果,包括利用原始衍射数据检查原始作者在分析中做出的各种决定的机会。如今,在越来越多的数据档案中,保存原始衍射数据在技术和组织上都是可行的,无论是集中的还是分布式的,这些档案有权注册数据集并获得保存描述符,通常是“数字对象标识符”。这引入了保存原始数据的重要作用,即了解我们在哪些方面失败或可以改进我们的分析。提供结晶学的个别科学领域案例研究。

1.简介

1.1. 各种科学数据的重要性

这篇文章标题的含义似乎不言而喻。对于科学探究来说,“数据”是我们收集来探索自然、检验假设、提出新特性和机制以及做出“事实发现”的数据。然而,“数据”是一个非常宽泛的术语。在晶体结构实验中,它可能指“原始”数据,例如在衍射仪处收集的衍射图像(尽管即使这些图像也不是真正的“原始”图像,因为它们是根据探测器的电子和机械特性捕获的,具有该特定设备固有的任何限制或缺点)。它也可以指“处理过的”数据,例如合并的结构因素,这些数据是由原始图像的校准、还原和其他操作产生的,并且构成了结构解决方案和模型的材料精细化。术语“数据”也用于导出结构模型本身的逐项描述(如存储在结构数据库中的坐标集和各向异性位移参数)。

在所有这些类别中,晶体学都存在。通过原始衍射数据集,我们可以尽可能多地获取有关晶体原子的信息就地使用经过处理的衍射数据集,我们保留了晶体中结构单元的平均描述,但我们可能忽略了包含无序或大规模关联信息的扩散散射强度,或者我们可能忽略第二个晶格,就像在伪四面体的情况下孪生。当我们考虑衍生结构模型时,我们基本上已经将分子结构或“典型”原子环境理想化了。在每个步骤中,我们的抽象级别(通常)都适合手头的研究。然而,晶体学硬件和软件的成功有时会让我们产生一种错误的安全感,一种轻微的忘记自然界全部复杂性的倾向,这种复杂性可以通过对我们正在检查的衍射数据集进行更仔细的检查来分析出来。

晶体学有着强大的数据共享传统,不必过分强调实验数据的仔细和关键的再分析经常导致衍生结构模型的改进(例如,见Marsh等。, 2002[Marsh,R.E.,Kapon,M.,Hu,S.&Herbstein,F.H.(2002),《晶体学报》,B58,62-77.]). 在化学晶体学领域,有一些典型的行为,例如结晶学报C辑由1993年至1999年编辑领导的悉尼大厅(CODATA 2014国际数据奖得主),为裁判员和编辑提供基础数据和提交的文章。因此,一篇被接受的文章将结构因素和坐标作为数据的“记录版本”附加在其上。随后,一种化学物质晶体结构数据库[例如剑桥结构数据库(CSD)、晶体学开放数据库(COD)、无机晶体结构数据库(ICSD),国际衍射数据中心(ICDD)]可以从裁判员和编辑的这种应有的关心和关注中获得巨大的利益,并获得这些版本的数据和文章记录。

1.2. 原始数据的特殊重要性

在这里,我们关注重新检查和重用原始数据集的价值。对原始衍射数据的访问将允许晶体学结果的用户/读者直接看到原始研究人员做出的每个计算选择,如果他们愿意,还可以采取不同的计算路线。

在最近的《专题评论》中,我们三人已经证明了在越来越多的数字数据档案中,保存原始衍射数据集在技术上和组织上是可行的(Kroon-Batenburg等。, 2017【Kroon-Batenburg,L.M.J.,Helliwell,J.R.,McMahon,B.&Terwilliger,T.C.(2017),国际癌症研究联合会,4,87-99。】). 我们认为,应授权集中和分布式的此类档案注册数据集并获取保存描述符。我们注意到,这是国际标准“数字对象标识符”(DOI)的案例比例越来越大,由经认可的注册机构分布式网络维护(国际标准化组织,2012年)[国际标准化组织(2012).ISO 26324:2012。信息和文献.数字对象标识符系统。http://www.iso.org/iso/cocataloge_detail.htm?csnumber=43506。]). 原始衍射数据的长期可用性越来越普遍,我们认为,基于DOI等标准的有序基础设施的发展对于协调新兴档案至关重要。讨论存储环境中原始数据保存的开创性文章。同步加速器(迈耶等。, 2014【Meyer,G.R.、Aragáo,D.、Mudie,N.J.、Caradoc-Davies,T.T.、McGowan,S.、Bertling,P.J.和Groenewegen,D.、Queette,S.M.、Bond,C.S.、Buckle,A.M.和Androulakis,S.(2014),《结晶学报》第70期,第2510-2519页。】),《高分子晶体学再现性综合资源》(Grabowski等。, 2016【Grabowski,M.,Langner,K.M.,Cymborowski,M,Porebski,P.J.,Sroka,P.,Zheng,H.,Cooper,D.R.,Zimmerman,M.D.,Elsliger,M.-A.,Burley,S.K.&Minor,W.(2016),《结晶学报》第72期,第1181-1193页。】)和结构生物学数据网格(Meyer等。, 2016【Meyer,P.A.等人(2016),《自然通讯》第7期,第10882页。】)倡议为这种方法提供了大量支持。

Kroon-Batenburg已经确定了更广泛的科学世界中数据归档的一些驱动因素等。(2017【Kroon-Batenburg,L.M.J.,Helliwell,J.R.,McMahon,B.&Terwilliger,T.C.(2017),国际癌症研究联合会,4,87-99。】)包括正式研究数据管理政策的资助机构授权。在这些驱动因素中,我们挑出了基于`开放创新、开放科学、面向世界在欧盟的书(Moedas,2016)中描述【Moedas,C.(2016),《开放创新、开放科学和面向世界的开放——欧洲愿景》,卢森堡:欧盟出版局。】). 这是因为科学政策制定者,如欧盟和美国国立卫生研究院,希望加快科学发现,以解决紧迫的社会问题,如改善疾病治疗和减轻环境污染。促进出版前的早期数据共享是这一新的“开放科学”愿景的关键部分。欧洲开放科学云计划(https://ec.europa.eu/research/openscience/index.cfm?pg=open-科学云)正在为开放科学提供工具和指南,以促进解决紧迫社会问题的众包。其中包括CERN托管的Zenodo档案,它为任何领域的科学数据集提供了一个开放的存储库。目前,它将免费接受来自世界各地的“小”数据集(<50 GB),目前只有少数晶体学家使用它来提供他们的原始衍射数据集。

我们不知道Zenodo是否会保持独特,也不知道资助机构对研究人员施加的越来越大的压力,要求他们归档支持实验数据,商业提供商是否会满足这种压力。然而,总的来说,上述数据档案以及中央实验设施(同步辐射、X射线激光和中子源)的数据档案极大地促进了沉积并开放获取作为出版物基础的原始实验数据集的可行性。

与数据量和网络带宽相关的实际挑战仍然存在。最新的探测器产生大量数据,将结晶学牢牢带入“大数据”时代(尽管我们还远未将射电天文学家的数据量与其平方公里阵列项目相匹配)。在之前的出版物中(Tanley,Schreurs等。, 2013【Tanley,S.W.M.,Schreurs,A.M.M.,Helliwell,J.R.&Kroon-Batenburg,L.M.J.(2013),《应用结晶杂志》第46期,第108-119页。】)我们描述了曼彻斯特大学和乌得勒支大学之间移动约10GB级原始衍射数据集的网络传输时间;最初这需要5天(尽管它可以优化到一天左右)。从结构生物学网格检索数据的最新经验(Meyer等。, 2016【Meyer,P.A.等人(2016),《自然通讯》第7期,第10882页。】)数据传输网络的容量在一定程度上与容量的增长保持同步。然而,在可能的情况下,最好将原始衍射数据存档在靠近测量数据的位置,从而利用更快的本地网络。

保存原始衍射数据的另一个重要作用适用于我们有衍射数据但没有发布的情况。这些可以帮助我们更好地了解我们在分析中失败的地方以及没有发现结果的地方。对于这些具有挑战性的案例,应公开原始衍射数据的共享,尤其是纳税人资金的使用。

不幸的是,这些例子并不能为这里的案例研究做出贡献,因为它们并不为人所知,除了个别主要研究者(PI),他们将这些案例与他们的实验室或合作者保持密切联系。相反,在本文中,我们描述了我们从文献中发现的个别案例研究,这些案例研究来自晶体研究和应用的广泛不同领域,实际上跨越了IUCr的各个科学委员会的范围。这些出版物要么直接展示了原始数据保存和重用的好处,要么是样本生产到新分析和结果发生完全重复的直接例子,这显然是低效的。因此,保存原始衍射数据将是保护我们的晶体学研究企业的一种更安全的方式。

通过技术组织我们的讨论,我们旨在证明这些问题在现有国际自然保护联盟委员会范围内的所有活动中都是相关的。相当比例的例子来自于大分子晶体学,但我们希望这篇文章能促进其他领域更多需要原始数据的案例的报道。我们还注意到,我们的案例研究分为三大类:数据共享有益的案例研究、数据保存对取得进一步进展至关重要的案例研究和数据缺失是一个重大问题的案例研究(表1[链接]).

表1
本文中的案例研究摘要

“共享”、“保存”和“无数据”类别对应于§最后一句中描述的科学进步的好处或障碍[链接]1

章节 结构/主题 字段 类别
§[链接]4.1 反式-白藜芦醇 化学晶体学 无数据
§[链接]4.2 特兰多普利 粉末衍射 共享
§[链接]4.3 顺铂/卡铂 高分子 共享
§[链接]4.4 TDS校正 装药密度 保存
§[链接]4.5 线性铁络合物 电荷密度 无数据
§[链接]4.6 hCEACAM1/hTIM-3 高分子 共享
§[链接]4.7 脯氨酸生物合成酶 高分子 共享
§[链接]4.8 脂氧合酶 高分子 共享
§[链接]4.8 运动神经元存活蛋白 高分子 共享
§[链接]4.8 鼠伤寒沙门氏菌StSurE公司 高分子 保存
§[链接]4.9 非布拉格散射 物理结晶学 共享

2.一些定义和本文的范围

在单晶结构分析中,“原始”数据被理解为衍射图像,尽管在某种程度上这些图像已经过处理,例如校正畸变或漫射场。原始数据也可以称为“主要”数据,这是另一个完全可以接受的术语。通过对这些衍射图像的处理,可以预测布拉格反射拦截探测器的位置(布拉格点),并估计其强度;这一步包括,首先,确定晶体的单位-细胞参数。根据这些经过处理的衍射数据,确定并完善了分子模型。模型中原子的最终坐标和原子位移参数称为导出数据。晶体结构分析、探针和方法涵盖了X射线、中子和电子的使用,上述描述符(原始数据、处理数据和衍生数据)适用于每种情况。

除了单晶外,还有其他类型的实验样品,粉末、纤维、表面、无定形固体或液体或气体。在实践中,没有真实的晶体或其他材料样品符合理想化模型,衍射图案或其他结构实验数据集的解释必须注意不要丢弃描述实际样品但与理想化模型不一致的重要特征。就本文而言,由于没有经过中间处理的数据,这些非单晶衍射实验的实验“原始”衍射数据构成了“数据”,可能存在定义过于笼统的风险。整个衍射图像直接导致导出的分子模型及其结构动力学。如上文所述,这种原始数据有时被称为“主要”数据。在粉末衍射图案的情况下,在理想的样品情况下,全二维衍射图案可以还原为一维衍射轮廓。

`通过衍射研究的实际样品不必处于上述任何理想状态。因此,单晶可以有各种缺陷或动态,无论是在短范围内单位电池或跨越多个单元,导致布拉格峰下方或布拉格峰之间的“漫散射”。因此,显然,研究潜在无序和动力学需要原始衍射图像。Welberry&Weber(2016)对漫散射方法和“配对分布函数(PDF)”进行了最新的广泛综述【Welberry,T.R.&Weber,T.(2016年),《结晶学家》第22版,第2-78页。】)和Billinge(2018年[Billinge,S.J.L.(2018),《国际结晶学表》,第H卷,第5.7章。在媒体上。])分别是。

本文的范围仅限于从衍射数据进行单晶和粉末结构分析。

3.关于原始衍射数据保存和访问的一些历史

这已经被设想了很长一段时间(斯特里克兰等。, 2008[Strickland,P.,McMahon,B.&Helliwell,J.R.(2008),学习出版物21,63-72。])保存和访问原始衍射数据很重要,但在技术和组织上都具有挑战性;引用斯特里克兰的话等。(2008[Strickland,P.,McMahon,B.&Helliwell,J.R.(2008),学习出版物21,63-72。]):

理想情况下,完整的科学记录应提供对原始数据的访问……IUCr正开始考虑采用长期方法来存档原始数据。

原始衍射数据的出版是劳伦斯·布拉格(Lawrence Bragg)关于碱卤化物晶体结构的出版物中最早的范例之一,他的文章中包含了他自己的大量在剑桥测量的“劳厄衍射照片”(Bragg,1913)[Bragg,W.L.(1913),《伦敦社会科学院院刊》,第A辑,第89248-277页。]).

最近,IUCr全球衍射数据沉积工作组(DDDWG)在六年多的时间里,研究了将原始衍射数据集与现代出版物联系起来的问题和前景。已经取得了相当大的进展。2011-2014年的报告见https://bit.ly/2xU7nBz。年的一系列论文结晶学报D辑(特威利格,2014【Terwilliger,T.C.(2014),《水晶学报》,D70,2500-2501。】; Guss&McMahon,2014年【Guss,J.M.和McMahon,B.(2014),《结晶学报》,第70期,第2520-2532页。】; Kroon-Batenburg&Helliwell,2014年【Kroon-Batenburg,L.M.J.和Helliwell,J.R.(2014),《结晶学报》第70期,第2502-2509页。】; 迈耶等。, 2014【Meyer,G.R.、Aragáo,D.、Mudie,N.J.、Caradoc-Davies,T.T.、McGowan,S.、Bertling,P.J.和Groenewegen,D.、Queette,S.M.、Bond,C.S.、Buckle,A.M.和Androulakis,S.(2014),《结晶学报》第70期,第2510-2519页。】; Terwilliger&Bricogne,2014年【Terwilliger,T.C.&Bricogne,G.(2014),《水晶学报》第70期,第2533-2543页。】)概述了存档原始衍射数据的原因、实用性和潜在好处。还值得指出的是,DDDWG的努力刺激了蛋白质数据库的重大发展,蛋白质数据库现在将其沉积过程网络形式的一部分用于发现原始衍射数据的详细位置(图1[链接])和IUCr日志(IUCrJ大学,应用晶体学杂志,结晶学报D辑结晶学报第F节)已经开始将他们的出版物与存储在存储库中的主要晶体数据集联系起来。这提供了完整的“记录版本”,使后来的研究人员能够审查整个科学论证。事实上,当文章提交出版时,可以提供原始数据供检查,这是一个强有力的理由。

[图1]
图1
wwPDB沉积和注释系统(Young., 2017[Young,J.等人(2017),《结构》,第25期,第536-545页。])现在,储户可以识别相关实验数据集的位置(doi)及其支持元数据。图由RCSB蛋白质数据库提供,经许可在此复制。

公开所有基础数据以供审查的重要性怎么强调也不过分。自成立以来,IUCr期刊论文提交系统允许以结构因子的形式上传坐标和处理过的数据。长期以来(自20世纪90年代以来),对于化学结晶学领域的一些期刊来说,向审稿人提供此类数据是强制性的,并且在生物结晶学中也是可能的。显然,这样做的好处是,编辑和审稿人可以将提交的文章及其附带的结构因素和原子坐标放在一起考虑,从而与作者就这三者的公认“记录版本”达成一致。我们中的一位(JRH)回忆起他早期对提供实验数据进行仔细审查的热情,因为1977年,当他向主考提交DPhil论文时,他将微缩胶片上的衍射数据包含在了论文中!保存的原始数据集的广泛可用性只会有助于将审查者的审查范围扩大到尽可能接近实际实验。

4.科学案例研究

4.1. 化学晶体学案例研究

扎里赫塔等。(2016【Zarychta,B.、Gianopoulos,C.G.和Pinkerton,A.A.(2016),生物有机医学化学快报,第26期,第1416-1418页。】)注意到晶体结构属于反式-Caruso报道的白藜芦醇等。(2004【Caruso,F.,Tanski,J.,Villegas-Estrada,A.&Rossi,M.J.(2004),《农业与食品化学》52,7279-7285。】)包括一个动态无序的氢键网络,如Zarychta所示等。(2016【Zarychta,B.、Gianopoulos,C.G.和Pinkerton,A.A.(2016),生物有机医学化学快报,第26期,第1416-1418页。】)而是两个晶体学上独立的分子的叠加反式-白藜芦醇。后一种结构在单位电池是之前报告体积的两倍(图2[链接]). 重新确定反式-白藜芦醇的结构包括重复原始研究的所有步骤,从原材料的购买到精炼和结构分析,因为原始衍射图像不可用或更可能没有保存。扎里赫塔等。(2016【Zarychta,B.、Gianopoulos,C.G.和Pinkerton,A.A.(2016),生物有机医学化学快报,第26期,第1416-1418页。】)声明:

乙醇-水溶液的初始结晶实验证实了先前报告的结果,即最小尺寸为约。然而,获得了10µm单位电池观察到体积是先前报道的两倍。

[图2]
图2
修正后的晶体结构反式-白藜芦醇使一个单位-细胞维度加倍。原始分析和正确分析中遗漏了较弱的交错层线单位电池在重新分析中确定。有关详细信息,请参阅文本。经作者许可复制(扎里赫塔等。, 2016【Zarychta,B.、Gianopoulos,C.G.和Pinkerton,A.A.(2016),生物有机医学化学快报,第26期,第1416-1418页。】)和日志生物有机和药物化学快报.
如果原始衍射数据可用,这不太可能是一个单独的重新解释示例,可以快速、廉价地进行。

4.2. 粉末衍射案例研究

里德等。(2016【Reid,J.R.、Kaduk,J.A.和Vickers,M.(2016)。粉末差异31、205-210。】)承担了晶体结构曲多普利C的测定24H(H)34N个2O(运行)5,并显示了原始数据沉积在粉末衍射文件中的实用性。粉末衍射数据晶体结构特兰多普利(来自伦敦大学学院)的质量很高(图3[链接]). Reid评论了在PDF中保留原始粉末衍射数据的好处,这是一项持续多年的活动等。(2016【Reid,J.R.、Kaduk,J.A.和Vickers,M.(2016)。粉末差异31、205-210。】)声明

这项工作说明了将原始数据包含在PDF中的优点之一,以及粉末衍射社区内合作解决新结构的潜力。原始粉末衍射数据还显著改善了具有各向异性展宽特征或结晶度较差的材料(如粘土、聚合物和非晶材料)的说明。

[图3]
图3
ICDD的一个例子:()高质量的粉末衍射数据晶体结构在PDF中举行的trandolpril(伦敦大学学院);(b条)的晶体结构特兰多普利的作品。经里德许可复制等。(2016【Reid,J.R.、Kaduk,J.A.和Vickers,M.(2016)。粉末差异31、205-210。】)和日志粉末衍射.
国际衍射数据中心(里德等。, 2016【Reid,J.R.、Kaduk,J.A.和Vickers,M.(2016)。粉末差异31、205-210。】)还对原始粉末衍射数据的收集和发布进行了如下评论:

虽然国际衍射数据中心(ICDD)多年来收集了由赠款受助人和私人捐助者提交的原始粉末衍射数据,但在2008年发布的粉末衍射文件PDF-4产品中,ICDD开始将原始数据作为新的和旧的PDF条目的一部分发布。

4.3. 合作与批判的大分子晶体学案例研究

科隆-巴滕堡等。(2017【Kroon-Batenburg,L.M.J.,Helliwell,J.R.,McMahon,B.&Terwilliger,T.C.(2017),国际癌症研究联合会,4,87-99。】)描述他们在曼彻斯特大学和乌得勒支大学合作研究重要抗癌药物顺铂和卡铂与蛋白质中组氨酸结合时,存档和共享原始衍射图像的经验。通过他们的原始数据共享(Tanley,Schreurs等。, 2013【Tanley,S.W.M.,Schreurs,A.M.M.,Helliwell,J.R.&Kroon-Batenburg,L.M.J.(2013),《应用结晶杂志》第46期,第108-119页。】),使用进一步分析原始衍射图像XDS公司(卡布施,1988年【Kabsch,W.(1988),《应用结晶杂志》,第21期,第916-924页。】)由Kay Diederichs博士进行,并在高氯盐浓度下卡铂转化为顺铂后进行了详细的晶体评估。这导致了一项新的研究,涉及在非NaCl条件下鸡蛋白溶菌酶与卡铂的结晶,该研究由Diederichs博士(Tanley,Diederich)进行并发表等。, 2013【Tanley,S.W.M.,Diederichs,K.,Kroon-Batenburg,L.M.J.,Schreurs,A.M.M.&Helliwell,J.R.(2013),《同步加速器辐射杂志》第20期,第880-883页。】; 见图4[链接]).

[图4]
图4
大分子晶体学中原始衍射数据共享的好处示例:避免在高浓度氯化钠下卡铂转化为顺铂。()部分转化的卡铂(Tanley,Diederichs等。, 2013【Tanley,S.W.M.,Diederichs,K.,Kroon-Batenburg,L.M.J.,Schreurs,A.M.M.&Helliwell,J.R.(2013),《同步加速器辐射杂志》第20期,第880-883页。】)和(b条)替代结晶条件导致对卡铂与组氨酸结合的最佳研究(Tanley等。, 2014[Tanley,S.W.M.,Diederichs,K.,Kroon Batenburg,L.M.J.,Levy,C.,Schrers,A.M.M.和Helliwell,J.R.(2014)。晶体学报F70,1135-1142]). 经IUCr许可复制。

这项工作的另一个原始数据集的下载涉及对沙巴林的批评引起的一系列结构修改等。(2015【Shabalin,I.,Dauter,Z.,Jaskolski,M.,Minor,W.&Wlodawer,A.(2015),《结晶学报》第71期,1965-1979年。】)顺铂与各种蛋白质结合的整个领域。该评论引发的随后修订和重新修订的结构(Tanley等。, 2016[Tanley,S.W.M.,Schrers,A.M.M.,Kroon Batenburg,L.M.J.和Helliwell,J.R.(2016)。晶体学报F72,253-254。])为“大分子结构模型的持续改进”范式提供了一个很好的例子(Terwilliger,2012[Terwilliger,T.C.(2012)。ICSTI洞察力:生活出版物,第16-29页。巴黎:ICSTI。https://www.icsti.org/IMG/pdf/Living_publication_Final-2.pdf]). 有关此示例的进一步评论,请参见Kroon-Batenburg等。(2017【Kroon-Batenburg,L.M.J.,Helliwell,J.R.,McMahon,B.&Terwilliger,T.C.(2017),国际癌症研究联合会,4,87-99。】).

4.4. 电荷密度分析示例:热扩散散射校正

在布拉格位置达到峰值的扩散散射是由声子引起的散射,参与声子波的单位细胞数量必然有限,导致即使在家用实验室光源中也能看到宽峰值;有关最近的一个示例及其成功的更正,请参阅尼普特等。(2015【Niepötter,B.,Herbst-Irmer,R.&Stalke,D.(2015),《应用结晶学杂志》,第48期,第1485-1497页。】). 有趣的是,任何特定样品的柔软度都会决定声子波所涉及的单位细胞数量,软晶体将占用更少的单元单元,从而导致更宽的热扩散散射(TDS)峰值。晶体的柔软度和声子的可能行为以及布拉格轮廓下TDS峰的宽度的一个定量单一参数是晶体中的声速,例如可以通过激光产生的超声波测量(参见,例如Edwards等。, 1990[爱德华兹·C.、帕尔默·S.B.、埃姆斯利·P.、海利维尔·J.R.、格洛弗·I.D.、哈里斯·G.W.和莫斯·D.S.(1990)。《结晶学报》A46、315-320。]). 正如尼普特所指出的那样等。(2015【Niepötter,B.,Herbst-Irmer,R.&Stalke,D.(2015),《应用结晶学杂志》,第48期,第1485-1497页。】)使用液氦温度进行X射线衍射数据采集也是降低布拉格峰下TDS强度的一种方法。高度准直的同步辐射也改善了这个问题,因为高质量晶体的布拉格反射轮廓是由样品本身决定的,而不是由相对未准直的家庭实验室X射线束决定的。液氦和高度准直同步辐射的结合将为使用尽可能免费的X射线衍射数据进行最准确的电荷密度研究提供实验方法选择。尼普特详细而仔细的多渠道调查等。(2015【Niepötter,B.,Herbst-Irmer,R.&Stalke,D.(2015),《应用结晶学杂志》,第48期,第1485-1497页。】)说明衍射图像数据处理的方法仍在成熟,并再次赞扬保留原始衍射数据以供重复使用的价值。

4.5. 电荷密度研究的另一个例子

线性铁(I)配合物[K(crypt-222)]{Fe[C(SiMe)的电子密度研究)]2}(汤姆森,2017年【Thomsen,M.K.(2017),博士论文,丹麦奥胡斯大学。】)Zadrozny发表的选定化合物的结构等。(2013【Zadrozny,J.M.,Xiao,D.J.,Atanasov,M.,Long,G.J.,Grandjean,F.,Neese,F.&Long,J.R.(2013),《自然化学》第5期,第577-581页。】)在一份备受瞩目的杂志中非对称单元。随后的重新调查研究涉及该化合物的完全重新合成、结晶和X射线衍射重新测量,并分析了两种不同几何形状的铁(I)配合物。C(SiMe)的椭球体)来自Zadrozny的配体等。(2013[Zadrozny,J.M.,Xiao,D.J.,Atanasov,M.,Long,G.J.,Grandjean,F.,Neese,F.&Long,J.R.(2013),《自然化学》,577-581。])沿C(SiMe)之一的旋转方向拉长)C-Fe-C线周围的配体。这些细长的椭球体显然是由于其模型中的分子几何结构是两个正确几何结构的平均值,Si-C-C-Si扭转角高于和低于平均角度(~22°)~8°。C(SiMe)的概率椭球)Thomsen(2017)确定的结构中的配体【Thomsen,M.K.(2017),博士论文,丹麦奥胡斯大学。】)虽然两项研究中数据收集期间的温度均为100 K,但它们都较小且各向同性更强。汤姆森(2017[Thomsen,M.K.(2017)。博士论文。丹麦奥胡斯大学。])得出结论,之前发布的结构很可能是通过忽略上部结构反思。原始衍射数据的可用性将使重新分析直接可行,而这本可以由原始提交文章的审稿人轻易进行。

4.6. 蛋白质晶体学的一个更正案例

收缩观察给出了晶体收缩的有趣调查。他们的新闻`结构生物学修正突出了科学过程的精华' (https://retractionwatch.com/category/by-subject/basic-lifeciences-retractions/crystallography-retractions)讨论了布隆伯格集团在自然(黄)等。, 2015【Huang,Y.-H.等人(2015)。《自然》(伦敦),517,386-390。】)受到E.Sundberg的批评晶体结构被确定为人类hCEACAM1 IgV结构域和hTIM-3 IgV域(PDB入口)的异二聚体第4季度)由分子置换分辨率为3.4º。Sundberg和Almo意识到CEACAM1形成同二聚体的强烈趋势,并观察到细化统计PDB条目的第4季度非常贫穷。他们从PDB中检索了结构因子数据,发现通过在晶格。Blumberg小组认为,hCEACAM1和hTIM-3褶皱之间的低分辨率和相似性导致作者未能意识到他们使用的是错误的模型。随后的进一步分析表明,hCEACAM1与hTIM-3结合,但在结晶步骤中,hTIM-2显然是蛋白质水解的对象,hCEACAM1的强自结合相互作用导致同二聚体结晶。修正后的结构已作为条目存放在PDB中5微升(黄)等。, 2016[Huang,Y.-H.等人(2016)。《自然》(伦敦),536,359。])和搜索第4季度在PDB中自动重定向到PDB条目5微升这是一个科学过程应该如何运作的学术例子:批判导致了更深入的研究。

4.7. 配体密度的临界分析

最近,CCP4公告栏上发布了一条消息(Tanner,2017)[Tanner,J.J.(2017)。回复:[ccp4bb]PDB中的结构不正确。https://www.mail-archive.com/ccp4bb@jiscmail.ac.uk/msg42167.html。])关于通过完全的再合成、结晶和结构测定脯氨酸-生物合成酶PYCR1(PDB条目5阿特; 克里斯滕森等。, 2017【Christensen,E.M.,Patel,S.M.,Korasick,D.A.,Campbell,A.C.,Krause,K.L.,Becker,D.F.&Tanner,J.J.(2017),《生物化学杂志》292,7233-7243。】). 原始结构PYCR1(PDB条目第2组9; 等。, 2006[Meng,Z.,Lou,Z.、Liu,Z..、Li,M.、Zhao,X.、Bartlam,M.和Rao,Z.(2006)《分子生物学杂志》359、1364-1377。])以低分辨率(3.1º)溶解;它是一种五聚二聚体复合物,与预期相反,NADH配体没有在罗斯曼折叠链C末端的经典NAD(P)H-结合位点结合,但与二聚体界面的结合位点相距25Å。Tanner小组的仔细分析表明第2组9所有五个NADH结合位点均存在结构强负差异密度B类配体的因子特别高。Tanner小组获得了衍射到1.9Å分辨率的晶体,在额外的生物物理研究的支持下,两个NADPH配体可以非常清楚地构建到预期的经典结合位点中。因此,配体结合吡咯烷-5-羧酸还原酶的记录得到了纠正。

4.8. 大分子晶体学中数据的重新解释

这个晶体结构脂氧合酶15S-LOX1在长时间α-螺旋和许多残留物无法模拟成密度(Gillmor等。, 1997【Gillmor,S.A.、Villaseñor,A.、Fletterick,R.、Sigal,E.和Browner,M.F.(1997)。《自然结构生物学》第4期,1003-1009年。】). 等。(2008[CChoi,J.,Chon,J.K.,Kim,S.和Shin,W.(2008)。蛋白质,701023-1032.])知道奥尔德姆的一项研究等。(2005【Oldham,M.L.、Brash,A.R.和Newcomer,M.E.(2005),《生物化学杂志》280、39545-39552。】)他们发现8R-LOX和15S-LOX的结构存在重大分歧。Choi及其同事的仔细检查表明,由晶体双轴相关的两条螺旋线实际上发生了碰撞。结构因子数据从PDB下载;这些被合并到R(右)32对称。作者将该结构重新解释为完美的孪生结构空间组 R(右)3,从而解除了两个相邻分子之间的对称约束。这导致了α-螺旋并产生明确的电子密度。在目前PDB中未合并数据沉积的情况下,对未合并结构因素数据进行统计分析是可能的,尽管在完美的情况下孪生在里面R(右)很难辨别R(右)32对称。

Weiss描述了另一个最近发生的、相当极端的蛋白质结构错误发布并被纳入PDB的案例等。(2016【Weiss,M.S.,Diederichs,K.,Read,R.J.,Panjikar,S.,Van Duyne,G.D.,Matera,A.G.,Fischer,U.和Grimm,C.(2016)。Hum.Mol.Genet.2544717-4725。】),他们描述了他们对晶体结构推测为人类生存运动神经元(SMN)蛋白。森(Seng)等。(2015【Seng,C.O.,Magee,C.,Young,P.J.,Lorson,C.L.&Allen,J.P.(2015),《人类分子遗传学》24,2138-2146。】)报道了全长SMN蛋白的结构(PDB条目4海里6)通过以下方式获得分子置换使用他们的SMN结构Δ7(PDB条目4海里7)而这又是基于其SMN1-4结构,没有为其沉积PDB坐标或结构因子。除其他问题外,疏水性侧链指向疏水性核心,而不是指向疏水性核心,以及螺旋和β-板材变形或缺失。由于SMN1-4数据尚未公布,因此无法重复分子置换计算。细致的检测工作使Weiss和同事们假设晶体实际上是细菌蛋白Hfq,可以在大肠杆菌,的晶体结构其中的具有类似的单元间参数(一旦C类2 PDB入口对称约束4海里7发布)。Hfq模型的拟合度提高了10%R(右)自由的以类似的方式,Weiss和同事能够证明全长SMN蛋白晶体结构实际上是来自大肠杆菌.

Hatti描述了污染蛋白结晶的类似问题等。(2017[Hatti,K.,Mathiharan,Y.K.,Srinivasan,N.&Murthy,M.R.N.(2017),《水晶学报》第73期,第609-617页。]). 生存蛋白的突变伤寒沙门菌表达并结晶StSurE。单位细胞参数与StSurE的不同,但这种结构或结构域用于分子替换。然而,从3.0º分辨率数据获得的结果结构并不令人满意:主干的许多部分与电子密度相符,但R(右)因素改善不超过35%。因此,提交人诉诸于马拉松MR分子置换软件,其中使用了SCOPe数据库中的代表性结构域。得分最高的是脱氢喹啉合酶样折叠。在将数据重新处理为更高分辨率和广泛的模型构建后,该结构被确定为肠道甘氨酸脱氢酶。本文显示了求解序列未知的结构是多么困难,以及使用分子置换可能会想出错误的结构。

4.9. 物理晶体学的一个例子:X射线衍射的新理论

费斯特(2014【Fewster,P.F.(2014),《水晶学报》A70,257-282。】, 2016【Fewster,P.F.(2016),《水晶学报》,A72,50-54。】)提出了一种新的X射线衍射理论;这个(我们引用)

X射线散射的新理论与粉末衍射特别相关。这一理论的基本概念是,晶体或微晶的散射分布在整个空间:这导致即使不满足“布拉格条件”,也可以在“布拉格位置”观察到增强散射。单晶或微晶在任何固定方向上的散射都具有同时产生许多“布拉格位置”的迷人特性。这也解释了为什么衍射峰是从微晶很少的样品中获得的,而这无法用传统理论解释……当应用于粉末散射时,该理论将评估完整的散射剖面,包括峰值宽度和“背景”……强度在布拉格条件外严重分散,因此散射功率也是如此。

通过大量样品对这一新理论的验证表明,理想情况下,将原始衍射数据作为衍射图像而不是一维剖面进行常规存档将是有益的。

5.讨论

这些科学案例表明,人们对重用衍生数据(结构因子)的兴趣日益浓厚,在某些情况下,科学验证需要重新评估原始衍射数据。它们展示了保存原始衍射数据并使其可访问的潜在好处。我们预计,在未来,随着原始衍射数据的可用性,重新评估可能会产生更大的影响,并提高晶体科学的可靠性。

原始衍射数据的可用性是晶体学界的一场革命,并将在未来对我们的继续教育产生影响,晶体学家的持续专业发展。首先,研究人员需要学习与存档、开放、原始衍射数据相关的新协议,以及他们非常熟悉的处理衍射数据和导出坐标。在“存档、开放、原始衍射数据”方法中,资助机构正在研究一项开放科学协议,以提高发现速度,特别是在社会挑战方面,包括“从资助的研究项目一开始就共享数据”。

此外,作为获取原始衍射图像的教育益处,我们可以反映出一个发布其数据工作流程所有方面的详细本体的社区(在我们的情况下结晶信息框架`CIF字典)使收集、分类和分析数据的重要概念变得相当透明。这些为科学家加深对数据分析各个方面的理解提供了非常有价值的材料,因此,在进行分析时变得更加批判性和谨慎。大分子晶体学中强调这一点的一个例子来自Grabowski等。(2016【Grabowski,M.,Langner,K.M.,Cymborowski,M,Porebski,P.J.,Sroka,P.,Zheng,H.,Cooper,D.R.,Zimmerman,M.D.,Elsliger,M.-A.,Burley,S.K.&Minor,W.(2016),《结晶学报》第72期,第1181-1193页。】)世卫组织将分析非最佳数据集,例如在单色数据采集中不当使用过大的旋转范围,或输出结果低于平均值的同步加速器束线。

长期以来,大分子晶体学的数据分析领域一直受到广泛关注,我们在上面重点介绍了几个案例研究。一项已经运行多年的独立倡议是PDB_REDO公司项目(Joosten等。, 2014【Joosten,R.P.,Long,F.,Murshudov,G.N.&Perrakis,A.(2014年),IUCrJ,1,213-220。】). 这提供了重新定义的(新坐标)为每个PDB沉积设置。它还提供了一个有用的服务器来帮助储户查看PDB重做他们当前模型周期的版本精炼沉积前。虽然PDB验证报告是现代晶体结构文章同行评议,不幸的是,在许多情况下,PDB摘要验证报告不足以准确指出文章所作声明的有效性。然后,人们担心会出现结构存储库(Minor)收录和发布的“坏苹果”等。, 2016[Minor,W.,Dauter,Z.,Helliwell,J.R.,Jaskolski,M.&Wlodawer,A.(2016).结构,24,216-220.]). 魏森伯格等。(2013【Weichenberger,C.X.,Pozharski,E.&Rupp,B.(2013),《结晶学报》F69,195-200。】)和波扎尔斯基等。(2013【Pozharski,E.,Weichenberger,C.X.&Rupp,B.(2013),《结晶学报》D69,150-167。】)在《暮色电子密度》中对配体分子的整个可视化区域进行了批判性研究。Smart&Bricogne(2015)提供了一些关于PDB条目中配体重建的案例研究[Smart,O.S.&Bricogne,G.(2015)。结晶学在现代药物发现中的多方面作用,由G.Scapin,D.Patel&E.Arnold编辑,第165-181页。荷兰:斯普林格。https://doi.org/10.1007/978-94-017-9719-1_13。]),基于较差的电子密度和配体几何形状的问题。此外,举例说明配体密度数据不完整的后果,无论是由于错误的数据收集策略还是次优的数据处理。他们的分析导致了几次PDB重新定位。作者主张重新处理原始衍射数据的好处,通过它的归档,因为“在数据集成和处理过程中的其他阶段可能会出现许多错误”。这不仅突出了几个例子,而且暴露了期刊编辑在审查他们接受的文章时需要更加警惕(Rupp等。, 2016[Rupp,B.、Wlodawer,A.、Minor,W.、Helliwell,J.R.和Jaskolski,M.(2016)。FEBS J.283,4452-4457。]). 一些期刊坚持认为PDB验证报告应由作者在提交时提供,这是朝着正确方向迈出的重要一步。根据这些更严格的验证程序,裁判可能需要有足够的技能来评估模型精炼如果需要,要求作者根据他们(裁判)的处方或自己的意愿重新处理原始数据(Helliwell,2017)【Helliwell,J.R.(2017),arXiv:1704.08848。https://arxiv.org/abs/1704.08848。]).

6.总结

本文概述了原始衍射数据的保存。它通过一系列科学案例研究记录了利用数字档案在我们的活动中引发革命的潜力,这些研究是国际自然科学联合会各科学委员会的例证。高容量强健的存储归档是我们现在可以使用的一种极好的资源。

自IUCr执行委员会于2011年成立DDDWG以来,过去六年中,寻求原始衍射保存和再利用机会的动机背后的哲学和实践观点发生了有趣的变化。

当然,由于晶体学家使用的原始数据集的大小、他们在任何一年的研究活动中的典型数量,以及晶体学界相当大的事实(~152000人登记在IUCr世界结晶器名录中;https://www.iucr.org/people/wdc).

除ICDD外,如§[链接]4.2,现有的晶体学数据档案不愿意承担这一挑战的规模,因为成本高,也因为缺乏社区共识。然而,令人高兴的是,晶体学数据库参与或建议了DDDWG,这是既定数据库组织的一个合理立场。尽管期刊可以看到将原始数据与出版物联系起来的哲学上令人信服的论点,但它们还是不愿意接受通过文章传输给它们的原始衍射数据的“机会”(斯特里克兰等。, 2008[Strickland,P.,McMahon,B.&Helliwell,J.R.(2008),学习出版物21,63-72。]). 他们担心的是存储容量和与功能扩展相关的网络带宽过载。一个例外是存在较小的数据集文件,例如小角度X射线散射(SAXS),其中数据附在文章上;有关示例,请参见Rhys等。(2011[Reys,N.H.,Wang,M.-C.,Jowitt,T.A.,Helliwell,J.R.,Grossmann,J.G.和Baldock,C.(2011)。同步辐射杂志,第18期,第79-83页。]). 作为历史背景的一部分,值得注意的是,在IUCr Journals早期,导出的结构因子数据表通常作为计算机生成的表的照片发布在每个晶体结构纸张。当时连处理过的数据都没有计算机存储!

资助机构在制定研究数据管理政策和向其资助的研究补助金持有人征税的同时,不希望负责支付数据档案费用。英国大学的观点是承担数据存档的责任。在这里,曼彻斯特大学作为主要的研究机构,是先驱者之一。这是一项重大的总体倡议,其愿景是开放,以利于改进和加快研究,造福社会(Moedas,2016年[Moedas,C.(2016)。开放创新、开放科学和向世界开放——欧洲愿景。卢森堡:欧盟出版办公室。])是上面描述的Zenodo档案。

总的来说,我们强调所有数据包括原始数据应该向科学文献的读者开放,使他们能够检查作者在给定研究中做出的所有决定。至少,科学在于数据!

致谢

我们非常感谢IUCr衍射数据沉积工作组的所有其他成员:Steve Androulakis(澳大利亚)、Sol Gruner(美国)、D.Marian Szebenyi(美国)和Tom Terwilliger(美国),Edgar Weckert(德国)、John Westbrook(美国)以及Heinz-Josef Weyer(不幸逝世,瑞士)。我们非常感谢STFC的克里斯·莫里斯(Chris Morris)和南安普顿大学的西蒙·科尔斯(Simon Coles)对这份手稿的早期草稿提出了非常有益的意见。我们还感谢一位匿名裁判建议将表1中的案例研究分类[链接]根据它们对存放的数据集的依赖性。

工具书类

第一次引用Billinge,S.J.L.(2018)。国际结晶学表,卷。H(H)第5.7章。在媒体上。 谷歌学者
第一次引用布拉格·W·L(1913)。程序。R.Soc.伦敦Ser。A类,89, 248–277. 交叉参考 中国科学院 谷歌学者
首次引用Caruso,F.、Tanski,J.、Villegas-Estrada,A.和Rossi,M.J.(2004)。农业。食物。化学。 52, 7279–7285. 科学网 CSD公司 交叉参考 中国科学院 谷歌学者
第一次引用Choi,J.、Chon,J.K.、Kim,S.和Shin,W.(2008年)。蛋白质,70, 1023–1032. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Christensen,E.M.、Patel,S.M.、Korasick,D.A.、Campbell,A.C.、Krause,K.L.、Becker,D.F.和Tanner,J.J.(2017)。生物学杂志。化学。 292, 7233–7243. 科学之网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Edwards,C.、Palmer,S.B.、Emsley,P.、Helliwell,J.R.、Glover,I.D.、Harris,G.W.和Moss,D.S.(1990)。《水晶学报》。A类46, 315–320. 交叉参考 中国科学院 科学网 IUCr日志 谷歌学者
第一次引用Fewster,P.F.(2014)。《水晶学报》。A类70, 257–282. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Fewster,P.F.(2016)。《水晶学报》。A类72, 50–54. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Gillmor,S.A.、Villaseñor,A.、Fletterick,R.、Sigal,E.&Browner,M.F.(1997)。自然结构。生物。 4, 1003–1009. 交叉参考 中国科学院 公共医学 科学网 谷歌学者
第一次引用Grabowski,M.、Langner,K.M.、Cymborowski,M.、Porebski,P.J.、Sroka,P.、Zheng,H.、Cooper,D.R.、Zimmerman,M.D.、Elsliger,M.-A、Burley,S.K.和Minor,W.(2016)。《水晶学报》。D类72, 1181–1193. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Guss,J.M.和McMahon,B.(2014)。《水晶学报》。D类70, 2520–2532. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Hatti,K.、Mathiharan,Y.K.、Srinivasan,N.和Murthy,M.R.N.(2017年)。《水晶学报》。D类73, 609–617. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Helliwell,J.R.(2017)。arXiv公司:1704.08848.https://arxiv.org/abs/1704.08848谷歌学者
第一次引用黄,Y.-H。等。(2015).自然(伦敦),517, 386–390. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用黄,Y.-H。等。(2016).自然(伦敦),536, 359. 科学网 交叉参考 公共医学 谷歌学者
第一次引用国际标准化组织(2012)。ISO 26324:2012。信息和文件——数字对象识别系统.https://www.iso.org/iso/catalogie_detail.htm?csnumber=43506谷歌学者
第一次引用Joosten,R.P.、Long,F.、Murshudov,G.N.和Perrakis,A.(2014)。IUCrJ大学,1, 213–220. 科学网 交叉参考 中国科学院 公共医学 IUCr日志 谷歌学者
首次引用Kabsch,W.(1988年)。J.应用。克里斯特。 21, 916–924. 交叉参考 中国科学院 科学网 IUCr日志 谷歌学者
第一次引用Kroon-Batenburg,L.M.J.和Helliwell,J.R.(2014)。《水晶学报》。D类70, 2502–2509. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Kroon-Batenburg,L.M.J.、Helliwell,J.R.、McMahon,B.和Terwilliger,T.C.(2017)。IUCrJ大学,4, 87–99. 科学网 交叉参考 中国科学院 公共医学 IUCr日志 谷歌学者
第一次引用Marsh,R.E.、Kapon,M.、Hu,S.和Herbstein,F.H.(2002)。《水晶学报》。B类58, 62–77. CSD公司 交叉参考 中国科学院 IUCr日志 谷歌学者
首次引用Meng,Z.、Lou,Z.,Liu,Z..、Li,M.、Zhao,X.、Bartlam,M.和Rao,Z.(2006)。分子生物学杂志。 359, 1364–1377. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Meyer,G.R.、Aragáo,D.、Mudie,N.J.、Caradoc-Davies,T.T.、McGowan,S.、Bertling,P.J.和Groenewegen,D.、Queette,S.M.、Bond,C.S.、Buckle,A.M.和Androulakis,S.(2014年)。《水晶学报》。D类70, 2510–2519. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用迈耶,P.A。等。(2016).自然社区。 7, 10882. 科学网 交叉参考 谷歌学者
第一次引用Minor,W.,Dauter,Z.,Helliwell,J.R.,Jaskolski,M.&Wlodawer,A.(2016)。结构,24, 216–220. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Moedas,C.(2016)。开放创新、开放科学和面向世界——欧洲愿景。卢森堡:欧洲联盟出版局。 谷歌学者
第一次引用Niepötter,B.,Herbst-Irmer,R.&Stalke,D.(2015)。J.应用。克里斯特。 48, 1485–1497. 科学网 CSD公司 交叉参考 IUCr日志 谷歌学者
第一次引用Oldham,M.L.、Brash,A.R.和Newcomer,M.E.(2005年)。生物学杂志。化学。 280, 39545–39552. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
首次引用Pozharski,E.、Weichenberger,C.X.和Rupp,B.(2013)。《水晶学报》。D类69, 150–167. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Reid,J.R.、Kaduk,J.A.和Vickers,M.(2016)。粉末差异。 31, 205–210. 科学之网 CSD公司 交叉参考 中国科学院 谷歌学者
第一次引用Rhys,N.H.、Wang,M.C.、Jowitt,T.A.、Helliwell,J.R.、Grossmann,J.G.和Baldock,C.(2011年)。J.同步辐射。 18, 79–83. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Rupp,B.、Wlodawer,A.、Minor,W.、Helliwell,J.R.和Jaskolski,M.(2016)。FEBS J公司。 283, 4452–4457. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Seng,C.O.、Magee,C.、Young,P.J.、Lorson,C.L.和Allen,J.P.(2015)。嗯,分子遗传学。 24, 2138–2146. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Shabalin,I.、Dauter,Z.、Jaskolski,M.、Minor,W.和Wlodawer,A.(2015)。《水晶学报》。D类71, 1965–1979. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Smart,O.S.和Bricogne,G.(2015年)。结晶术在现代药物发现中的多方面作用由G.Scapin、D.Patel和E.Arnold编辑,第165-181页。荷兰:斯普林格。https://doi.org/10.1007/978-94-017-9719-1_13谷歌学者
第一次引用Strickland,P.、McMahon,B.和Helliwell,J.R.(2008)。学术出版物。 21, 63–72. 科学网 交叉参考 谷歌学者
第一次引用Tanley,S.W.M.、Diederichs,K.、Kroon-Batenburg,L.M.J.、Levy,C.、Schreurs,A.M.和Helliwell,J.R.(2014)。《水晶学报》。F类70, 1135–1142. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Tanley,S.W.M.、Diederichs,K.、Kroon-Batenburg,L.M.J.、Schreurs,A.M.M.和Helliwell,J.R.(2013)。J.同步辐射。 20, 880–883. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Tanley,S.W.M.、Schreurs,A.M.M.、Helliwell,J.R.和Kroon-Batenburg,L.M.J.(2013)。J.应用。克里斯特。 46, 108–119. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Tanley,S.W.M.、Schrers,A.M.M.、Kroon Batenburg,L.M.J.和Helliwell,J.R.(2016)。《水晶学报》。F类72, 253–254. 科学网 交叉参考 IUCr日志 谷歌学者
首次引用Tanner,J.J.(2017)。回复:[ccp4bb]PDB中的结构不正确.https://www.mail-archive.com/ccp4bb@jiscmail.ac.uk/msg42167.html谷歌学者
第一次引用Terwilliger,T.C.(2012)。ICSTI见解:活生生的出版物,第16-29页。巴黎:ICSTI。https://www.icsti.org/IMG/pdf/Living_publication_Final-2.pdf 谷歌学者
第一次引用Terwilliger,T.C.(2014)。《水晶学报》。D类70, 2500–2501. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Terwilliger,T.C.和Bricogne,G.(2014)。《水晶学报》。D类70, 2533–2543. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用汤姆森,M.K.(2017)。博士论文。丹麦奥胡斯大学谷歌学者
首次引用Weichenberger,C.X.,Pozharski,E.&Rupp,B.(2013)。《水晶学报》。F类69, 195–200. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Weiss,M.S.、Diederichs,K.、Read,R.J.、Panjikar,S.、Van Duyne,G.D.、Matera,A.G.、Fischer,U.和Grimm,C.(2016)。嗯,分子遗传学。 25, 4717–4725. 科学网 中国科学院 公共医学 谷歌学者
第一次引用Welberry,T.R.和Weber,T.(2016)。结晶器。版次。 22, 2–78. 科学网 交叉参考 中国科学院 谷歌学者
第一次引用J.扬。等。(2017).结构,25, 536–545. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Zadrozny,J.M.,Xiao,D.J.,Atanasov,M.,Long,G.J.,Grandjean,F.,Neese,F.&Long,J.R.(2013)。自然化学。 5, 577–581. 科学网 CSD公司 交叉参考 中国科学院 谷歌学者
第一次引用Zarychta,B.、Gianopoulos,C.G.和Pinkerton,A.A.(2016)。生物有机医药化学。莱特。 26, 1416–1418. 科学网 CSD公司 交叉参考 中国科学院 公共医学 谷歌学者

这是一篇根据知识共享署名(CC-BY)许可证,允许在任何媒体上不受限制地使用、分发和复制,前提是引用原始作者和来源。

IUCrJ大学
编号:2052-2525