大分子结构信息存档中最重要的进展之一是实验数据的沉积,通常以测量强度得出的结构因子振幅的形式沉积到蛋白质数据库(PDB;Bernstein等。, 1977; 伯曼等。, 2000). 这种结构因素数据的可用性使得存款人提供的解释得以验证,关键是也允许做出新的解释。最近,人们广泛讨论了这样一种观点,即不仅应将结构因子的振幅,而且还应将用于导出它们的原始衍射图像存档并提供给公众。这些原始图像构成了真正的原始实验数据,并提供了以后重新处理的机会,以获得更好的强度估计,以比原始工作中使用的更高的分辨率分析数据,检查晶体对称性的解释,分析反映晶体中原子相关运动或无序的漫反射散射,评估和校正辐射损伤,分析晶体中多个晶格的衍射,并作为开发改进分析方法的基准。
国际结晶学联合会于2011年委托衍射数据沉积工作组(DDD WG),由J.Helliwell担任主席,以研究在结晶学中存档原始衍射图像的益处和可行性。DDD工作组在CCP4邮件列表上就这一主题展开了热烈的讨论,举办了研讨会,收集关于存档原始图像的意见,并鼓励广泛分析这些想法和挑战。在本期结晶学报D辑,几位高分子领域的研究人员结构测定撰写了一系列文章,讨论了衍射图像的存档、它将带来的可能性以及它带来的挑战。
在本集的第一篇文章中,Kroon-Batenburg和Helliwell举一个例子,将存档图像提供给任何人都会导致对晶体数据的重新分析和解释。作者和他们的同事之前检查了几个关于溶菌酶与结合顺铂或卡铂的数据集,并使用顺铂中氯的异常信号来区分它们。原始图像被放置在乌得勒支大学和澳大利亚TARDIS原始衍射数据档案馆的公开服务器上。与原始作品无关的K.Diederichs利用这个机会重新分析了原始图像,重新评估了氯的占用率,也重新评估了图像中高分辨率数据的存在(Tanley等。, 2013). 重新分析显示了图像存档的科学效益,但也突出了重新处理图像数据方面的挑战,以及需要使用可用方法捕获和存档与原始图像数据相关的元数据。
接下来,梅耶等。描述如何在TARDIS Raw Diffraction Data Archive中完成图像存档和公开。在澳大利亚同步加速器上,图像被自动处理,同时,它们与处理它们所需的元数据一起存档。研究人员可以使用云计算环境分析衍射数据,并使用web服务器访问数据和结果。此外,用户可以公开访问他们的数据,并通过有关晶体和实验的附加元数据增强其效用。重要的是,可以使用普遍认可的数字对象标识符(DOI)永久识别和检索数据集。这些DOI可以包含在PDB的沉积和出版物中,以便解释可以与数据永久关联。TARDIS的例子表明,为未来的研究提供衍射图像不仅是可能的,而且是实用的。
在本集的第三篇文章中,Guss和McMahon扩展Meyer的讨论等。描述如何一般地完成原始晶体学数据的存档。它们描述了理想档案的特征,包括持久性、可识别性、可发现性、与出版物和存款的链接以及核查。他们接着描述了如何使用集中式归档(例如PDB)或分布式归档来实现这一点,在分布式归档中,集中式归档有明显的好处,但维护它们的成本很高。Guss和McMahon强调了元数据的重要性,元数据是关于实验的信息,可以用来解释实验。这篇文章描述了当前进行原始晶体学数据存档的努力,并提出了研究团体如何促进原始数据存档的广泛努力的愿景。重要的是要注意,可以立即开始努力,向DOI注册原始数据集,需要将社区团结起来,为原始晶体学数据附带的元数据制定标准。
在本系列的最后一篇文章中,布里科涅和我讨论晶体数据的可用性如何使晶体数据解释的持续改进成为可能。随着新方法或改进方法的开发,可用的晶体学数据允许重新解释和改进PDB中的结构。此外,晶体学数据的可用性加速了新方法和算法的发展,使得改进解释成为可能。提供原始衍射图像将扩大这种相互改进方法和结果的迭代过程的范围,因为随着数据处理方法的改进,可以提取更多信息并推导出更准确的衍射强度估计值,同时也可以刺激这些改进他们自己。我们的结论是,随着晶体学数据解释和表示方法的改进,产生的新模型应在PDB中提供,以便PDB用户的广大受众能够获得可用的最准确和完整的模型。
我们都希望你们会喜欢阅读这些文章,并希望它们能在晶体学界引发广泛的辩论和行动。
©国际晶体学联合会。如果引用了原文作者和来源,则无需事先获得许可即可复制本文中的简短引文、表格和数字。有关详细信息,请单击在这里.
| 结构 生物学 |
国际标准编号:2059-7983
免费