计算机程序\(\def\h填{\hskip5em}\def\hfil{\hski p3em}\def\eqno#1{\hfil{#1}}\)

期刊徽标的日志
同步加速器
辐射
国际标准编号:1600-5775

EDNA公司:用于X射线实验在线数据分析的基于插件的应用程序框架

十字标记_颜色_方形_文本.svg

ESRF,6 Rue Jules Horowitz,38043 Grenoble,France,法国,b条EMBL汉堡分站,转交DESY,Notkestrasse 85b,22607 Hamburg,Germany和c(c)英国牛津郡OX11 0DE迪德科特钻石光源有限公司
*通信电子邮件:svensson@esrf.fr

(收到日期:2009年6月26日; 2009年9月10日接受; 在线2009年10月7日)

EDNA公司是一个框架,用于开发基于插件的应用程序,特别是用于X射线实验领域的在线数据分析。本文介绍了EDNA公司简化可扩展科学应用程序开发的框架。该框架包括插件类层次结构、配置和应用程序设施、生成数据类的机制和测试框架。这些实用程序允许快速开发和集成,其中健壮性和质量起着重要作用。介绍了第一个用于大分子晶体学实验的原型,并在多个同步加速器上进行了测试。

1.简介

X射线束线技术的最新进展,包括非常高的光辉第三代同步辐射源的束线和先进的探测器仪器使数据采集速度呈指数级增长。因此,越来越需要一个能够在线优化数据收集策略的数据分析平台。在线数据分析的要求包括实验步骤的自动化或半自动化(涉及计算机或操作员决策)、结果反馈和(准)实时数据质量指标、高数据吞吐率的能力以及图形用户界面(GUI)这为远程访问提供了在分布式同步加速器环境中进行实验的可能性。近年来,开发了软件解决方案,以满足不同X射线实验领域的这些要求,例如大分子晶体学(Lamzin&Perrakis,2000[Lamzin,V.和Perrakis,A.(2000),《国家结构生物学》,第978-981页。]; 莱斯利等。, 2002【Leslie,A.G.W.,Powell,H.R.,Winter,G.,Svensson,O.,Spruce,D.,McSweeney,S.,Love,D.,Kinder,S.、Duke,E.&Nave,C.(2002),《水晶学报》D58,1924-1928年。】; 贝蒂娃等。, 2006【Beteva,A.等人(2006),《结晶学报》,D62,1162-1169,】; 伦纳德等。, 2007【Leonard,G.A.,McCarthy,J.,Nurizzo,D.&Thibault,X.(2007)。同步辐射。新闻,20,18-24。】、索尔蒂斯等。, 2008[Soltis,S.M.等人(2008)《晶体学报》D641210-1221。]; 次要等。, 2006[米诺·W·米诺、辛布罗夫斯基·M·米诺(Cymborowski)、奥特温诺夫斯基(Otwinowski),Z·&赫鲁斯茨(Chruszcz),M·(2006),《水晶学报》D62,859-866.]; 山田等。, 2008【Yamada,Y.、pHonda,N.、Matsugaki,N.、Igarashi,N.、Hiraki,M.和Wakatsuki,S.(2008)。J.同步辐射。15296-299。】)小角度X射线散射(Konarev等。, 2006[科纳列夫,P.V.,佩图霍夫,M.V.,沃尔科夫,V.V.&斯维尔根,D.I.(2006),《应用结晶杂志》,第39期,第277-286页。])和X射线吸收光谱(Sanchez del Rio,1997[桑切斯·德尔·里奥(Sanchez del Rio,M.)(1997),《物理学杂志》第四卷第二期,209-210页。]; 科尔巴斯等。, 2006【Korbas,M.,Fulla Marsa,D.&Meyer-Klaucke,W.(2006),《科学仪器评论》77,063105。】; 伦纳德等。, 2009【Leonard,G.、Solé,V.A.、Beteva,A.、Gabadinho,J.、Guijarro,M.、McCarthy,J.,Marrochelli,D.、Nurizzo,D.、McSweeney,S.和Mueller-Dieckmann,C.(2009),《应用结晶杂志》,第42期,第333-335页。】).

在线数据分析软件面临的挑战之一在于能够顺利集成现有软件的扩展。以灵活和可配置的方式添加新功能,或调用不同的外部科学程序来处理特定步骤(顺序或并行),确实是现代面向对象软件的关键点。许多同步加速器设施的趋势是采用基于组件体系结构的现代软件技术,包括应用于设备控制系统的CORBA技术(Chaize等。, 1999【Chaize,J.M.、Gotz,A.、Klotz,W.D.、Meyer,J.、Perez,M.和Taurel,E.(1999)。加速器和大型实验物理控制系统内部会议,意大利的里雅斯特。】; Gibbons&Pulford,2006年【Gibbons,P.&Pulford,W.C.(2006)。金刚石光源,https://www.diamond.ac.uk/ .])和/或图形砖组件,以构建更高级别的Python、Java或Eclipse RCP GUI(Guijarro,2004[Guijarro,M.(2004)。BLISS项目,https://lns00.psi.ch/nobugs2004/papers/paper00065.pdf .]; 索莱等。, 2007[Solé,V.A.,Papillon,E.,Cotte,M.,Walter,Ph.和Susini,J.(2007)。光谱化学学报,B62,63-68。]; 戈茨,2007年[Gotz,A.(2007)。FABLE,https://fable.wiki.sourceforge.net网站/ .]).

另一个重要考虑因素是集成数据管理系统,该系统允许对实验数据进行完整定义,在某些情况下,实验数据可能非常复杂。此外,有效的错误跟踪机制对于以用户友好的方式传播潜在的警告和错误消息至关重要。最后,一个强大的测试框架对于保证代码的健壮性、质量信心以及低维护成本至关重要。

这个EDNA公司这里描述的框架是为了解决这些具有挑战性的问题而开发的。基于面向对象的插件架构,EDNA公司是一个技术平台(或框架),它集成了科学组件(或插件)开发工具、数据模型定义实用程序、自动数据类生成机制和测试框架。拥有这样的框架对于协作科学软件开发尤其重要。它允许快速开发可扩展和可定制的X射线在线数据分析应用程序,回归风险低,可信度高。

我们利用该框架开发了第一个应用原型edna-prototype,其目的是在考虑辐射损伤的情况下,完全自动化计算同步加速器束线处大分子晶体的优化数据收集策略。这个EDNA公司本文描述了框架和第一个原型。

2.定义

一个插件是一个可重用和可配置的软件组件,可以由应用程序动态加载,以扩展其现有功能。

在计算中框架是一个模块化工作台,它提供了一组用于开发应用程序的库、工具和约定。它提供了必要的软件块,并规定了足够的规则,以允许构建既健壮又易于维护的已完成应用程序。

一个内核是系统的核心。它提供了可以开发上层的所有必要功能。

目标单元测试是隔离程序的每个部分,并显示各个部分是正确的。

在面向对象编程中,由数据字段和方法组成的数据结构也被称为数据类.A型数据模型是数据类的抽象描述,显示了如何表示和访问数据。

3EDNA公司框架

这里的主要目标是为在线数据分析的典型问题提供答案。例如,

(i) 复杂且异构的输入数据。

(ii)技术配置:正确运行各个工作流步骤所需的技术参数,例如用于中间步骤的第三方程序的标识。

(iii)在不同步骤之间传输复杂的异构数据。

(iv)性能(由高速实验设定)和尽可能并行处理的必要性。

(v) 对结果和数据以及质量指标的反馈。

(vi)坚固性。

这个EDNA公司框架由对应于系统核心的内核和一组功能组件组成。这个EDNA公司内核为构建可配置组件(插件)、数据模型和应用程序提供了必要的实用程序,同时考虑了上述所有技术问题。它还提供了一个测试框架,以促进单元测试和执行测试的开发。的主要组件EDNA公司内核将在以下部分中进行描述。

3.1. 插件设施

组件按逻辑类层次结构组织(图1[链接]). 这种层次结构使开发新的功能插件变得简单易行,方法是从适当的父级派生插件。设计了两类插件:第一个分支包含负责执行特定操作的执行插件(EDPluginExec类)(例如执行第三方软件);第二个分支包含控制插件(EDPluginControl类),它们负责数据流(数据的传播)、工作流(适当执行插件的顺序或并行执行)和错误跟踪机制(错误的传播)。

[图1]
图1
EDNA公司插件类层次结构。除了继承自基本AALib类ALPlugin的功能外(Pieritz,2007[Pieritz,R.A.(2007)。AALib——异步操作库项目,https://aalib.sourceforge.net网站/ .]),的EDNA公司公共父类EDPlugin提供了可配置的属性,可以有输入和输出数据。EDPluginExec组与特定操作的执行相关,而EDPluginControl组负责数据流和工作流。EDPluginExecProcess是能够执行外部进程的特定EDPluginExec。EDPluginExecProcessScript是一种能够启动外部进程的专用EDPluginExecProcess通过脚本。

这两个系列的共同父类是EDPlugin类。此类允许所有派生插件具有输入和输出数据,并且可以进行配置通过应用程序配置文件(参见§3.3[链接])它应该包含插件正常运行所需的所有技术参数(工作目录、调用的可执行文件等。). 插件输入和输出数据包括插件要提供和返回的所有科学参数。插件输入和输出数据采用XML(可扩展标记语言)格式,可以在特定的数据模型中定义和描述(请参阅下一节)。

每个插件都存储在特定的存储库目录中,其中包含相关的代码源、数据模型和测试套件。

3.2. 数据模型设施

描述数据对于处理数据可能非常复杂的X射线实验的应用尤其相关。在数据模型中组织它们对文档和通信都很有好处,并且使实现更加简单。它允许自动生成数据类,这对于生产力和再现性来说是一个有价值的功能。

这个EDNA公司kernel提供了一个数据模型工具包,允许构建高级应用程序所需的详细数据模型。此外,它允许设计可以进行统一测试的统一数据模型,以便插件可以独立于任何应用程序上下文启动和测试。此工具包由通用低级类定义组成,包括通用类型(XSDataString、XSDataFloat等。)和X射线实验课,在设计特定组件数据模型时可以重复使用。它以多种标准数据格式提供,包括XMI(XML元数据交换)和XSD(XML模式定义),以便于导入UML(统一建模语言)数据建模工具和/或XSD文件。该框架还包括代码生成机制(Kuhlman,2004[Kuhlman,D.(2004).generateDS-从XML模式生成数据结构,https://www.rexx.com/~dkuhlman/generateDS.html。])允许从UML图到Python代码的自动代码生成通过XSD格式。

3.3. 应用程序设施

这个EDNA公司内核还包括EDApplication类,它可以用作更专用的应用程序的父类。由于EDApplication能够启动任何给定插件(封装在EDPluginControl中的单个或多个插件)及其配置属性,EDApplication使应用程序系统具有高度通用性和灵活性。提供了两种启动特定插件的方法。第一个是通过edna-prototype-plugin-launcher命令,通过提供要执行的插件(–execute<pluginName>)、XML应用程序配置文件(–conf<configurationFileName>;图2[链接])以及相关插件的XML输入数据文件(–inputFile<dataFileName>)。第二个是通过EDApplication构造函数。可以参考所有可用选项通过–help选项。

[图2]
图2
XML应用程序配置文件。可以配置应用程序的每个插件通过XSPluginItem部分。可以通过设置XSParamItem部分来配置特定的插件参数。

3.4. 测试设施

为了方便高效地测试应用程序和组件,开发了一个测试框架并与内核集成。为了确保组件的可靠性和健壮性,测试框架提供了所有必要的实用程序,以统一方式(EDTestCasePluginUnit)或通过在应用程序上下文中测试其执行情况(EDTestCasePluginExecute)来检查类(EDTestCase)和插件(EDTestCasePlugin)。这些测试类按图3所示分层组织[链接]。这些测试系列可以自动启动通过测试套件。通过比较获得的结果和预期的结果(断言机制),对测试结果进行自动分析,以便成功的测试证明结果符合预期(图4[链接]). 这使得在实现新组件或重新实现现有组件的功能时具有高度的信心。

[图3]
图3
EDNA公司测试类层次结构。这个组织促进了类测试以及插件单元测试和执行测试的开发。
[图4]
图4
的测试报告EDNA公司内核测试套件。

4.MX数据采集应用原型

4.1. 科学用例

使用旋转方法收集大分子晶体学(MX)中的典型数据(Arndt&Wonnacott,1977[Arndt,U.W.&Wonnacott,A.J.(1977),《晶体学中的旋转方法》,阿姆斯特丹:北荷兰。])包括初步步骤:测量研究中晶体的一些衍射图案(参考图像),并对其进行评估。该程序旨在确定基本晶体学参数(单位-细胞尺寸和假设劳厄班级,晶体取向、镶嵌性、衍射斑点形状),并评估数据中的信噪比。根据这些处理结果,确定了数据采集参数(数据采集分辨率、旋转范围、振荡宽度和曝光时间,统称为“数据采集策略”),并确定了样品对特定晶体学问题的适用性。在第三代光束线的现代数据收集程序中必须考虑的另一个因素是晶体的预期可持续辐射剂量(Owen等。, 2006[Owen,R.A.,Rudino-Pinera,E.&Garman,E.F.(2006),美国国家科学院院刊,103,4912-4917。]; Ravelli&Garman,2006年[Ravelli,R.&Garman,E.F.(2006),《当前操作结构生物学》,第16期,第624-629页。]). 在较弱的源中,实验可用的总时间可能会形成很大的限制。此类程序(手动、半自动或全自动)对于获得可接受的质量衍射数据至关重要,不能被一组对大多数样品都满意的“标准”数据采集条件所取代(Dauter,1999【Dauter,Z.(1999),《水晶学报》D551703-1717。】; 埃文斯,1999【Evans,P.R.(1999),《水晶学报》,D551771-1772。】).

参考图像解释和/或数据采集策略参数子集(旋转范围和振荡宽度)的确定的各个步骤可由可用的数据处理包轻松执行[MOSFLM公司(莱斯利,1992年【Leslie,A.G.W.(1992).Jnt CCP4/ESF-EACMB Newsl.蛋白质结晶器.26.】),标签(绍特等。, 2004【Sauter,N.K.,Grosse-Kunstleve,R.W.&Adams,P.D.(2004),《应用结晶杂志》,第37期,第399-409页。】),XDS公司(卡布施,1993年【Kabsch,W.(1993),《应用结晶杂志》,第26期,第795-800页。】),香港(HKL)(Otwinowski&Minor,1997年[Otwinowski,Z.&Minor,W.(1997),《酶学方法》,276307-326。]),D*轨道(Pflugrath,1997年【Pflugrath,J.W.(1997),《酶学方法》,276286-306。】)]. 根据参考图像处理的结果和建议实验的信噪比要求,该程序最佳(波波夫和布伦科夫,2003年[Popov,A.N.&Bourenkov,G.P.(2003),《结晶学报》,第59期,第1145-1153页。])对一整套数据采集参数进行联合优化,其中主要包括曝光时间和数据采集分辨率。因此,定量地考虑了辐射损伤对数据中信噪比的预期影响(Bourenkov&Popov,2006)[Bourenkov,G.P.&Popov,A.N.(2006),《结晶学报》,D62,58-64。]; 布伦科夫等。, 2006【Bourenkov,G.P.,Bogomolov,B.A.&Popov,A.N.(2006),第四届生物晶体样品X射线损伤国际研讨会,日本春8。】). 策略计算的一个基本参数是X射线剂量沉积率,它又由样品的化学成分、入射光束能量和通量密度,可以使用放射性核素软件(Murray等。, 2004【Murray,J.W.、Garman,E.F.和Ravelli,R.B.G.(2004),《应用结晶杂志》,第37期,第513-522页。】, 2005【Murray,J.W.,Rudiño-Piñera,E.,Owen,R.L.,Grininger,M.,Ravelli,R.B.G.&Garman,E.F.(2005),《同步辐射杂志》第12期,第268-275页。】). 的主要功能最佳策略是在几个楔形物中收集数据,曝光时间和振荡宽度在旋转范围内变化,以补偿由于辐射引起的散射功率衰减造成的信噪比下降,以及根据衍射的固有各向异性和晶体相对于光束的取向来调整测量条件。

这项工作的主要目标EDNA公司MX应用程序原型将提供以完全自动化的方式实现上述过程的软件。讨论了在线数据分析的主要特征(如§3所述[链接]). 特别是,这里要考虑的复杂和异质的输入数据是参考图像及其实验条件、可选的先验知识(空间组)、样品描述和衍射计划(实验要求,如所需的分辨率、完整性、多样性等。).

在以下部分中,我们将简要介绍EDNA公司MX应用程序原型和初始测试结果。该实现和实验结果的详细信息将在其他地方发布(Svensson等。,正在准备中[Svensson O.等人准备中]).

4.2. 工作流

的工作流程EDNA公司MX应用程序原型如图5所示[链接]。索引步骤可以使用以下任一方法实现MOSFLM公司标签在这一步中,将向用户报告一组假定的索引解决方案(Bravais格和单位单元)。通过以下方式选择一种解决方案进行进一步处理MOSFLM公司(或标签取决于工作流)根据先验的已知空间组用户提供的晶体或完全自动。在后一种情况下,对称性最低空间组选择匹配晶格对称性。利用晶格对称约束对标引解进行细化,并估计晶体镶嵌性。的结果精细化, 用分度反射点的数目、预测到的观测点位置的均方根误差和精细的直射光束坐标的偏移作为定量标准来判断分度解的成功和准确性。为了进一步控制,将为每个参考图像生成衍射图案的灰度表示(JPEG格式),并覆盖预测的斑点位置。

[图5]
图5
EDNA公司MX应用程序原型工作流。

然后在集成步骤中使用选定的索引解决方案和优化的梁坐标。同时,根据策略计算的要求测量径向X射线背景最佳集成(与MOSFLM公司)对每个参考图像并行执行。积分步骤的样品表征输出包括数据统计(强度与其估计标准不确定度的平均比值,I/SigI),分别显示在每个参考帧的相应分辨率外壳中。

策略插件结合了来自放射性核素和战略计算最佳.对于剂量率计算,晶体的含量非对称单元,结晶生物分子、配体和结晶溶液的化学成分需要用户提供。这个EDNA公司应用程序原型具有晶体内容的广泛数据模型,允许任何晶体结构准确描述(图6[链接]). 检查分度溶液与规定晶体含量的一致性通过溶剂含量计算(Matthews,1968[Mathews,B.(1968),分子生物学杂志,第33491-497页。]); 如果预测的溶剂含量超出25–75%的范围,则发出警告。可以选择使用默认的蛋白质化学成分。

[图6]
图6
高分子晶体化学成分的数据模型和定义。晶体由溶剂(XSDataSolvent)和生物聚合物分子(XSDataStructure)组成。基本上,生物聚合物由蛋白质/核酸链(在上述数据模型中称为“类型”)和配体组成。对于每条链,应提供有关单体(氨基酸或核苷酸)数量、聚合物中相同链的数量和重原子鉴定的信息。对于每个配体,还应提供有关重原子和轻原子以及分子中配体拷贝数的信息。

在程序的最后一步,程序最佳被调用。输入到最佳包括参考图像的先前处理结果和用户对“衍射图”(Beteva)中制定的实验数据的要求等。, 2006【Beteva,A.等人(2006),《结晶学报》,D62,1162-1169,】). 最低要求是外分辨率外壳中的目标I/SigI,以及数据集的最大总曝光时间。可选地,衍射计划可以包括分辨率极限和数据完整性的所需值,收集具有给定(高)多重性的数据的要求,每帧振荡宽度的限制,以及禁用振荡宽度和曝光时间变化的可能性旋转角度(多个子楔策略功能)。策略输出包括数据收集的优化计划(表1[链接])以及根据计划收集的数据的预测统计(表2[链接]). 标准完整性、多样性、I/SigI和R(右)合并解析shell中的统计信息的定义方式是,它们可以直接与使用标准数据处理包的数据处理结果进行比较。

表1
SurE晶体的数据收集计划

N个 φ开始(°) 旋转宽度(°) 图像数量 每张图像的曝光
1 54 0.3 267 14.1
2 134.1 0.3 83 40.5
159 0.3 17 85.1

表2
数据处理统计

相应的预测统计(来自最佳)括号中给出:R(右)合并=Σ香港特别行政区Σ|(香港特别行政区)− 〈(香港特别行政区)〉|/Σ香港特别行政区Σ(香港特别行政区). 〈香港特别行政区〉表示对称等效和冗余测量的平均值。

  总体 内壳 外壳
低分辨率极限(Au) 20 20 3.06
高分辨率极限(Ω) 2.90 9.17 2.90
R(右)合并(%) 8.1 (6.5) 4.8 (2.6) 29.4(42.1)
平均值[()/标准偏差()] 11.7 (14.2) 30.7 (35.2) 4.0 (3.0)
完整性(%) 97.4 (98.9) 93.2 (95.3) 99.6 (99.7)

4.3. 实施

该原型的设计和开发目的是易于配置、可扩展和平稳维护。这得益于技术设施EDNA公司该框架提供了包括配置工具、可重用组件库、数据驱动的代码生成机制和测试框架。

图形用户界面(图7[链接])和命令行模式可用于启动应用程序原型。在命令行模式下,输入要么是包含参考图像、光束参数、衍射平面图和(可选)样品化学成分完整描述的XML文件,要么是参考图像文件本身。在后一种情况下,可以定义图像标题中未定义的实验参数以及衍射平面参数通过特定的命令行参数。CCP4中集成的基本Tcl/Tk GUI(协作计算项目,1994年第4期[合作计算项目,第4期(1994年),《晶体学报》,D50,760-763。])开发该套件的目的是为了方便输入所有需要的参数,这些参数在命令行模式下可能很难实现。输出(执行文本输出和预测图像)显示给用户通过CCP4i GUI。此外,所有处理步骤的完整结果都可以在XML文件中获得,并且可以轻松链接到数据收集GUI。这已在CBASS公司国家同步辐射光源(布鲁克海文)光束线的软件(J.斯金纳,私人通信)。

[图7]
图7
EDNA公司MX应用程序原型GUI屏幕截图。GUI由四个面板组成。第一个面板定义了输入数据(图像或XML实验描述符)和基于平均蛋白质晶体成分或明确定义的晶体成分使用的辐射损伤模型类型(如果选择了辐射损伤模式帐户)。第二个面板定义了衍射平面。当基于辐射损伤的策略选项处于活动状态时,启用第三个(光束参数定义)面板;当要求明确的化学成分定义时,激活可选的第四个面板。

4.4. 测试

几个使用此的测试数据集合EDNA公司应用原型已在欧洲同步辐射设施束线上完成。在这里,我们展示了来自空肠弯曲菌(冈萨尔维斯等。, 2008【Gonçalves,A.M.D.,Rêgo,A.T.,Thomaz,M.,Enguita,F.J.和Carrondo,M.A.(2008)。晶体学报F641213-216。】). SurE晶体属于空间组 P(P)212121其中有四个分子不对称单元。每条链由267个氨基酸残基组成。实验在光束线ID14-2处进行,波长为0.93和ADSC Q4探测器。X射线束横截面为0.15×0.15mm(FWHM),与晶体尺寸相匹配(略微超过)。这个光子通量为1.2×1011光子−1,使用强度监视器测量。测量了旋转角度为0°和90°时的两个参考图像(图8[链接])并用于原型的样品表征。已保存完整的特性输出。1

[图8]
图8
SurE晶体的参考衍射图像。分辨率限制为2.8在探测器边缘。曝光时间5第条。

晶体的衍射质量较差,镶嵌度为0.6°,表观衍射极限为~3.3暴露时间为5时为s.对于策略计算,要求外部分辨率外壳的I/SigI值为3。这个EDNA公司原型估计,给定统计目标可以达到的最大分辨率为2.9受辐射损伤的限制。由此产生的数据收集计划包括三个条目,每个图像的曝光时间逐步增加(表1[链接])以补偿由于辐射损伤导致的衍射强度降低。顺便提一下,最佳振荡宽度(0.3°)在整个旋转范围内没有变化。

按照此计划收集的数据使用MOSFLM公司并使用缩放SCALA公司(埃文斯,2006年【Evans,P.(2006),《水晶学报》,D62,72-82。】). 处理结果如表2所示[链接]。数据统计与此数据收集的目标值一致。预测的I/SigI和R(右)合并统计数据略低于实验结果。我们将这种差异归因于对光子通量的轻微高估。

5.外部库、语言、平台、工具和可用性

这个EDNA公司框架是在GPL v3许可下发布的开源软件。可以从网站下载https://www.edna-site.org/.

源代码是用Python(版本2.4)编写的。框架中集成了两个开源库,以满足系统能够启动并行步骤并可以从XSD定义文件生成Python代码的要求。这两个库分别是异步操作库(AALib),这是一个基于面向对象概念的库,主要用于促进线程和外部进程之间的异步通信(Pieritz,2007[Pieritz,R.A.(2007)。AALib——异步操作库项目,https://aalib.sourceforge.net网站/ .])以及generateDS库,它允许从XML模式文档生成Python数据结构(Kuhlman,2004[Kuhlman,D.(2004).generateDS-从XML模式生成数据结构,https://www.rexx.com/~dkuhlman/generateDS.html。]).

这个EDNA公司内核运行在所有可以提供Python解释器的平台上;MX应用程序原型在所有Unix/Linux平台上运行,这些平台具有bash、Python(2.4版和更高版本),并且可以运行程序MOSFLM公司标签放射性核素最佳. TheEDNA公司框架和原型已在钻石光源(Didcot)、汉堡EMBL、ESRF格勒诺布尔和NSLS布鲁克海文国家实验室(纽约)安装并定期使用。

颠覆系统(Subversion Corporation,https://subversion.tigris.org/)用于版本控制和软件分发。Bugzilla(Mozilla组织,https://www.mozilla.org/)用于管理功能请求和错误报告。Eclipse(Eclipse基金会,https://www.eclipse.org)用作开发环境。企业架构师用于数据模型设计(Sparx Systems,https://www.sparxsystems.com/). 有关该软件的其他信息,请访问EDNA公司网站(https://www.edna-site.org/).

6.结论和未来计划

建立框架有很多优点。共享相同的技术平台有助于协作,特别是对于地理位置偏远的站点。此外,它允许开发过程的主要部分实现自动化,从而在生产力和质量方面都有潜在的提高。

这个EDNA公司该框架为构建可扩展的科学应用程序提供了可能性。由于这一特性,有可能为大分子晶体学实验创建第一个原型,以计算考虑辐射损伤的数据收集策略。为了允许在给定步骤中并行执行一个或多个第三方程序,需要并包含通用数据模型,而通用数据模型又依赖于项目中涉及的不同同步加速器设施采用标准数据格式。成功进行的第一次测试以及EDNA公司该框架使越来越多的科学研究所社区表现出极大的兴趣。最近发布了一个基于原型开发的专用应用程序(MXv1),旨在描述MX晶体的特性。短期计划是替换数据收集策略应用程序DNA(Leslie等。, 2002【Leslie,A.G.W.,Powell,H.R.,Winter,G.,Svensson,O.,Spruce,D.,McSweeney,S.,Love,D.,Kinder,S.,Duke,E.&Nave,C.(2002)。晶体学报D581924-1928。】)带有EDNA公司特性应用。短期和中期计划将侧重于开发新功能,包括在收集衍射数据后立即处理衍射数据和单轴卡帕实验。长期计划是将通用数据模型扩展到样本几何体的描述(例如以允许更复杂的kappa实验)和检测器几何形状。集成由EDNA公司光束线GUI内的MX应用程序原型,MXCube(Leonard等。, 2007【Leonard,G.A.,McCarthy,J.,Nurizzo,D.&Thibault,X.(2007)。同步辐射。新闻,20,18-24。】)和GDA(Gibbons&Pulford,2006)【Gibbons,P.&Pulford,W.C.(2006)。金刚石光源,https://www.diamond.ac.uk/ .]),也是为了充分利用自动化管道和数据的在线图形表示。最后,还计划在大分子晶体学以外的领域实施应用,特别是X射线层析成像。

支持信息


脚注

1本文的补充数据可从IUCr电子档案中获得(参考:WA5014型). 日志后面描述了访问这些数据的服务。

致谢

作者想感谢EDNA公司执行委员会和管理团队(Alun Ashton、Gérard Bricogne、Andrew Leslie、Andrew McCarthy、Sean McSweeney、Thomas Schneider、Andrew Thompson)以及所有EDNA公司感谢项目成员对本项目的支持和努力。此外,我们还要感谢钻石光源(迪德科特)、ESRF(格勒诺布尔)、欧洲分子生物学实验室(格勒诺布尔,汉堡)、Global Phasing(剑桥)、MaxLab(隆德)、MRC LMB(剑桥),NSLS Brookhaven National Laboratory(纽约)、SLS(维利根)、Synchrotron Soleil(巴黎)的所有合作伙伴和用户他们对软件的功能给出了反馈。我们特别感谢Ana-Maria Goncalves提供了SurE晶体,并感谢Elspeth Gordon在实验和富有成果的讨论中提供的帮助。我们还要感谢BIOXHIT基金会对该倡议的财政支持(赠款编号:LSHG-CT-2003-503420)。

工具书类

第一次引用Arndt,U.W.和Wonnacott,A.J.(1977年)。晶体学中的旋转方法。阿姆斯特丹:北荷兰。 谷歌学者
第一次引用A.贝蒂娃。等。(2006).《水晶学报》。D类62, 1162–1169, 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Bourenkov,G.P.、Bogomolov,B.A.和Popov,A.N.(2006)。第四届生物晶体样品X射线损伤国际研讨会,日本8号春。 谷歌学者
第一次引用Bourenkov,G.P.&Popov,A.N.(2006)。《水晶学报》。D类62,58–64科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Chaize,J.M.、Gotz,A.、Klotz,W.D.、Meyer,J.、Perez,M.和Taurel,E.(1999)。加速器和大型实验物理控制系统内部会议意大利的里雅斯特。 谷歌学者
第一次引用协作计算项目,第4期(1994年)。《水晶学报》。D类50, 760–763. 交叉参考 IUCr日志 谷歌学者
第一次引用Dauter,Z.(1999)。《水晶学报》。D类55, 1703–1717. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Evans,P.R.(1999)。《水晶学报》。D类55, 1771–1772. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Evans,P.(2006)。《水晶学报》。D类62, 72–82. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Gibbons,P.&Pulford,W.C.(2006年)。钻石光源https://www.diamond.ac.uk/谷歌学者
第一次引用Gonçalves,A.M.D.、Rígo,A.T.、Thomaz,M.、Enguita,F.J.和Carrondo,M.A.(2008)。《水晶学报》。F类64, 213–216. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Gotz,A.(2007年)。寓言https://fable.wiki.sourceforge.net网站/谷歌学者
第一次引用Guijarro,M.(2004)。BLISS项目https://lns00.psi.ch/nobugs2004/papers/paper00065.pdf谷歌学者
第一次引用Kabsch,W.(1993)。J.应用。克里斯特。 26, 795–800. 交叉参考 中国科学院 科学网 IUCr日志 谷歌学者
第一次引用Konarev,P.V.、Petoukhov,M.V.、Volkov,V.V.和Svergun,D.I.(2006)。J.应用。克里斯特。 39, 277–286. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Korbas,M.、Fulla Marsa,D.和Meyer-Klaucke,W.(2006年)。科学评论。仪器。 77,邮编063105科学网 交叉参考 谷歌学者
第一次引用Kuhlman,D.(2004)。generateDS–从XML模式生成数据结构https://www.rexx.com/~dkuhlman/generateDS.html谷歌学者
第一次引用Lamzin,V.和Perrakis,A.(2000年)。自然结构。生物。第978–981页科学网 交叉参考 谷歌学者
第一次引用Leonard,G.A.、McCarthy,J.、Nurizzo,D.和Thibault,X.(2007年)。同步辐射。新闻20, 18–24. 交叉参考 谷歌学者
第一次引用Leonard,G.、Solé,V.A.、Beteva,A.、Gabadinho,J.、Guijarro,M.、McCarthy,J.,Marrocchelli,D.、Nurizzo,D.、McSweeney,S.和Mueller-Dieckmann,C.(2009)。J.应用。克里斯特。 42, 333–335. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Leslie,A.G.W.(1992年)。Jnt CCP4/ESF-EACMB新闻。蛋白质结晶仪。 26谷歌学者
第一次引用Leslie,A.G.W.、Powell,H.R.、Winter,G.、Svensson,O.、Spruce,D.、McSweeney,S.、Love,D.、Kinder,S.和Duke,E.&Nave,C.(2002年)。《水晶学报》。D类58, 1924–1928. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Matthews,B.(1968年)。分子生物学杂志。 33,491–497页交叉参考 中国科学院 公共医学 科学网 谷歌学者
第一次引用Minor,W.、Cymborowski,M.、Otwinowski,Z.和Chruszcz,M.(2006年)。《水晶学报》。D类62, 859–866. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Murray,J.W.、Garman,E.F.和Ravelli,R.B.G.(2004)。J.应用。克里斯特。 37, 513–522. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Murray,J.W.、Rudiño-Piñera,E.、Owen,R.L.、Grininger,M.、Ravelli,R.B.G.和Garman,E.F.(2005)。J.同步辐射。 12, 268–275. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Otwinowski,Z.&Minor,W.(1997年)。方法酶制剂。 276, 307–326. 交叉参考 中国科学院 科学网 谷歌学者
第一次引用Owen,R.A.,Rudino-Pinera,E.&Garman,E.F.(2006)。程序。国家。阿卡德。科学。美国103, 4912–4917. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Pflugrath,J.W.(1997)。方法酶制剂。 276, 286–306. 交叉参考 中国科学院 科学网 谷歌学者
第一次引用Pieritz,R.A.(2007年)。AALib–异步操作库项目https://aalib.sourceforge.net网站/谷歌学者
第一次引用Popov,A.N.和Bourenkov,G.P.(2003)。《水晶学报》。D类59, 1145–1153. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Ravelli,R.和Garman,E.F.(2006年)。货币。操作。结构。生物。 16, 624–629. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Sanchez del Rio,M.(1997年)。《物理学杂志》。四、,C2, 209–210. 谷歌学者
第一次引用Sauter,N.K.、Grosse-Kunstleve,R.W.和Adams,P.D.(2004)。J.应用。克里斯特。 37, 399–409. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Solé,V.A.、Papillon,E.、Cotte,M.、Walter,Ph.和Susini,J.(2007)。光谱学。学报,B62, 63–68. 谷歌学者
第一次引用索尔蒂斯,S.M。等。(2008).《水晶学报》。D类64, 1210–1221. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用斯文森·O。等。正在准备中谷歌学者
第一次引用Yamada,Y.、pHonda,N.、Matsugaki,N.,Igarashi,N..、Hiraki,M.和Wakatsuki,S.(2008)。J.同步辐射。 15, 296–299. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者

©国际结晶学联合会。如果引用了原文作者和来源,则无需事先获得许可即可复制本文中的简短引文、表格和数字。有关详细信息,请单击在这里.

期刊徽标的日志
同步加速器
辐射
国际标准编号:1600-5775
遵循J.Synchrotron Rad。
注册电子通知
在推特上关注J.Synchrotron Rad
在脸书上关注我们
注册RSS订阅源