一位女士在图书馆蓝色书架上摆放书籍的照片。

一位女士在图书馆蓝色书架上摆放书籍的照片。 

在新冠肺炎疫情锁定期间,我们如何改进实验数据管理

开放目标下的生活 2021年4月22日

在新冠肺炎疫情首次迫使威康桑格研究所和许多学术研究机构一样关闭我们的实验项目一年后,我们反思了开放目标社区是如何在封锁的挑战下保持研究进展的。

由于我们的许多同事无法亲自进入实验室,我们设立了几个可以虚拟进行的社区科学项目。这些合作项目使我们能够利用我们科学家的各种专业知识,并帮助我们的研究人员在此期间保持联系和科学活跃。

我们之前描述过一个项目着手改进临床试验管理开放目标平台.

这一次,我们谈论了一个项目,在这个项目中,Open Targets社区的研究人员进行了一次全面的文献搜索,并牢记一个特定的目标:捕获有价值的实验信息,这些信息将为我们在全球范围内的大规模实验提供信息并塑造我们的愿景开放目标项目和中开放目标验证实验室.

在这里,我们分享了我们从这个项目中获得的方法和见解,以及数据捕获模板我们已经开发了,希望这些将对其他承担类似项目的研究人员有价值。

为什么需要这样做?

我们在Open Targets的使命是利用遗传和基因组信息系统地优先考虑新的疾病目标,其首要目标是开发安全有效的药物。我们通过整合信息和实验方法来确定基因和疾病之间的新关联,从而实现这一目标。

我们的努力产生了潜在药物靶点的优先清单,随后对其进行了进一步的实验审查,这有助于我们建立更多证据来支持靶点在特定疾病背景下的相关性。虽然目标验证是所有开放目标项目中的一个考虑因素,但开放目标验证实验室的目标是开发可大规模执行的系统工作流。

由Panos Zalmas领导的开放目标验证实验室,如图所示。验证实验室提供了额外验证和机械证据的独立来源,以帮助将目标转化为药物发现管道。该实验室目前专注于肿瘤和神经退行性变靶点。未来,它将致力于整个联盟的项目,以确定其他治疗领域的可行药物靶点,包括免疫学和免疫肿瘤学。

通常,在进行实验之前,关键的第一步是对评估相关疾病模型中基因功能的细胞分析进行详细的文献综述。然而,当目标是通过相同的功能读数同时检测多个基因时,这一过程特别耗时且具有挑战性,这是系统验证和表征靶点的关键要求。

使我们的志愿者与项目范围相匹配

利用志愿者的专业知识,我们专注于在开放目标中确定并优先考虑的目标,在我们的两个治疗领域:神经退化、免疫和炎症。

我们的神经科学志愿者金伯利切姆高级研究助理,正在使用细胞模型研究IBD相关风险基因,以及玛塔·佩雷兹·阿尔坎塔拉,一位研究小胶质细胞遗传变异对神经退行性疾病影响的博士后研究员。

在免疫学方面,我们寻求了加雷思·格里菲斯霍利·罗伯逊(Holly Robertson)是研究CD4+T细胞活化调控的高级研究助理,也是研究免疫细胞与肿瘤之间相互作用的博士后研究员。

建立数据管理工作流

我们首先确定了我们想要获取的关键实验信息,并要求志愿者针对每种疾病的适应症,回顾同样经过充分验证和研究的基因的文献;可编程逻辑控制器2神经变性和CTLA4型用于免疫和炎症。受再现性和阳性对照使用的实验概念的影响,这种方法使我们能够了解多次独立搜索是否可以捕捉到基本相似的信息,以及它们的输出是否符合我们的基准。

这项任务还帮助我们确定了当前使用的实验方法中的差距。因此,我们扩大了数据收集范围,将基因和蛋白质的关键特性包括在内,如表达途径和相关表型。这将有助于我们优化预先制定的高通量实验方案,并开发新的分析方法。

信息捕获工作流程图

最后,我们选择了一组代表良好和未充分研究的优先目标的基因,并根据志愿者的专业领域将其分配给志愿者,以利用志愿者的背景知识,并确保这项工作将有利于他们自己的研究项目。

在试验阶段,每个志愿者审查了四个基因的可用信息。然后,我们与他们会面,讨论他们的发现、遇到的问题,并与小组分享技巧。利用这些反馈,我们可以进一步标准化和改进流程。

这些讨论中出现了一些有趣的观点:

  • 除了PubMed和其他发布门户之外,还可以通过公司网站、数据存储库或简单的谷歌搜索获得许多非常有用的信息;

  • 基因命名对于研究较少的基因来说很棘手,这是通过使用我们自己的Open Targets平台上策划的目标配置文件页面和同义词列表来规避的;

  • 多个靶点通过与基因家族关联而与细胞分析相关联,而不是在每个实验系统中直接进行分析。

在优化了信息捕获工作流程后,我们全面展开了该项目,除了提供特别支持外,我们还每月开会提供反馈并分配下一组目标。该项目的信息采集部分于2020年12月完成。

志愿者Gareth Griffiths的第一手资料

引用加雷思·格里菲斯(Gareth Griffiths)的话:这个项目是一次非常棒的学习经历,它确实提高了我对基因通路、蛋白质相互作用以及它们如何结合的理解。最困难的事情之一是限制我的研究范围。你可以花几个星期的时间来浏览一些基因的所有可用信息,所以如果你不限制自己,你可能会掉进兔子洞。

“作为人类遗传学研究小组的一员,我从事免疫遗传学工作,研究免疫抑制中调节性T细胞背后的机制。我主要是一名湿式实验室科学家,因此在大流行的最初几个月在家工作是一种新的经历。

这个项目似乎是一个为社区做出贡献的机会。这是一次非常棒的学习经历,真正提高了我对基因通路、蛋白质相互作用以及它们如何相互配合的理解。

最困难的事情之一是限制我的研究范围。特别是近年来,为其中一些基因生成的数据的分量是巨大的。你可以花几个星期的时间来浏览一些基因的所有可用信息,所以如果你不限制自己,你可能会掉进兔子洞。

有几件事让我感到惊讶。随着时间的推移,基因命名已经发生了变化,这可能会使我们很难找到有关某个基因的信息。当基因的功能在很久以前就建立起来的时候,这也可能是一个挑战,因为你必须回到80年代发表的原始文章,而这些文章通常只有数字化的副本。

我期待着看到这项研究如何为开放目标实验项目和验证实验室的工作提供信息。”

接下来是什么?

自2020年5月该项目开始以来,我们已经在每个疾病区域手动筛选了近30个基因。国家封锁的延长也为我们的两位开放目标高级职员科学家提供了机会莎拉·库珀博士卡拉·琼斯博士分别拥有神经退行性变和免疫学方面的专业知识,以便根据实验室中当前使用的实验工作流程进一步审查和基准测试所收集的数据。

我们创建的信息捕获模板现在用于我们所有的候选目标,并且本项目中捕获的数据已经用于我们整个实验项目的方法。“这个项目的结果对我们开放靶点神经变性项目的基因优先排序工作非常有帮助。我们的博士后已经在研究志愿者收集的数据,以决定单细胞CRISPR试验筛选的候选基因,并决定要建立的最佳分析,”莎拉·库珀博士解释道。

我们已经确定的实验模型和技术,以及可以在这些系统中用作稳健对照的关键基因,在与系统高通量表型分析开发的兼容性方面显示出巨大的潜力。我们渴望很快开始开发这些未充分开发的功能读数。

我们都发现这一过程非常有用,并感谢志愿者在参与主要科学活动的同时,为这一项目付出的时间和承诺。

我们的文献搜索模板可供您在自己的研究中使用。

数据捕获模板


非常感谢所有为我们社区项目做出贡献的志愿者:

Holly Robertson(桑格博士后)、Gareth Griffiths(桑格高级研究助理)、Kimberley Cheam(桑格先进研究助理),Marta Perez-Alcantara(桑格博士后),Sarah Cooper(桑格资深科学家)、Carla Jones(桑格研究员)

封面图片依据萨曼莎·亨托什取消展开(Unsplash)

有关此主题的更多信息

改进新冠肺炎疫情锁定期间的临床试验数据
了解我们如何利用实验室实验研究同事的广泛专业知识,为开放目标平台和我们的目标验证项目做出宝贵贡献。
Covid-19时代的开放目标
在这个博客中,我探讨了开放目标平台中新冠肺炎数据的效用和局限性,以找到治疗这种新传染病的方法。

标签