所有指标
-
意见
获取PDF
获取XML
引用
导出
轨道
方法文章
修订过的

确定ELIXIR核心数据资源

[版本2;同行评审:2已批准]
2017年3月9日出版
作者详细信息 作者详细信息
开放式同行评审
审查人状态

本文包含在万能药网关。

本文包含在生物信息学网关。

本文包含在数据:使用和重用收藏。

本文包含在EMBL-EBI公司收藏。

摘要

ELIXIR的核心任务是为整个欧洲的生物信息建立稳定和可持续的基础设施。其核心是ELIXIR向生命科学界提供的数据资源、工具和服务,提供稳定和可持续的生物数据访问。ELIXIR旨在确保这些资源长期可用,并对这些资源的生命周期进行管理,以支持生命科学的科学需求,包括生物研究。

ELIXIR核心数据资源被定义为一组对更广泛的生命科学界和生物数据的长期保存具有根本重要性的欧洲数据资源。它们是对生命科学具有普遍价值的完整集合,在一个或多个特征方面被视为其领域的权威,并显示出高水平的科学质量和服务。因此,ELIXIR核心数据资源具有广泛的适用性和用途。

本文描述了支持ELIXIR核心数据资源识别和评估的结构、治理和流程。它确定了反映ELIXIR核心数据资源定义本质的关键指标,并支持促进资源开发和运营的卓越性。它更详细地描述了具体指标,并解释了它们在ELIXIR可持续发展战略和科学政策行动中的应用,以及在能力建设、生命周期管理和技术行动中的运用。目前正在实施身份查验程序并进行首次测试。研究结果和结果将于2017年3月由ELIXIR科学咨询委员会进行评估。

建立ELIXIR核心数据资源和ELIXIR服务组合是ELIXIR的一个关键优先事项,并公开标志着向内聚基础设施的过渡。

关键词

ELIXIR、可持续性、数据资源、指标、能力建设、基础设施、生物信息学、生命科学

修订过的第1版的修订

手稿已更新,以提供ELIXIR结构的概述以及核心数据资源的选择和修订时间表。图3进行了修订,以包括独立专家在确定ELIXIR核心数据资源方面所起的作用。

要阅读本文的任何同行评议报告和作者回复,请遵循开放同行评议表中的“阅读”链接。

介绍

ELIXIR是一个基于欧洲现有数据资源和服务的政府间组织。它遵循中心和节点模式,一个中心位于英国欣克斯顿,越来越多的节点位于整个欧洲的卓越中心。各国政府和部委都是ELIXIR联盟的成员,每个成员国的科学界都开发了各自的国家节点。

ELIXIR的核心任务是为整个欧洲的生物信息建立稳定和可持续的基础设施。其核心是ELIXIR Nodes向生命科学界提供的数据资源、工具和服务,提供稳定和可持续的生物数据访问。

ELIXIR资源从包含DNA序列等研究数据输出的档案或沉积数据库,到聚合、处理和可视化研究数据的高度动态知识库,常常通过高素质人员的手动管理增加价值层。ELIXIR旨在确保这些资源长期可用,并对其生命周期进行管理,以支持生命科学和生物研究的科学需求。

欧洲有500多个数据资源1只有一小部分有机构支持和长期资金承诺。许多关键生物信息学资源的中长期生存得不到保障,这一事实威胁到学术和工业生命科学活动的基础,并有可能损失大量的生物和医学信息以及相关投资。

确定评估这些关键数据资源质量和影响的方法将(a)促进资源开发和运营的卓越性,通过传播最佳实践支持能力建设,以及(b)为支持构成生物信息学基础设施主干的资源的长期可持续性所需的技术和科学政策行动提供基础(图1).

09b759a3-17c0-414f-9958-c7784ec49193_图1.gif

图1。ELIXIR服务和ELIXIR核心数据资源在ELIXIR任务中的位置。

09b759a3-17c0-414f-9958-c7784ec49193_图2.gif

图2。为生物信息学资源精心挑选的一篮子定性和定量指标。

09b759a3-17c0-414f-9958-c7784ec49193_图3.gif

图3。识别ELIXIR核心数据资源的过程。

建立ELIXIR服务和ELIXIR核心数据资源的提案于2014年12月提交给了ELIXIR科学咨询委员会(SAB)2本文描述了如何将该建议付诸实践,并为实施生命周期管理提供了指导。

ELIXIR节点通过其节点应用程序和服务交付计划或工作计划,定义了向研究社区提供的一组服务和数据资源,即ELIXIR服务。这些资源构成了生命科学数据基础设施的骨干。

ELIXIR核心数据资源被定义为一组对更广泛的生命科学界和生物数据的长期保存具有根本重要性的欧洲数据资源。它们为生命科学提供了完整的通用价值集合,在一个或多个特征方面被视为其领域的权威,并显示出高水平的科学质量和服务。因此,ELIXIR核心数据资源具有广泛的适用性和用途。

ELIXIR核心数据资源往往在生命科学界广为人知,并为关键利益相关者(如资助者和期刊)所知。ELIXIR核心数据资源通过专业服务交付计划得到良好维护,该计划基于成熟的生命周期管理流程以及对相关数据资源的充分理解。ELIXIR核心数据资源与具有不同动机的更广泛的数据库共存,通常专注于特定科学主题。

ELIXIR核心数据资源将成为技术和科学政策行动的焦点,以推动长期可持续性。ELIXIR核心数据资源的透明指标还将提供有关资源质量和影响的战略情报,尤其是向决策者和资助者提供。

通过ELIXIR科学计划和ELIXIR-EXCELERATE拨款,基础设施将提供并支持一系列举措,以支持和加强ELIXIR服务和ELIXIR核心数据资源。ELIXIR服务和ELIXIR核心数据资源将是ELIXIR最广泛使用和对外可见的部分。建立这些数据资源和服务的组合是ELIXIR的关键优先事项,并公开标志着向内聚基础设施的过渡。目前正在实施身份查验程序并进行首次测试。研究结果和结果将于2017年3月由ELIXIR科学咨询委员会进行评估。通过建立ELIXIR服务组合,ELIXIR还旨在支持和实施资源管理方面的最佳实践,并将欧洲生物信息学资源提升到一个新的水平,在用户之间建立信任。

方法

衡量数据资源的质量和影响:关键指标

在他们关于英国研究评估和管理中指标作用的报告中威尔斯顿等人。强调“指标”一词可能被误解。例如,出版物收到的引文数量是一个引文指标,因为它不能直接衡量该研究人员工作的影响。

因此,他们认为“指示器”一词用于可能产生混淆的上下文中(表1). “指标”被定义为替代不太容易测量的东西的可测量数量,并被假定与之相关,而不直接测量它。引文计数可以用作期刊文章科学影响的指标,尽管科学影响可能以不产生引用的方式发生。因此,我们通篇使用“指标”一词。

ELIXIR服务的生命周期管理

本节概述了ELIXIR服务生命周期管理的框架和阶段(表1). 该框架将通过ELIXIR-EXCELERATE节点能力建设和实践与培训社区计划工作包实施,通过创建卓越之路来加强ELIXIR基础设施。

表1。ELIXIR服务的技术生命周期阶段。

阶段定义状态
新兴的一种积极发展走向成熟的资源。新兴服务的可靠性可能较低
与成熟服务相比,并在其表示和API中进行更多更改。
“新兴”状态不得超过2年。如果新兴服务没有成熟
“服务日期”应在撤销前至少6个月显著显示。
万能药
新兴的
服务
成熟已通过开发阶段的ELIXIR服务。它是可靠和活跃的,即新数据
正在添加。
如果可行,对其API和/或用户界面的重大更改可能会破坏现有功能和/或
不完全向后兼容的,至少提前6个月通知。
成熟服务仅依赖于其他成熟或遗留服务。例外地,成熟服务可能
依靠一种即将成熟的新兴服务。
应至少提前1年通知服务撤回,在此期间,服务
遗留状态。
ELIXIR服务
遗产计划归档或退役的以前成熟的服务。服务必须花费在
在最终退出前,在遗留州至少1年。可靠性应与成熟级相同
服务,但允许对内容进行妥协(例如,数据未更新,未添加新内容)。
ELIXIR服务
–传统

ELIXIR核心数据资源的商定指标集设定了质量标准,指导和告知新兴服务的管理者如何将资源开发为“ELIXIR服务”状态。

监测ELIXIR服务的使用趋势和科学影响可提供信息以支持其管理,有助于维护ELIXIR的服务状态,或在适当情况下,引导资源进入遗留阶段(表1).

五类指标,反映数据资源的多方面

ELIXIR核心数据资源的识别涉及对数据资源的多个方面进行仔细评估。

指标分为五类:

  • (1)科学焦点与科学质量

  • (2)资源服务的社区

  • (3)服务质量

  • (4)法律和融资基础设施以及治理

  • (5)影响和翻译故事

在收集和解释指标时,重要的是阐明所用的方法,并在可能的情况下使术语标准化。这有助于理解指标,避免不同节点之间的误解。

(1) 科学焦点与科学质量

这包括数据和元数据的固有科学性,以及其独特性和全面性。还包括与其他资源的基准比较,以及该资源是否是其领域的权威。

应区分接收和存档的存档或沉积数据库从头开始由科学家保存的数据集和结构良好的元数据,以及基于档案数据并通过专家管理、元数据注释、复杂的数据处理和/或数据集成增加实质价值的增值数据库或知识库。与资源相关的管理工作和产出是衡量其质量的重要指标。

(2) 社区

这一类别反映了由资源服务的社区的规模和衡量需求:网络统计数据、用户范围和国际使用。服务的社区可以是存款人,因为一些资源对存款和/或最终用户至关重要。可以通过不同的方式来识别和衡量社区,例如访问URL、下载服务器、通过API,以及通过引用出版物中的数据和数据资源。

此外,某些资源对衍生服务和数据驱动研究起着基础性作用。他们的数据被分发给许多依赖于其存在的其他资源和/或服务。

应该考虑到资源运作的科学背景。服务于小型科学社区的资源可能没有服务于更广泛利益的资源那么多的用户,但它可能达到其支持的社区的90%(覆盖范围),并且对该社区的科学工作至关重要。

(3) 服务质量

某些服务级别和可靠性可以用特定的技术指标来量化,例如:资源的正常运行时间;响应时间;有意义的自动化测试的可用性和定期应用;用户支持和相关培训;使用社区认可的标准;数据检索机制的多样性;和其他服务。通常,这需要在服务开发和运行期间进行质量保证过程。加速ELIXIR培训计划和ELIXIR训练平台将支持提供培训资源,并提供良好实践指南和评估系统。

(4) 法律和融资基础设施以及治理

作为稳定的研究基础设施,核心数据资源可以证明其具有健全的法律、资金和治理结构。

可行资源具有适当的法律框架(明确的使用条款、许可、数据安全、道德合规等)。开放数据是生命科学研究的一个关键驱动因素,因此也是ELIXIR的一个重要驱动因素,但数据访问政策必须考虑到资源资金。长寿可以通过机构支持、资金计划和金融稳定的持续时间来衡量。核心数据资源将通过不同的资金来源进行转型。强有力的治理结构包括一个国际独立的科学咨询委员会(SAB),该委员会允许社区投入并提供长期监督。

(5) 影响和翻译故事

影响评估试图为资源是否满足其满足科学界特定需求的目标这一问题提供一个明确的答案。翻译故事与资源在加速科学发展中的作用有关,因此是一个非常重要的指标。

影响评估试图评估资源是否满足其满足特定需求的目标。在英国,英国财政部的品红账簿4为政策制定者和分析人员提供如何评估和审查政策和项目的指导。根据本指南,良好影响评估的关键特征是,它认识到大多数需求可以通过一系列要素来满足,而不仅仅是相关项目。为了测试资源在多大程度上负责满足需求,有必要估计(通常基于定量数据的统计分析)如果资源不存在会发生什么。这就是所谓的反事实。建立反事实并不容易,因为根据定义,它是不可观察的。强有力的评估可以成功地将资源的影响与所有其他潜在影响隔离开来,从而对反事实做出良好的估计。

在向资助者和公众传达ELIXIR资源的影响及其在加速科学发展方面的作用时,指标应与受众相关。这可以通过在易于理解的上下文中呈现它们来实现。

指标和相关方法的详细说明

数据密集型科学的挑战之一是通过帮助人类和机器发现和访问科学数据来促进知识发现。FAIR是一套使数据可查找、可访问、可互操作和可重用的指导原则6这些指标将用于证明ELIXIR核心数据资源与FAIR数据原则兼容。中的表格方框1将指标映射到相应的公平标准。

方框1描述了上述每个类别中使用的指标。

方框1。ELIXIR核心数据资源的定量和定性指标

ELIXIR核心数据资源被定义为一组欧洲数据资源,对广泛的生命科学界和生物数据的长期保存至关重要。

一组关键指标可用于为核心数据资源提供案例。指标旨在反映ELIXIR核心数据资源定义的本质,并支持促进资源开发和运营的卓越性。

指标分为五类:

  • (1) 科学科学的重点和质量

  • (2) 社区由资源提供服务

  • (3) 质量服务的

  • (4) 法律以及为基础设施和治理提供资金

  • (5) 影响和翻译故事。

这些指标认识到生物数据的异质性,以及支持数据资源、用例和所服务社区的多样性。指标可用于衡量资源相对于规定质量标准的技术和/或科学准备程度。

这个以下将指标映射到相应的公平标准。

由于核心资源的背景对理解其重要性至关重要,单靠指标是不够的。需要定性证据,以便通过ELIXIR节点负责人和科学咨询委员会的专家判断,在资源的整个生命周期中对其进行审查。

指标和相关信息。

第1-4节中的所有要素都需要回复。

量化指标下划线.

1.科学重点和质量

  • a。 档案与知识库:资源档案(提交材料)还是知识库(附加值)?

  • b。 范围声明:描述资源的科学覆盖范围和全面性。例如,所有物种或物种、科的子集从特定的实验方法中输出?资源相对于其他类似数据资源的位置是什么?

  • c。 国际层面:资源是否具有全球足迹?(例如,通过交付资源的国际财团、提交来源的地域多样性、全球文献策划、交付合作伙伴和/或资助者的国际多样性来证明)

  • d。 员工努力: 过去每年全职员工的数量2–3

    • i、。策展人

      • 支持提交遵守元数据要求?(另请参见3d)

      • 支持从科学文献中提取信息?

    • ii、。生物信息学家

    • (三)。技术人员

2.社区

  • a。 总体使用情况:在过去的2-3年中,资源的使用情况如何?

  • i、。通过web浏览器访问:访问次数、独特访问者、点击次数和页面浏览量1

  • ii、。通过其他访问方法访问:访问、独特访问、点击和下载(包括FTP下载和编程访问)

  • b。 潜在用途:全球潜在用户群体的估计规模是多少?

  • c。 通过文献引用衡量研究中的使用情况:

    • i、。资源名称的引用:每年科学文章中提及资源名称的次数(在欧洲PMC中)

    • ii、。资源数据引用:研究文章中提及或引用资源中的登录号的次数(在欧洲PMC中)

    • (三)。描述资源列表的关键出版物(例如NAR数据库期刊中的出版物)和引用次数(欧洲PMC).

  • d。 其他资源的依赖性:其他资源是否依赖于此处描述的资源来提供该服务(即什么是reach-through)?

3.服务质量

  • a。 标识符的使用:资源是否提供持久和唯一的标识符?

  • b。 数据吞吐量: 过去2-3年中每年的条目数、沉积(每年摄入的记录或字节数)、处理的记录数、组装的基因组数等.

  • c。 技术性能:

    • i、。正常运行时间:过去12个月内关键网页(或类似网页)样本的每月可用性百分比(例如搜索结果、主页、数据记录页面)。

    • ii、。 关键网页的响应时间.

  • d。 标准的使用:元数据和数据使用哪些社区认可的标准(例如MIAME、JATS、INSDC功能、本体)?提供文档链接。

  • e、。 原产地文件链接:该资源是否与科学文献有关,以了解事实来源或生物学背景?

  • f、。 数据可用性-接入服务和格式

    • i、。数据共享服务:列出共享数据的服务(例如网站、API、FTP、TripleStore)

    • ii、。数据共享格式:可用数据的列表格式(例如纯文本、FASTA、XML、RDF、Dublin Core、tsv、JSON)

  • g、。 客户服务

    • i、。帮助台:资源是否运行帮助台?

    • ii、。用户反馈:资源是否寻求用户输入并将其纳入服务设计决策?

    • (三)。培训:资源是否进行培训?

4.法律和融资基础设施以及治理

  • a。 科学咨询委员会:该资源是否有一个国际独立的科学咨询委员会

  • b。 开放科学:资源是否有支持开放科学的法律框架?例如开放许可证或公开使用条款的公开声明。

  • c。 隐私政策:资源是否有公开的隐私政策,其中描述了个人数据和cookie的安全性?

  • d。 道德政策:资源是否有符合所有相关国际标准和最佳实践的道德政策?

  • e、。 可持续支持和资金:证明东道国机构和/或其他实体过去和未来的资金和/或支持资源的其他承诺。

5.影响和翻译故事

  • a。 反事实:如果资源不存在,或消失而不被取代,对科学界会有什么影响?资源是否全球唯一?对其他依赖资源的影响是什么?

  • b。 加速科学发展资源如何促进科学发展?例如,资源是否设置了标准;促进数据或软件的重用;提高研究效率;在其他领域扩展技术产品?

  • c。 翻译数据:有没有观众熟悉的“翻译”人物可以帮助他们掌握资源的核心性质?

用于衡量总体资源使用情况的术语定义(参见2.a)

访问次数:访问或会话是由唯一标识的客户端在特定时间(通常为30分钟)内发出的一组请求/交互。访问/会话数是衡量网站流量的一个指标。

独特访客:访问者数量(唯一IP地址、唯一访问者或访问者)衡量在指定时间内有多少人访问网站,而不管他们访问的频率如何。它可以通过不同的方式确定。例如,数量:唯一IP地址、用户Cookie、唯一IP地址+用户代理(“用户代理”是用于访问网站的客户端。

击打:可以用于分析网络资源的使用趋势。点击率衡量查看网页时下载的文件数。一个网页通常由许多单独的文件组成,例如HTML文档、图像、JavaScript文件。当查看网页时,服务器会请求每个文件,并将其添加到点击数中。

页面视图:(或页面、印象或URL):请求加载单一的网站的HTML文件(网页),由浏览器中的URL标识。在一次访问期间,可能会访问多个不同的页面。

下载内容:以卷/带宽衡量从资源下载的数据,通常以GB为单位。

表。FAIR标准映射到相应的核心数据资源指标。

公平原则核心数据资源
指示器
要查找:
F1(元)数据被分配一个全局唯一且永久持久的标识符。
F2数据使用丰富的元数据进行描述。
F3(元数据)数据在可搜索资源中注册或索引。
F4元数据指定数据标识符。

3a年
1天、3天
3f(i)
3a、3d
无障碍:
A1(元数据)数据可通过使用标准化通信协议的标识符检索。
A1.1该协议是开放的、免费的,并且可以普遍实施。
A1.2该协议允许在必要时进行身份验证和授权程序。
A2元数据是可访问的,即使数据不再可用。

3a、3f(i)和3f(ii)
3f(i)、4b
4b、4c
第四版
要实现互操作:
I1(Meta)数据使用一种正式的、可访问的、共享的和广泛适用的语言来表示知识。
I2(Meta)数据使用遵循公平原则的词汇表。
I3(Meta)数据包括对其他(Meta)数据的限定引用。

二维、三维、三维(ii)
三维
2d、3e
要重新启用:
R1(Meta)数据具有多个准确且相关的属性。
R1.1(Meta)数据发布时具有清晰、可访问的数据使用许可证。
R1.2(Meta)数据与其来源相关。
R1.3(元)数据符合领域相关的社区标准。

1天、3天
4b个
二维、三维、三维
三维

方框2提供了一个“案例文档”模板,用于描述使用这些指标的数据资源。

支持专家判断的指标

考虑到“不是所有可以计算的东西都算数,也不是所有重要的东西都可以计算”(威廉·布鲁斯·卡梅隆5),这些指标将用于通知下文所述的同行审查过程。

根据生物信息学资源精心选择的一组定性和定量指标将用于确定ELIXIR核心数据资源。这些指标将支持但不取代专家的判断。

ELIXIR核心数据资源应各有一个国际独立的科学咨询委员会。这些委员会由杰出的学术和行业研究人员和专业人员组成,他们进行科学和/或技术审查,确保质量并向资源管理人员提供战略建议。ELIXIR核心数据资源的识别不会侵犯这些治理结构。为核心资源和节点建立科学咨询委员会是节点能力建设和实践社区将推广的最佳做法之一。

只有在开放、透明和连贯的收集基础设施的支持下,指标才能发挥作用,因此需要明确的收集和处理方法。

ELIXIR核心数据资源种子列表

使用上述ELIXIR核心数据资源的定义,我们确定了候选核心资源的“种子列表”(表2)通知核心数据资源指标。

表2。被视为生命科学界核心的欧洲数据资源示例。

资源名称机构类型
UniProt公司EMBL-EBI(欧洲分子生物学实验室-欧洲
生物信息学研究所);瑞士生物信息研究所;
蛋白质信息资源(PIR)——乔治敦大学
医疗中心
蛋白质知识库
欧洲核苷酸
存档(ENA)
EMBL-EBI,在国际核苷酸框架内
序列数据库协作(INSDC)
核苷酸综合档案
序列、注释和关联
数据
骄傲(蛋白质组学
标识数据库)
EMBL-EBI公司基于质谱的档案
蛋白质组学数据
欧洲PubMed Central
(欧洲PMC)
EMBL-EBI公司全文生物医学和生活档案-
科学期刊文章
InterPro公司总部位于海德堡EMBL-EBI的数据库联盟;
瑞士生物信息研究所;WTSI;大学
曼彻斯特;普拉比;J.Craig Venter研究所,Rockville;PIR;
布里斯托尔大学;伦敦大学学院;大学
南加州
蛋白质家族知识库,
每个都由多个序列表示
对齐和隐马尔可夫模型
(HMM)
蛋白质数据库
欧洲(PDBe)
EMBL-EBI与全球蛋白质数据库合作
(wwPDB)和EMDataBank合作伙伴
蛋白质结构知识库
图谱皇家理工学院AlbaNova和科学生命实验室,
瑞典斯德哥尔摩乌普萨拉大学鲁德贝克实验室,
瑞典乌普萨拉和印度孟买Surgpath实验室
高分辨率知识库
显示空间分布的图像
正常人体组织中的蛋白质和
癌症类型以及人类细胞系

确定ELIXIR核心数据资源

ELIXIR核心数据资源的识别涉及对数据资源的多个方面进行仔细评估。本文描述了核心数据资源选择的总体方法,随着本文所述原则首次付诸实践,核心数据资源将在未来几个月内不断发展。

使用的指示器如所述方框1相关ELIXIR节点提交完成的“案例文档”(方框2)到ELIXIR中心。

只有属于ELIXIR节点应用程序和/或服务交付计划(对于EMBL-EBI,即“工作计划”)一部分的数据资源才能成为候选ELIXIR核心数据资源。

ELIXIR核心数据资源的初步评估每年进行一次。

ELIXIR中心检查案例文件的完整性,并验证节点的服务交付计划(或工作计划)中是否包含拟议资源。ELIXIR Hub在选择ELIXIR核心数据资源方面具有咨询作用。该中心没有决策权,也不会对提案进行评估。

ELIXIR主管将候选ELIXIR核心数据资源告知节点委员会负责人。节点负责人委员会可以向相关节点负责人请求有关候选资源的其他信息。

节点负责人委员会每年亲自召开会议,审查提交的案例文件,并确定ELIXIR核心数据资源列表。最初的选择预计会随着时间的推移而增加。

ELIXIR科学咨询委员会将于2017年3月审查该过程。在这个初始测试过程和评估中,将选择多达20个ELIXIR核心数据资源。

根据第一轮遴选的经验,节点负责人委员会可能会建议完善指标和未来的总体流程。如果该过程被证明足够稳健,则选定的候选资源将成为第一组ELIXIR核心数据资源。ELIXIR科学咨询委员会还审查ELIXIR核心数据资源组合,并就其识别过程提供持续建议。

由于每个ELIXIR核心数据资源都有一个治理结构,其中包括一个独立的国际委员会,因此ELIXIR咨询委员会不会重复这一单独审查。结果将提交给ELIXIR(治理)委员会以供参考,并确保该流程得到正确应用。

通过节点、咨询委员会和ELIXIR中心的工作,还可以收集和监测有关指标的标准化数据。

与节点协作,将在ELIXIR中心持续自动收集监控数据,并定期发送给节点负责人。节点承诺按照定义的规范提供必要的数据。

审查ELIXIR核心数据资源

可能会要求ELIXIR核心数据资源定期报告某些指标,并提供任何重大变化的更新。

节点负责人会议将每两到三年审查一次所有ELIXIR核心数据资源。然而,至少有三个节点负责人可能会要求对单个资源进行特别评估,尤其是基于监测数据。如果审查提出了有关ELIXIR核心数据资源的问题,节点负责人委员会负责确定应采取的行动。

讨论

支持数据资源的可持续性,以及如何定义识别数据资源将有助于科学政策

ELIXIR核心数据资源是ELIXIR可持续发展战略的核心。收集到的这些生物信息学资源的关键指标,以及更具体的影响和翻译故事,将用于向资助者提供案例。这些信息反过来将帮助他们转换核心数据资源产生的影响。

影响评估试图为资源是否满足其满足科学界特定需求的目标这一问题提供一个明确的答案。翻译故事与资源在加速科学发展中的作用有关,因此是一个非常重要的指标。

此外,ELIXIR核心数据资源有助于ELIXIR内生命科学数据的影响和经济计量分析,以及向欧盟委员会和其他利益相关者传达开放数据可持续基础设施价值的活动。

能力建设

核心数据资源将成为卓越的旗舰。使用明确的指标,特别是围绕用户政策和程序的指标,将有助于作为质量基准,并将支持ELIXIR社区内的能力建设。

例如,ELIXIR核心数据资源,尤其是知识库,可以在ELIXIR内部和外部发挥“概念权威”的作用,在标准化社区对给定生物概念的理解方面发挥明确的作用。

可以在ELIXIR之外使用某些其他指标(例如正常运行时间),以巩固广大利益相关者的信心。这将要求指标的制定方式完全透明,以避免误解或滥用。

生命周期管理

关键指标将为生命周期管理提供信息,确定趋势并支持围绕特定资源的决策。这不仅对资源团队很重要,而且对确定可能发展为ELIXIR服务的新兴服务也很重要。随着ELIXIR节点服务交付计划中列出了新资源,围绕核心数据资源的指标和能力建设将在新兴服务成熟时为其提供支持。

支持长期可持续性和与ELIXIR服务整合的基础行动

ELIXIR核心数据资源将优先用于技术行动和培训。ELIXIR核心数据资源成为ELIXIR节点网络内ELIXIR云、存储和数据分发工作的主要资源。这些行动对于支持与核心数据资源相关的新兴服务的发展至关重要。

ELIXIR将努力通过支持核心数据资源之间以及与ELIXIR服务和新兴服务之间的交互,为所有ELIXIR资源(包括ELIXIR Services)增加价值,以造福更大的用户群体。这方面的例子包括用例驱动的增强ELIXIR核心数据资源彼此之间以及与其他ELIXIR服务的互操作性,支持服务台扩展国家业务,以及进行实施研究以探索与国家基础设施和数据服务的联系。

结论

ELIXIR核心数据资源是ELIXIR可持续发展战略和科学政策行动的中心。收集的关键指标反映了这些生物信息学资源的多样性,并将用于向资助者提供案例。这些信息反过来将帮助他们转换核心数据资源产生的影响。

核心数据资源的关键指标,尤其是围绕用户政策和程序的指标,将作为卓越和最佳实践的旗舰,有助于支持ELIXIR社区内的能力建设。该过程可以扩展,以纳入关于互操作性、概念命名、标识符解析、标识符映射以及数据标识提供和保护的最佳实践。

关键指标将为生命周期管理提供信息,确定趋势并支持围绕特定资源的决策。这不仅对管理资源的团队很重要,而且对识别可能演变为核心数据资源的新兴服务也很重要。随着新资源列在ELIXIR节点服务交付计划中,围绕核心数据资源的指标和能力建设将支持新兴服务的成熟增长。

随着ELIXIR的不断成熟,将实施生命周期管理框架,支持新兴服务,并通过创建通往卓越的阶梯来加强ELIXIR基础设施。

定量和定性指标的使用反映出需要了解资源运作的背景,为加强资源和改进能力建设的努力提供明确合理的基础。建立ELIXIR核心数据资源和ELIXIR服务组合是ELIXIR的一个关键优先事项,并公开标志着向内聚基础设施的过渡。

方框2。案例文档模板

“案例文档”描述了(候选)核心数据资源,并基于方框1.

案例文档:[资源名称]v1.0

文件所有者:[插入姓名][电子邮件地址]

1.科学重点和质量

  • a。 档案与知识库:是资源

    • 存档(接收提交文件)

    • 知识库(附加值)

  • b。 范围声明:描述资源的科学覆盖范围和全面性。例如,所有物种或物种、科的子集从特定的实验方法中输出?相对于其他类似的数据资源,该资源是如何定位的?

  • c。 国际维度:资源是否具有全球足迹?(例如,通过交付资源的国际财团、提交资料来源的地域多样性、全球文献策划、交付合作伙伴和/或资助者的国际多样性来证明)

  • d。 员工努力:

    全职员工人数[第一年][第2年]【第三年】
    • 策展人

      • 支持提交符合元数据要求

      • 支持从科学文献中提取信息

    • 生物信息学家

    • 技术人员

2.社区

  • a。 总体使用量:在过去的2-3年中,资源的使用情况如何?

    请说明得出这些指标的方法。

    通过web浏览器访问(使用web分析,例如:Google analytics

    每月平均网络流量[第一年][第2年][第三年]
    访问(会话)
    唯一访问者(用户)
    页面视图

    通过web浏览器访问(使用日志分析)

    每月平均网络流量[第一年][第2年][第三年]
    唯一访问者(用户)
    击打
    会话和页面(如果可能)

    数据下载(FTP、API等)

    每月平均下载量[第一年][第2年][第三年]
    点击/请求
    唯一的IP地址/主机
    数据传输(GB)

  • b。 潜在用途:全球潜在用户群体的估计规模是多少?

  • c。 通过文献中的引用来衡量在研究中的用途:

    请说明得出这些指标的方法。

    年度总计:[第一年][第2年][第三年]
    欧洲提到的资源名称PMC(引用资源名称)
    欧洲PMC中提到的加入人数(引用资源数据)

    描述资源列表的关键出版物(例如NAR数据库期刊中的出版物)和引用数量(在欧洲PMC中):

  • d。 其他资源的依赖性:其他资源是否依赖于此处描述的资源来提供该服务(即,通过什么途径到达)?请列出。

3.服务质量

  • a。 标识符使用:资源是否提供持久和唯一的标识符?

  • b。 数据吞吐量:过去2-3年中,每年记录的数量、沉积(每年摄入的记录或字节)、处理的记录、组装的基因组等。

    [第一年][第2年][第三年]
    入境/沉积总数
    大小(GB)
    尺寸(其他)

  • c。 技术性能:

    • i、。 正常运行时间:过去12个月内关键网页(或类似网页)样本的每月可用性百分比(例如搜索结果、主页、数据记录页面)。

    • ii、。 关键网页的响应时间.

  • d。 标准的使用:元数据和数据(例如MIAME、JATS、INSDC特性、本体)使用了哪些社区认可的标准?提供文档链接。

  • e、。 来源文件链接:资源是否与科学文献联系起来,以确定事实或生物背景的来源?

  • f、。 数据可用性–访问服务和格式:

    • i、。 数据共享服务:列出共享数据的服务(例如网站、API、FTP、TripleStore)

    • ii、。 数据共享格式:列表格式数据可用(例如文本、FASTA、XML、Dublin Core、tsv、JSON)

  • g、。 客户服务:

    • i、。 服务台:资源是否运行帮助台?

    • ii、。 用户反馈:资源是否寻求用户输入并将其纳入服务设计决策?

    • (三)。 培训:资源是否进行培训活动?

4.法律和资金基础设施、治理

  • a。 科学咨询委员会:该资源是否有国际独立的科学咨询?

  • b。 开放科学:资源是否有支持开放科学的法律框架?例如公开许可证或公开使用条款的公开声明。

  • c。 隐私政策:资源是否有公开可用的隐私政策,其中描述了个人数据和cookie的安全性?

  • d。 伦理学 政策:资源是否有符合所有相关国际标准和最佳实践的道德政策?

  • e、。 可持续支持和资金:证明东道国机构和/或其他实体过去和未来的资金承诺和/或支持资源的其他承诺。

5.影响和翻译故事

  • a。 反事实:如果资源不存在或消失而不被取代,对科学界会产生什么影响?资源是否全球唯一?对其他依赖资源的影响是什么?

  • b。 加速科学发展:资源如何促进科学发展?例如,资源是否设置了标准;促进数据或软件的重用;提高研究效率;在其他领域扩展技术产品?

  • c。 翻译数据:有没有观众熟悉的“翻译”人物可以帮助他们掌握资源的核心性质?

对本文的评论 评论(0)

版本2
第2版 2016年9月30日出版
注释
作者详细信息 作者详细信息
竞争性利益
授权信息
文章版本(2)
版权
下载
 
导出到
韵律学
意见 下载
F1000研究 - -
公共医学中心
每月收到并更新来自PMC的数据。
- -
引文
引用
如何引用这篇文章
Durinx C、McEntyre J、Appel R等人。识别ELIXIR核心数据资源[版本2;同行评审:2已批准]F1000研究2017,5(ELIXIR):2422(https://doi.org/10.12688/f1000research.9656.2)
注:重要的是要确保标题后的方括号包含在本文的所有引文中。
轨道
接收此文章的更新
跟踪文章以接收有关此文章任何更新的电子邮件提醒。

开放式同行评审

当前审阅者状态: ?
审阅者状态的关键 视图
经核准的这篇论文以目前的形式在科学上是合理的,只有微小的改进建议(如果有的话)
保留批准为了解决具体细节并提高论文的学术价值,需要进行一些小的修改,有时需要进行更重大的修改。
未批准论文中的基本缺陷严重破坏了调查结果和结论
版本1
版本1
2016年9月30日出版
意见
0
引用
审查人报告 2016年10月18日
玛丽安·E·马顿,神经科学系,生物系统研究中心,https://hyperus.is(假设)/美国加利福尼亚州拉荷亚;Hypothes.is,美国加利福尼亚州旧金山;SciCrunch.com创始人,美国加利福尼亚州圣地亚哥
经核准的
视图0
我知道这篇文章包含在Elixir报告集合中,事实上,它读起来就像一篇报告。如果一个人非常熟悉长生不老药,这可能是有道理的,但如果一个人不是,那么它是一种。。。继续阅读
引用
引用
如何引用本报告
Marton ME.审查报告:识别ELIXIR核心数据资源[版本2;同行审查:2批准].F1000研究2017,5(ELIXIR):2422(https://doi.org/10.5256/f1000research.10405.r16722)
注:重要的是要确保标题后的方括号包含在本文的所有引文中。
意见
0
引用
审查人报告 2016年10月10日
海伦·波曼,美国新泽西州皮斯卡塔韦新泽西州立大学罗格斯综合蛋白质组学研究中心化学与化学生物学系
经核准的
视图0
这是一篇写得很好的文章,描述了如何识别和评估ELIXIR核心数据资源。这些数字、表格和说明性方框都经过精心设计,并添加到清晰的文字中。这篇论文应该被要求阅读。。。继续阅读
引用
引用
如何引用本报告
Berman H.审查人报告:识别ELIXIR核心数据资源[版本2;同行审查:2批准].F1000研究2017,5(ELIXIR):2422(https://doi.org/10.5256/f1000research.10405.r16871)
注:重要的是要确保标题后的方括号包含在本文的所有引文中。

对本文的评论 评论(0)

版本2
第2版 2016年9月30日出版
注释
除了报告之外,评审员还为文章指定了一个状态:
批准-该论文以目前的形式在科学上是合理的,只有微小的改进建议(如果有的话)
有保留地批准——为了解决具体细节和提高论文的学术价值,需要进行一些小的修改,有时需要进行更大的修改。
未批准-文件中的基本缺陷严重破坏了调查结果和结论
登录
如果您忘记了密码,请在下面输入您的电子邮件地址,我们将向您发送有关如何重置密码的说明。

电子邮件地址应该是您最初在F1000注册的地址。

电子邮件地址无效,请重试

您通过谷歌注册了F1000,因此我们无法重置您的密码。

要登录,请单击在这里.

如果您仍然需要有关谷歌帐户密码的帮助,请单击在这里.

您通过Facebook注册了F1000,因此我们无法重置您的密码。

要登录,请单击在这里.

如果您仍然需要有关Facebook帐户密码的帮助,请单击在这里.

代码不正确,请重试
给我们发电子邮件以获得进一步帮助。
服务器错误,请重试。