研究数据
使数据有效
存储: 研究数据需求层次结构的第一步是需要存储已获取的数据。 保存: 一旦存储了研究数据,就需要以独立于格式的方式对其进行保存,否则风险数据就会过时。 可访问: 即使在存储和保存数据时,这并不一定意味着它可以自动访问。 研究人员和机器可能都想访问这些数据,例如,用于元分析或其他类型的重用。 可发现: 即使数据被存储、保存并且原则上是可访问的,如果其他人无法发现数据,那么这也不太值得。 引文: 数据共享的障碍之一是,它需要研究人员付出额外的工作,而回报甚微。 数据引用有可能改变这一点,因为它们可以很容易地纳入基于文章引用的当前奖励系统。 可理解: 为了能够重用数据,需要明确使用了哪些测量单位、如何收集数据以及使用了哪些缩写和参数。 数据来源对理解至关重要。 检验过的: 虽然对研究文章进行同行评审是很常见的,但对研究数据来说,这种情况仍然很少见。 然而,在数据的质量控制和可信度方面,这是一个重要的步骤。 可复制: 研究结果的可再现性是科学界关注的一大问题。 不可复制性通常源于研究数据中缺少元素,而这些元素是实现相同研究结果所必需的。 例如,生物医学文献中报道的资源(如抗体、模型生物和软件)往往缺乏足够的细节来实现再现性或重复使用。 可重复使用的: 共享研究数据对更广泛的研究社区的关键好处是能够重用这些数据。 只有当研究数据足够可信和可复制时,其他研究人员才会重复使用这些数据。 集成: 我们认为,整合这九个方面的“高效研究数据”很重要。例如,数据应该被保存下来,以便可以重复使用。 为了便于引用,它需要易于访问。 但是,在构建数据重用或数据引用系统时,需要考虑当前系统存储和共享数据的实践。