关闭

2019年9月5日

开放科学的软件遗产

打开2018年7月4日揭幕了法国开放科学国家计划,它将软件遗产确定为一个需要支持的关键计划。今天我们很高兴欢迎法国研究部作为我们的第一个金牌赞助商为我们的努力做出了有效贡献。我们非常感谢这一机构支持,我们期待看到许多其他国家效仿这一做法。

在这个场合,我们很高兴回顾为什么Software Heritage正在构建一个对开放科学起关键作用的基础设施。

使科学开放

开放科学是一个重要的运动,希望公开所有公共研究结果。

什么之中的一个这场运动的许多目标是拆除过去几十年中出现的障碍和壁垒,现代信息和通信技术的出现所产生的壮观经济被私人股东吸收,而不是交给研究人员和资助机构,将出版商和研究人员之间传统的利益联姻转变为漫长而痛苦的离婚过程.

另一个重要目标是尝试解决深度再现危机特别是通过促进研究和出版过程中各种成分的获取、理解、验证和重用。

软件是开放科学的关键要素

如今,软件已经成为这些要素之一,并且必不可少的,对于所有学科的研究活动:
从物理学到生物学,从数学到语言学,从法律到社会科学,计算机程序到处都在使用。为了理解、复制、验证和重用研究结果,有必要访问描述它的文章,以及用于获取数据的数据和计算机程序.

为了真正理解计算机程序的功能,并使其适应新的研究,我们需要访问它的源代码.

为开放科学服务的软件遗产

这就是为什么我们在Software Heritage的工作与开放科学特别相关。
通过构建长期、非盈利、共享基础设施收集、保存并使所有公开可用软件的源代码易于使用,我们实际上正在为建造早该出现的开放科学软件支柱.

实际上,软件与数据大不相同,需要特定的设计决策。以下是使软件遗产如此特别的一些关键功能:

  • 我们提供内在标识符对于我们存档的所有软件:内部标识符允许以不同的粒度跟踪软件源代码工件,而无需依赖可信的第三方
  • 我们将所有来源的软件源代码摄取到单一、统一、简单的数据模型基于Merkle树,一个设计选择允许:
    • 抽象出细节,比如使用的特定版本控制系统或开发平台;
    • 通过消除对复杂工具的依赖性,简化对存档内容的长期访问;
    • 通过大幅减少所需的存储空间来控制运营成本
  • 我们将所有软件源代码归档,不仅是研究软件研究软件依赖于大量其他软件,从操作系统到通用库和工具

利用这些独特的功能,现在终于可以以一种新的、增强的方式撰写参考研究软件的研究文章、和我们为此提供了详细的指导方针.

2019年9月5日