关闭

特征

软件遗产功能

通过一组值得信赖的开放服务共享源代码公共项,从而访问世界上最大的源代码库

浏览和搜索

SWH存档是所有捕获的源代码及其整个开发历史的门户。使用可浏览平台,可以可视化对给定代码位置的所有访问(从不同的伪造、包管理器和发行版收集),并读取捕获的源代码内容。

转到存档
SWHID提供商和解析器

SWH提供了一个持久IDentifier(PID),它可以完整地标识每个源代码工件,称为SWHID。SWHID是与指定对象紧密绑定的内在标识符,它们不需要注册,只需要就解决它们的标准达成协议。

SWHID也可以用作徽章.

有关更多信息

转到解析器API端点

检查文档
下载

Vault是一项服务,负责将归档文件的部分重建为自包含的捆绑包,然后可以在本地导入。例如,在Git存储库中。使用vault,用户可以在web平台上或通过API下载目录和修订版。

有关更多信息

转到下载目录API端点

过来看
立即保存代码

访问世界上的每个存储库都需要一些时间,尤其是如果这些存储库每天都要进行多次更改的话。这就是为什么提供了“立即保存代码”服务,以便能够通过保存请求通知SWH。

转到API端点

过来看
存包处

存款特征是SWORD 2.0软件服务器实现。S.W.O.R.D公司(S公司简单W公司电子商务服务O(运行)缓冲R(右)沉积的D类eposit)是数字文件存放的互操作性标准。存放允许客户端(存储库,例如HAL)向SWH档案元数据也可以参考存储库url(源)或SWHID提交。

有关更多信息

过来看
爬行

SWH存档从不同的源代码中获取源代码,并将所有源代码转换为一个单一的通用数据结构,即一个巨大的Merkle定向非循环图[Merkle,1987年],这是一种经典的密码构造,结合了树和哈希函数。

爬行分为三个阶段:列出软件源, 计划更新  收集将软件工件放入归档.

检查文档

幕后

归档所有源代码是一项艰巨的任务,并且有不同的机制来确保保存来自不同类型源代码的源代码


美国石油学会

API访问是通过HTTPS进行的。所有API终结点都以为根https://archive.softwareheritage.org/api/1/默认情况下,数据以JSON格式发送和接收。

您可以直接跳到 端点索引 ,其中列出了所有可用的API功能,或继续阅读以获取有关API的更多一般信息。

有关更多信息

过来看
建筑

从forge归档存储库与从包管理器归档源代码不同。当您意识到版本控制系统在过去几十年中已经发展了很多时,这变得更加困难。SWH体系结构旨在将不同来源协调为一个强大的基础设施。


阅读更多信息
数据模型

Software Heritage采用的数据模型表示其收集的信息,其中心思想是软件工件,使用以下规范名称,从下至上:内容、目录、修订和发布。还可以使用来源、访问和快照来存储来源信息。在中阅读更多信息软件遗产:为什么以及如何保存软件源代码。

查看文档
镜子

SWH镜像是与软件遗产通用源代码存档同步的完整副本,独立于软件遗产计划运行。镜像将提高软件可用性,防止信息丢失,并最终确保所有人都能自由访问软件源代码,从而降低因不受控制的事件而导致数据丢失的风险。

有关更多信息

过来看
元数据

SWH收集并提取描述和提供有关源代码的附加信息的元数据。

  • 外部元数据是在软件源代码中找不到的元数据。
  • 内在元数据是源代码、特定文件或源代码文件的一部分中包含的元数据。

元数据索引器文档

博客帖子

阅读更多信息
编制索引

swh-indexer模块负责计算源代码文件以提取信息,目标如下:

  • mimetype格式

  • 插件

  • 语言

  • fossology-license(检测文件的许可证)

  • 内在描述性元数据,可以在源代码的元数据文件中找到(例如package.json、codemeta.json、pom.xml)
阅读更多信息