通过一组值得信赖的开放服务共享源代码公共项,从而访问世界上最大的源代码库
SWH存档是所有捕获的源代码及其整个开发历史的门户。使用可浏览平台,可以可视化对给定代码位置的所有访问(从不同的伪造、包管理器和发行版收集),并读取捕获的源代码内容。
SWH提供了一个持久IDentifier(PID),它可以完整地标识每个源代码工件,称为SWHID。SWHID是与指定对象紧密绑定的内在标识符,它们不需要注册,只需要就解决它们的标准达成协议。
SWHID也可以用作徽章.
有关更多信息
转到解析器API端点
Vault是一项服务,负责将归档文件的部分重建为自包含的捆绑包,然后可以在本地导入。例如,在Git存储库中。使用vault,用户可以在web平台上或通过API下载目录和修订版。
转到下载目录API端点
访问世界上的每个存储库都需要一些时间,尤其是如果这些存储库每天都要进行多次更改的话。这就是为什么提供了“立即保存代码”服务,以便能够通过保存请求通知SWH。
转到API端点
存款特征是SWORD 2.0软件服务器实现。S.W.O.R.D公司(S公司简单W公司电子商务服务O(运行)缓冲R(右)沉积的D类eposit)是数字文件存放的互操作性标准。存放允许客户端(存储库,例如HAL)向SWH档案元数据也可以参考存储库url(源)或SWHID提交。
“Add forge now”为Software Heritage用户提供了一项服务,通过请求将伪造URL添加到定期访问的伪造品列表中,将完整的伪造品保存在Software Helitage存档中。
该过程遵循验证工作流,包括管理和验证锻造技术是否由软件遗产工具支持。
SWH存档从不同的源代码中获取源代码,并将所有源代码转换为一个单一的通用数据结构,即一个巨大的Merkle定向非循环图[Merkle,1987年],这是一种经典的密码构造,结合了树和哈希函数。
爬行分为三个阶段:列出软件源, 计划更新 和 收集将软件工件放入归档.
归档所有源代码是一项艰巨的任务,并且有不同的机制来确保保存来自不同类型源代码的源代码
API访问是通过HTTPS进行的。所有API终结点都以为根https://archive.softwareheritage.org/api/1/默认情况下,数据以JSON格式发送和接收。
您可以直接跳到 端点索引 ,其中列出了所有可用的API功能,或继续阅读以获取有关API的更多一般信息。
从forge归档存储库与从包管理器归档源代码不同。当您意识到版本控制系统在过去几十年中已经发展了很多时,这变得更加困难。SWH体系结构旨在将不同来源协调为一个强大的基础设施。
Software Heritage采用的数据模型表示其收集的信息,其中心思想是软件工件,使用以下规范名称,从下至上:内容、目录、修订和发布。还可以使用来源、访问和快照来存储来源信息。在中阅读更多信息软件遗产:为什么以及如何保存软件源代码。
SWH镜像是与软件遗产通用源代码存档同步的完整副本,独立于软件遗产计划运行。镜像将提高软件可用性,防止信息丢失,并最终确保所有人都能自由访问软件源代码,从而降低因不受控制的事件而导致数据丢失的风险。
SWH收集并提取描述和提供有关源代码的附加信息的元数据。
元数据索引器文档
博客帖子
swh-indexer模块负责计算源代码文件以提取信息,目标如下:
mimetype格式
插件
语言
fossology-license(检测文件的许可证)