关闭

软件遗产:使用归档数据的道德宪章

序言

软件是我们数字社会的核心,它体现了我们越来越多的科学、技术和组织知识。因此,软件源代码现在已成为我们文化遗产中越来越重要的一部分,也是教育、研究和工业的宝贵资产。

Software Heritage的核心任务是通过收集、保存和共享所有可用的源代码形式的软件及其完整的开发历史,确保这一宝贵的知识体系随着时间的推移而得到保存,并提供给所有人。永远。

我们这样做有多种原因。为了保存嵌入在软件源代码中的科学和技术知识,这是我们遗产的重要组成部分。通过构建最大的开放式软件知识数据库,使开发范围广泛的增值应用程序成为可能,从而为社会和行业提供更好的软件开发和重用。为了促进更好的科学,通过为软件研究收集最大的管理档案,并建立用于保存和共享研究软件的基础设施。

我们现在这样做,因为我们正处于一个转折点:一方面,创造我们今天所依赖的计算机技术的许多人仍然存在,并愿意通过提供他们贡献的源代码来提供帮助,但我们只有有限的时间来收集他们的遗产。另一方面,由于托管站点的受欢迎度下降时会关闭,并且缺乏结构化的工作来存档软件工件,我们似乎面临着大量丢失协作开发的源代码的风险。

您可以访问软件遗产档案的全部内容,这是软件遗产和软件遗产镜像网络进行大量收集、预处理和保存工作的结果。

这为您提供了前所未有的机会来研究和分析有史以来最大的源代码集合。

我们希望,对档案馆的这种访问将促进产生积极成果的研究项目,例如加强我们对软件作为人类智慧的崇高艺术品的理解,提高其质量,研究其历史,以及许多我们甚至没有预见到的其他项目。

但权力带来责任,本《道德宪章》强调了所有访问档案馆的人和组织承诺尊重的原则。

避免伤害

软件遗产档案中收集的源代码可以在许多研究领域进行广泛的分析和应用。不幸的是,即使是出于好意的行动,包括纯粹出于研究目的的行动,也可能导致伤害。

您需要考虑因使用数据而产生的所有潜在道德问题,并避免进行可能导致伤害的分析或处理。

保护个人数据

Software Heritage档案从各种公共来源收集公开可用的源代码及其开发历史。因此,源代码或开发历史中可能包含的任何个人信息都将被收集到存档中,您可以访问它。

即使当地法律没有强制规定,您也会努力采取保护个人数据的流程和政策,尤其是保护那些通过工作和奉献创造了我们正在保护的软件公共空间的人们,使其免受虐待行为的影响。群发邮件软件开发人员是一个众所周知的滥用示例,这显然是不可接受的,但可能还有很多其他的例子。

避免无用的副本

你也被要求避免重新发布档案馆的全部内容或其中的重要部分:这既不必要,也很危险。如果您需要使(部分)数据可用,例如用于再现性研究,请不要复制数据,而是使用将数据引用到Software Heritage本身的持久标识符。Software Heritage是一个长期存档,因此引用将随着时间的推移而稳定,而不是随时间而腐烂的批量拷贝。

将存档副本保存在Software Heritage Mirror网络中还可以确保所有访问数据的人都受到与您相同的义务的约束。

关注衍生数据

您需要仔细考虑您在处理和分析过程中向第三方提供的衍生数据。例如,即使您没有直接参与群发邮件软件开发人员的工作,也可以通过您的研究发布所有开发人员电子邮件地址的完整数据库,从而使第三方能够群发邮件,因此您必须避免发布。