正确处理数据

作为一个专注于利用数据科学支持人道主义问题的组织,DataKind知道道德至关重要。在这个博客中,DataKind UK概述了他们社区创建的道德原则。继续读下去,看看你的想法。这是你会采用的代码吗?你会补充什么?通过在下面留言加入对话,并继续关注此主题的更多信息。

无偿数据科学家的道德原则

嘉宾博客:Christine Henry和DataKind英国团队

“道德是知道你有权做什么和做什么之间的区别。”——波特·斯图尔特

作为自愿帮助非营利组织的数据科学家,我们希望我们的工作能对我们周围的人产生积极影响。然而,在数据科学和人工智能的新领域,有时很难知道什么是对的和错的,也很难知道我们的工作会产生什么影响。我们都同意我们不想歧视人,但我们也认识到,在数据科学中,标记和分类人的类型和行为类型是我们工作的核心。在DataKind,当你考虑到我们所从事的项目往往是针对我们社会中最弱势群体的,并且是为他们服务的,那么数据和技术的道德观就显得更加重要和严肃

DataKind的项目通常会导致非营利合作伙伴重新分配稀缺资源(金钱、食物,甚至宣传和关注),这可能意味着一些团体将得不到支持。“无害”原则在我们的工作中应用起来并不简单。我们的工作往往是将危害降至最低,积极影响最大化,而不是一起避免危害。有时候什么都不做并不一定更好:即使分析项目不完善,慈善机构的使命也可以通过数据分析来推进。 

在DataKind UK,我们一直在思考一些棘手的道德问题。我们如何确保我们建立的预测模型不会产生意想不到的后果?我们能确定这一点吗?我们如何评估实现算法的好处与可能的风险?我们如何确保我们不会让这些道德挑战阻止我们在现状恶化时采取行动?

我们认为,作为一个组织,在道德上行事的最佳方式是直接面对这些棘手的道德问题,并支持公开、坦率的讨论。根据我们无偿数据科学家的意见,我们制定了一套原则来指导这些讨论。这些原则将帮助我们思考社区内的风险,并与我们的非营利合作伙伴分享这些担忧。在创建原则时,我们重点了解潜在的危害,仔细查看数据上下文和偏差,并对分析限制和分析选择的原因保持透明。

请参阅我们在下面概述的原则,并了解更多关于我们如何从社区中众包这些原则的信息。

我们是怎么做到的?

去年10月的一个晚上,我们召集了20名志愿者社区成员,以及几位DataKind的朋友和道德专家。才华横溢的Alix Dunn是Engine Room的创始人兼执行董事,同时也是DataKind UK执行董事的合作伙伴,她娴熟地为此次活动提供了便利。有关Alix对讨论的反思,请参见在这里 并查看责任数据论坛在这里. 

我们没有从空白页开始,而是决定在研讨会上“播种”其他相关文档的样本,参与者可以从中获取想法或做出反应六套原则来自不同领域和专业(例如政府、企业和学术界)。

人们以小组的形式工作,从示例文档中提取有用的原则,或者修改自己的变体。我们还提供了过去DataKind项目中的简短(匿名)案例研究,其中包括可能的道德问题,以帮助团队思考他们讨论的原则在现实世界中的应用。最后,我们将每个人的原则汇集到一个共享文档中,经过大量编辑后,该文档变成了下面概述的五项原则。

接下来是什么?

我们将开始向开始新项目的志愿者推出这些原则,并跟踪提出的道德问题和发生的情况。我们的志愿者计划委员会还将着手建立任何必要的流程,例如,问题跟踪文件,确定志愿者在项目或一般层面上接触道德问题的人,以及更新我们现有的范围界定流程,以尽早确定道德问题。

这旨在成为DataKind UK社区和任何对道德数据科学感兴趣的人的活文档。这些原则将根据未来数据科学实践的变化进行必要的更新和调整;在更广泛的数据社区中制定道德标准;以及慈善机构、利益相关者或我们社区的需求。我们希望我们概述的原则也能成为其他组织和数据科学从业者的榜样或起点。

原则

作为Datakind英国志愿者,我将努力坚持以下原则:

  • 我将积极考虑我在DataKind UK工作的危害和好处。
    1. 我知道数据通常代表人,滥用数据会造成伤害。鉴于DataKind UK的使命是为社会公益做数据科学,我将考虑我的工作对弱势群体的影响。
    2. 我理解数据可以成为包容和排斥的工具,这些影响可能是不明显和间接的。数据分析的结果可用于对人产生不同影响的决策,包括稀缺资源的分配(例如资金、食物,甚至宣传和关注)。我将与我的团队和慈善合作伙伴公开讨论该项目的不同潜在影响,包括任何间接后果。
    3. 在考虑我工作的影响时,我会权衡现状的代价。什么都不做的代价是什么?
    4. 我将倡导在公众、慈善机构及其合作伙伴中公平准确地表达我的工作。
  • 我将积极寻求了解我使用的数据和工具的背景。
    1. 我将寻找并询问数据和收集方法中的偏见。
    2. 我将考虑工具的内置假设、默认值和可供性,并考虑这些可能会对我的工作产生什么影响。
    3. 我会思考我们使用的数据和工具的历史,我知道所有数据集和工具都有人类决策的历史。此历史记录还包括对未包括的数据和人员的选择。
    4. 我理解隐私不是二元的,上下文关系到我的同意和我可以获得其数据的人的期望
    5. 我理解可用数据所能讲述的故事的局限性。
  • 我会让其他人了解我现在和将来所做的数据和分析选择。
    1. 我将公开和透明地选择数据和来源。
    2. 我将对分析选择和工具,以及在评估模型和结果质量时所做的选择持开放和透明的态度。
    3. 我将努力让用户(包括没有数据专业知识的人)能够有效、适当地使用我所从事的分析和工具。
    4. 我会考虑我工作的可配置性、可持续性、透明度、可审计性和可理解性。我会让利益相关者意识到这些限制。
    5. 我将了解我的分析可能有效的时间窗口,并将与利益相关者分享这一点。
  • 我将积极寻求了解自己的局限性和所涉及组织的局限性。
    1. 我会意识到自己的局限性,并现实地了解我能提供什么,以及DataKind UK可以在其不同的节目格式中提供什么。
    2. 我会意识到新技术的局限性,我会尊重人类的专业知识,并将技术纳入现有的人类决策。
    3. 我会警惕可能的法律问题,并在必要时寻求建议和专业知识。
  • 我将辩论和讨论道德选择。
    1. 我将公开辩论道德,并承认我们所做的选择是不确定的。
    2. 我将在DataKind UK内部提出任何道德问题,并听取其他志愿者的意见。我承认其他人可能会根据相同的信息做出其他道德决策。
    3. 在适当的情况下,我将寻求在DataKind UK之外执行这些原则。
滚动到顶部