数据语句于2017年由华盛顿大学的Emily M.Bender和Batya Friedman首次概念化,最初是为自然语言处理系统中使用的语言数据集开发的。这个第一版2018年,《计算语言学协会学报》发表了数据声明并在2019年会议上提出计算语言学协会(NAACL)北美分会。在接下来的两年里,人们产生了巨大的兴趣和兴趣。为了支持更广泛的理解和学习如何使数据陈述成为不同研究和机构背景下的合适实践,2020年,艾米丽·本德(Emily M.Bender)、巴蒂亚·弗里德曼(Batya Friedman)和安吉丽娜·麦克米兰(Angelina McMillan-Major)组织了一次车间在第十二届语言资源与评估会议上。这次研讨会的结果导致了一个更新的模式(第2版)、一套最佳实践,以及数据语句编写指南全部发布于2021年。
数据声明是人工智能系统透明文档工具包新兴前景的一部分,包括数据集的数据表,模型报告的模型卡,数据集营养标签,数据和模型的营养标签,产品介绍、和数据卡.