政府和公共部门、交通和教育、文化和体育类别中的欧洲数据门户数据集是否符合网络最佳实践数据?
摘要
1.总结
最佳实践1:为人类用户和计算机应用程序提供元数据。 此BP具有以下优点:重用、理解、发现和可处理性。 最佳实践2:提供描述性元数据—数据集及其分布的一般特征,便于在web上发现数据集,以及数据集的性质。 优点:重用、理解和可发现性。 最佳实践3:提供结构化元数据——分发的模式和内部结构(例如,CSV文件、API或RSS提要的描述)。 优点:可重用性、可理解性和可处理性。 最佳实践4:使用数据许可协议的链接或副本提供数据许可信息。 优点:重用和信任。 最佳实践5:提供数据来源信息——数据的来源以及它们已经经历的所有更改。 优点:重用、理解和信任。 最佳实践6:提供数据质量信息-“提供有关数据质量和特定用途适用性的信息”。 应明确记录数据质量。 优点:重用和信任。 最佳实践7:提供版本指示符-“为每个数据集分配并指示版本号或日期”。 优点:重用和信任。 最佳实践8:为每个可用版本提供版本历史记录描述,解释其与前一版本的差异。 优点:重用和信任。 最佳实践9:使用持久URI作为数据集的标识符,以持久的方式标识数据集。 优点:重用、互操作性和可链接性。 最佳实践10:使用持久URI作为数据集中的标识符,在数据集之间重用URI,并确保其他数据集可以一致地引用它们的标识符。 优点:重用、互操作性、可链接性和可发现性。 最佳实践11:将URI分配给数据集版本和系列,分配给单个版本的数据集,以及分配给整个系列。 好处:重用、可发现性和信任。 最佳实践12:使用机器可读的标准化数据格式,最大限度地减少对数据使用的限制。 优点:可重用性和可加工性。 最佳实践13:使用当地中立的数据表示,以限制误解; 如果这不可能,则必须提供数据值使用的位置的元数据。 优点:重用和理解。 最佳实践14:以多种格式提供数据,以降低转换数据集的成本和过程中的错误。 优点:可重用性和可加工性。 最佳实践15:重用词汇表,最好是标准化词汇表,以编码数据和元数据。 优点:重用、可处理性、理解、信任和互操作性。 最佳实践16:选择正确的形式化级别—适合最可能的数据和应用程序的级别。 优点:重用、理解和互操作性。 最佳实践17:提供批量下载,允许用户通过单个请求检索完整的数据集。 优点:重用和访问。 最佳实践18:为大型数据集提供子集,以便数据用户只能下载他们需要的子集。 优点:重用性、可链接性、访问性和可处理性。 最佳实践19:使用内容协商来提供多种格式的数据,以提供各种格式的数据。 优点:重用和访问。 最佳实践20:为即时访问提供实时访问,以鼓励开发实时应用程序。 “应用程序将能够实时或近实时访问时间关键型数据,其中实时意味着数据创建后的毫秒到几秒钟的范围”。 优点:重用和访问。 最佳实践21:提供最新的数据,并明确更新频率。 好处:重复使用和访问。 最佳实践22:对不可用的数据进行解释-“解释如何访问数据以及谁可以访问数据”,为潜在的数据使用者提供完整的上下文。 优点:重用和信任。 最佳实践23:通过API提供数据,为数据消费者提供最大的灵活性和可处理性。 优点:重用、可处理性、互操作性和访问。 最佳实践24:将网络标准用作API的基础,以使其更可用,并利用网络的优势。 API应基于web标准构建,以利用web的优势(例如REST)。 优点:可重用性、可处理性、可访问性、可发现性和可链接性。 最佳实践25:为您的API提供完整的文档,使开发人员能够感知其质量和有用性。 “在添加功能或进行更改时更新文档”。 优点:重用和信任。 最佳实践26:避免破坏对API的更改,这样客户端代码就不会停止工作。 优点:信任和互操作性。 最佳实践27:保留标识符——如果需要从web上删除数据,则需要保留相应的标识符,以便用户不会被定向到404响应代码(找不到)。 优点:重用和信任。 最佳实践28:评估数据集覆盖率—在保存数据集之前评估数据集的覆盖率。 优点:重用和信任。 最佳实践29:通过易于检测的机制从数据使用者那里收集反馈。 “数据消费者将能够提供关于数据集和分布的反馈和评级”。 优点:重用、信任和理解。 最佳实践30:提供反馈-公开消费者对数据集和分发数据集的反馈。 优点:重用和信任。 最佳实践31:通过生成新数据来丰富数据,以提高其价值。 优点:重用、理解、信任和可处理性。 最佳实践32:提供补充演示文稿,如可视化、表格、web应用程序和摘要。 优点:重用、理解、访问和信任。 最佳实践33:向原始出版商提供反馈,例如,他们的数据何时以及如何被重用,或者改进的方面。 优点:重用、互操作性和信任。 最佳实践34:遵循许可条款,以便与原始出版商保持良好关系。 优点:重用和信任。 最佳实践35:引用原始出版物,以建立对数据的信任。 优点:重用、信任和可发现性。
2.数据说明
3.方法
3.1. 探索性研究
3.2. 最终研究
4.用户注释
补充资料
作者贡献
基金
机构审查委员会声明
知情同意书
数据可用性声明
利益冲突
工具书类
桑托斯,P.L.V.A.C。; 圣安娜,R.C.G.Dado e granularidade e na perspectiva da informaçáo e tecnologia:Uma interpretataço pela ciñncia da informationço。 词。 信息。 2013 , 42 , 199–209. [ 谷歌学者 ] 阿尔贝托尼(R.Albertoni)。; 考克斯,S。; Beltran,A.G.公司。; Perego,A。; Winstanley,P.数据目录词汇(DCAT-Version 2)。 W3C建议2020年2月4日)。 在线可用: https://www.w3.org/TR/vocab-dcat/ (2021年2月18日访问)。 Greenberg,J.元数据和万维网。 图书馆与信息科学百科全书。 2003年。在线提供: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.134.4528&rep=rep1&type=pdf (2021年5月28日访问)。 J.莱利。 什么是元数据,它的用途是什么? NISO:美国马里兰州巴尔的摩,2017年; 在线可用: https://groups.niso.org/apps/group_public/download.php/17446/理解%20Metadata.pdf (2021年5月28日访问)。 Lee-Berners,T.编织网络:词汇表。 1999年7月23日。 在线可用: https://www.w3.org/People/Berners-Lee/Waving/glossary.html (2021年5月28日访问)。 Simperl,E。; 沃克,J。 分析报告8:开放数据门户的未来 ; 欧盟出版局:卢森堡,2017年; 第1-26页。 在线可用: https://www.europeandataportal.eu/sites/default/files/edp_analyticalreport_n8.pdf (2020年10月5日访问)。 卡拉拉,W。; 费舍尔,S。; van Steenbergen,E.《2015年欧洲开放数据成熟度:对欧洲游戏状态的洞察》。 2020年。在线提供: https://beta.op.europa.eu/en/publication-detail/-/publicaation/0e95f3cb-141c-11eb-b57e-01aa75ed71a1 (2020年10月13日访问)。 Berends,J。; 卡拉拉,W。; 拉杜,C。 分析报告9:开放数据的经济效益 ; 欧盟出版局:卢森堡,2017年。 [ 谷歌学者 ] [ 交叉参考 ] 欧洲委员会。 打开数据门户。 2021.在线提供: https://digital-strategy.ec.europa.eu/en/policies/open-data-portals (2021年5月28日访问)。 范·克尼彭伯格(Van Knippenberg,L.)。 分析报告16:欧洲开放数据最佳实践:向塞浦路斯、法国和爱尔兰学习 ; 欧盟出版局:卢森堡,2020年。 [ 谷歌学者 ] [ 交叉参考 ] 数据。 欧罗巴。 欧盟。 关于数据。 欧罗巴。 欧盟。 (2021年更新)。 在线可用: https://data.europa.eu/de/highlights/openregions-and-cities-data-european-data-portal(https://data.europa.eu/de/highlights/openregions-and-cities-data-european-data-portal数据门户网站) (于2021年6月21日访问)。 国家空间数据基础设施。 大约2021年4月21日。 在线可用: https://www.nipp.hr/default.aspx?id=1728。 (2021年6月19日访问)。 莱西奥,B.F。; 伯尔,C。; Calegari,N.(编辑)网络最佳实践数据。 2017年1月31日。 在线可用: https://www.w3.org/TR/dwbp/#intro。 (2020年10月13日访问)。 医学博士威尔金森。; 杜蒙蒂尔,M。; Jan Aalbersberg,I.J。; 阿普尔顿,G。; 艾克斯顿,M。; Baak,A。; 布隆伯格,N。; Boiten,J。; 桑托斯,L.B.D。; 伯恩,P.E。; 等。科学数据管理和管理的公平指导原则。 科学。 数据 2016 , 三 , 60018. [ 谷歌学者 ] [ 交叉参考 ] [ 绿色版本 ] E.都灵。; Trevisan,G.L。; Vidotti,S.A.B.G.Dados abertos CAPES:Um OlharáLuz dos Desafios para Publicaço de Dados na Web。 词。 信息。 2019 , 48 , 38–46. 在线可用: https://repositorio.utfpr.edu.br/jspui/handle/1/4812。 (2021年6月1日访问)。 原产地。 链接数据词汇表。 2013.在线提供: https://www.w3.org/TR/ld-glossary/#provenance。 (2021年5月5日访问)。 Hartig,O.《数据网络中的产地信息》。 2009年。在线提供: http://ceur-ws.org/Vol-538/ldow2009_paper18.pdf (于2021年5月28日访问)。 卡拉拉,W。; 费舍尔,S。; Oudkerk,F。; van Steenbergen,E。; 丁霍尔特,D。 分析报告1:数字转型和开放数据 ; 欧盟出版局:卢森堡,2015年; 第1-22页。 [ 谷歌学者 ] [ 交叉参考 ]