跳到主页面内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2022年11月12日;9(1):696.
doi:10.1038/s41597-022-01815-3。

将元数据的社区标准建模为模板,使数据公平

附属机构

将元数据的社区标准建模为模板,使数据公平

马克·阿穆森等。 科学数据. .

摘要

确定数据集是否可查找、可访问、可互操作和可重用(FAIR)是一项挑战,因为FAIR指导原则涉及用于注释数据集的元数据的高度特殊标准。具体而言,公平原则要求元数据“丰富”,并遵守“与域相关”的社区标准。科学社区应该能够为元数据定义自己的机器可操作模板,这些元数据编码这些“丰富”的、特定于学科的元素。我们已经在两个软件系统的上下文中探讨了这种基于模板的方法。一个系统是CEDAR工作台,调查人员使用它来编写新的元数据。另一个是FAIRware Workbench,它评估存档数据集的元数据是否符合社区标准。当元数据模板成为管理在线数据集的工具生态系统中的核心元素时,就会产生效益,这两个原因都是因为这些模板可以作为构成公平数据的社区参考,因为它们以一种可以在各种软件应用程序之间分发的形式体现了这一观点,以帮助进行数据管理和数据共享。

PubMed免责声明

利益冲突声明

ES是展会合作伙伴的科学总监(https://partnersinfair.com). 没有其他相互竞争的利益。

数字

图1
图1
用于捕获组织样本信息的元数据模板。此屏幕截图显示了NIH支持的HuBMAP联盟中的研究人员使用的模板,该模板用于指定用于进行细胞特异性生物标记物分析的生物样本的元数据。在图中,用户正在从一个特殊的HuBMAP本体输入一个受控术语,以提供样本制备介质的元数据条目。组织属性是HuBMAP社区选择用于标准化此类样本描述的属性。用于为元数据属性提供值的本体术语同样代表了社区认可的声明此类信息的标准。
图2
图2
CEDAR库中的元数据模板集合。屏幕截图描述了HuBMAP用户创建的或与其社区成员共享的一组模板。在CEDAR中,用户可以查看和访问自己的元数据模板、其他人明确与用户共享的模板以及存储在“社区文件夹”中的指定研究社区共享的模板。在这里,用户试图填充示例部分模板,如图1所示。
图3
图3
FAIRware Workbench分析组织样本的元数据记录。截屏显示了对存储库中一条记录的分析,指出了哪些地方没有遵循报告指南,或者哪些地方没有正确使用本体术语。系统自动将字符串“208天”更正为整数208。对于“存储介质”条目没有明显的更正。因为在本例中,FAIRware工作台处于交互模式,它为用户提供了一个本体术语菜单,该菜单可能会提供一个符合标准的值。
图4
图4
FAIRware Workbench总结分析。工作台为用户提供了输入数据与运行时指示的元数据模板定义的标准的一致性的概述。我们可以看到,总的来说,有许多记录缺少必需的字段,还有一些记录的字段值不符合标准(例如使用标准本体术语)。在屏幕底部,用户可以查看更多详细信息,并查看哪些元数据字段造成的困难最大。
图5
图5
HuBMAP元数据的JSON-LD表示如图1所示。本体术语的持久标识符的显式合并为相应的元数据字段提供了语义基础。例如,我们可以看到,“制备介质”的值是指来自MeSH的术语。

类似文章

引用人

工具书类

    1. Wilkinson MD等人。科学数据管理和管理的公平指导原则。科学。数据。2016;3:160018.-项目管理咨询公司-公共医学
    1. Bloemers M,Montesanti A.公平投资模型:为研究资助者提供一个框架,以推动向公平数据管理和管理实践的过渡。数据智能。2020;2(1–2):171–180.
    1. Stall S等人。使科学数据公平。自然。2019;570:27–29.-公共医学
    1. Wilkinson MD等。通过可扩展、自动化、社区治理的框架评估FAIR成熟度。科学。数据。2019;6:174.-项目管理咨询公司-公共医学
    1. Clarke DJB等人,《公平动摇:评估研究数字资源公平性的工具包》。细胞系统。2019;9(5):417–421.-项目管理咨询公司-公共医学