计算机科学>人工智能
标题: 用于等价和替换本体匹配的机器学习友好生物医学数据集
摘要: 本体匹配(OM)在生物信息学和语义网等领域发挥着重要作用,其研究越来越受欢迎,尤其是随着机器学习(ML)技术的应用。 尽管本体对齐评估倡议(OAEI)为OM系统的系统评估做出了令人印象深刻的努力,但它仍然受到一些限制,包括对包含映射的有限评估、次优引用映射以及对基于ML的系统评估的有限支持。 为了解决这些局限性,我们引入了五个新的生物医学OM任务,涉及从Mondo和UMLS中提取的本体。 每个任务都包括等价匹配和包含匹配; 引用映射的质量由人工管理、本体修剪等保证。; 提出了一个综合评估框架,从多个角度衡量基于ML和非基于ML的OM系统的OM性能。 我们报告了不同类型OM系统的评估结果,以证明这些资源的使用情况,所有这些资源都是OAEI 2022新BioML轨道的一部分。