蒙多病本体论

蒙多疾病本体论(Mondo Disease Ontology)旨在协调世界各地的疾病定义。蒙多这个名字来自拉丁语单词“mundus”,意思是“为了世界”

关于

目前存在多种疾病定义和数据模型来源,其中包括高性能操作,OMIM公司,SNOMED CT公司,ICD公司,苯酚DB,医学名词,MedGen公司,ORDO(作战需求文件),执行,GARD公司等;然而,这些来源部分重叠,有时也会发生冲突,因此很难确定它们之间的关系。这导致不同资源中疾病条目之间的映射激增;然而,映射是有问题的:总的来说,创建和维护映射的成本很高。最重要的是,映射缺乏完整性、准确性和精确性;因此,资源之间的映射调用常常不一致。UMLS提供了中间概念,通过这些概念可以映射其他资源,但这些映射也面临着同样的挑战:它们不能保证是一对一的,尤其是在罕见病等疾病概念不断演变的地区。

为了解决缺乏一个统一的疾病术语来提供疾病概念之间的精确对等,我们创建了Mondo,它为统一多种疾病资源提供了一个基于逻辑的结构。

Mondo的发展与人类表型本体(HPO),描述构成疾病的个体表型特征。与HPO一样,Mondo提供了一个层次结构,可用于将疾病分类或“汇总”到更高级别的分组。它提供了到其他疾病资源的映射,但与本体之间的其他映射相比,我们使用严格的语义精确地注释每个映射,以便我们知道两个疾病名称或标识符何时相等或一对一,而不是简单地紧密相关。

有关更多详细信息,请参阅以下内容幻灯片.

摘要统计信息

所有Mondo概念的汇总统计

查看每个版本和统计信息:MONDO发布

版本:https://github.com/kinast-initiative/mondo/releases/tag/v2022-03-01

疾病术语特征 计数
术语总数 22,157
数据库交叉引用 104,479
术语定义 15,443
精确的同义词 66,247
相关同义词 30,661
窄(更具体)同义词 2,214
广义同义词 847

选定疾病类别的疾病概念统计

请注意,这些分组是重叠的。版本:https://github.com/kinast-initiative/mondo/releases/tag/v2022-03-01。

疾病类型 计数(概念)
罕见病 10,443
传染病 1,240
癌症(包括肿瘤) 4,298
孟德尔病 11,380

Mondo是如何创建的?

Mondo是一个半自动构建的本体,它在多个疾病资源中进行合并,以生成一个连贯的合并本体。参见来源在这里Mondo的原始版本是完全自动构建的,并使用源数据库和本体的ID。后来,添加了其他手动管理的跨本体公理,并使用了本地Mondo ID系统来避免与源数据库混淆。

Mondo的一个特点是它超越了松散的外部参照。它构建了与其他资源连接的精确1:1等价公理,并通过OWL推理进行了验证。这意味着可以安全地从OMIM、孤儿院、EFO、DOID(即NCIT)传播这些信息。

这些精确映射以三种格式作为稳定版本提供:

  • 这个蒙多-具有等效性版本直接在本体中使用OWL等价公理。请注意,这使得在某些门户中浏览变得更加困难,但对于计算用途来说,此版本可能更可取。owl版本还包括使用CL、Uberon、GO、HP、RO、NCBITaxon的公理化。
  • 这个.obo版本更简单,缺乏本体间公理化,缺乏与其他数据库的等价公理;相反,外部参照被用作链接机制。如果ID是Orphanet、OMIM、DOID或EFO中的一个,则外部参照会精确地隐藏等价公理。
  • 这个json版等同于OWL版本。

这个Mondo GitHub存储库可在此处获得:https://github.com/kinast-initiative/mondo.

贡献

最好的贡献方式是在GitHub跟踪器。有关我们的贡献者页面以及编辑器页面.

许可证

CC-BY 4.0版

联系人

如果您有兴趣接收有关发布的电子邮件更新,请联系君主倡议@gmail.com。