蒙多病本体论
蒙多疾病本体论(Mondo Disease Ontology)旨在协调世界各地的疾病定义。蒙多这个名字来自拉丁语单词“mundus”,意思是“为了世界”
关于
目前存在多种疾病定义和数据模型来源,其中包括高性能操作,OMIM公司,SNOMED CT公司,ICD公司,苯酚DB,医学名词,MedGen公司,ORDO(作战需求文件),执行,GARD公司等;然而,这些来源部分重叠,有时也会发生冲突,因此很难确定它们之间的关系。这导致不同资源中疾病条目之间的映射激增;然而,映射是有问题的:总的来说,创建和维护映射的成本很高。最重要的是,映射缺乏完整性、准确性和精确性;因此,资源之间的映射调用常常不一致。UMLS提供了中间概念,通过这些概念可以映射其他资源,但这些映射也面临着同样的挑战:它们不能保证是一对一的,尤其是在罕见病等疾病概念不断演变的地区。
为了解决缺乏一个统一的疾病术语来提供疾病概念之间的精确对等,我们创建了Mondo,它为统一多种疾病资源提供了一个基于逻辑的结构。
Mondo的发展与人类表型本体(HPO),描述构成疾病的个体表型特征。与HPO一样,Mondo提供了一个层次结构,可用于将疾病分类或“汇总”到更高级别的分组。它提供了到其他疾病资源的映射,但与本体之间的其他映射相比,我们使用严格的语义精确地注释每个映射,以便我们知道两个疾病名称或标识符何时相等或一对一,而不是简单地紧密相关。
有关更多详细信息,请参阅以下内容幻灯片.
摘要统计信息
所有Mondo概念的汇总统计
查看每个版本和统计信息:MONDO发布
版本:https://github.com/kinast-initiative/mondo/releases/tag/v2022-03-01
疾病术语特征 |
计数 |
术语总数 |
22,157 |
数据库交叉引用 |
104,479 |
术语定义 |
15,443 |
精确的同义词 |
66,247 |
相关同义词 |
30,661 |
窄(更具体)同义词 |
2,214 |
广义同义词 |
847 |
选定疾病类别的疾病概念统计
请注意,这些分组是重叠的。版本:https://github.com/kinast-initiative/mondo/releases/tag/v2022-03-01。
疾病类型 |
计数(概念) |
罕见病 |
10,443 |
传染病 |
1,240 |
癌症(包括肿瘤) |
4,298 |
孟德尔病 |
11,380 |
Mondo是如何创建的?
Mondo是一个半自动构建的本体,它在多个疾病资源中进行合并,以生成一个连贯的合并本体。参见来源在这里Mondo的原始版本是完全自动构建的,并使用源数据库和本体的ID。后来,添加了其他手动管理的跨本体公理,并使用了本地Mondo ID系统来避免与源数据库混淆。
Mondo的一个特点是它超越了松散的外部参照。它构建了与其他资源连接的精确1:1等价公理,并通过OWL推理进行了验证。这意味着可以安全地从OMIM、孤儿院、EFO、DOID(即NCIT)传播这些信息。
这些精确映射以三种格式作为稳定版本提供:
- 这个蒙多-具有等效性版本直接在本体中使用OWL等价公理。请注意,这使得在某些门户中浏览变得更加困难,但对于计算用途来说,此版本可能更可取。owl版本还包括使用CL、Uberon、GO、HP、RO、NCBITaxon的公理化。
- 这个.obo版本更简单,缺乏本体间公理化,缺乏与其他数据库的等价公理;相反,外部参照被用作链接机制。如果ID是Orphanet、OMIM、DOID或EFO中的一个,则外部参照会精确地隐藏等价公理。
- 这个json版等同于OWL版本。
这个Mondo GitHub存储库可在此处获得:https://github.com/kinast-initiative/mondo.
贡献
最好的贡献方式是在GitHub跟踪器。有关我们的贡献者页面以及编辑器页面.
许可证
CC-BY 4.0版
如果您有兴趣接收有关发布的电子邮件更新,请联系君主倡议@gmail.com。