跳到主要内容

整合解剖学本体中的部分分类层次

摘要

背景

解剖本体在开发集成生物信息学应用程序中发挥着越来越重要的作用。这些本体论中所表示的解剖组织之间的主要关系之一是部分由于有许多方法可以划分生物体的解剖结构,因此每种方法都可以用一个以上的有效部分(部分)层次来表示。这就提出了如何表示和集成多个这样的层次结构的问题。

结果

在本文中,我们描述了一个解决方案,该解决方案基于我们对小鼠胚胎发育解剖学本体的研究,这是爱丁堡小鼠地图集项目(EMAP)的一部分。本文描述了我们的方法的基本概念,并讨论了所建议解决方案的优点和局限性。为了进行评估,在Prolog中实现了一个原型。

结论

使用提议的名称集方法,不必标准化层次结构,只需就一组合适的基本组织术语及其含义达成一致,即可促进多个部分分类层次结构的集成。

背景

介绍

随着生物信息学的重点从基因序列分析转移到功能基因组学和蛋白质组学,在生物体特定组织的背景下描述基因功能的需要增加了。因此,除了为医学目的构建的解剖本体之外,例如GALEN[1],解剖描述现在通常用于注释各种遗传数据,例如基因表达。(人类和模型生物(例如小鼠)的此类本体列表,果蝇属斑马鱼和秀丽C,可在开放生物本体论网站上找到[2].

本体模型通常由概念和这些概念之间的关系组成。解剖学中的一个关键关系是部分.可以区分不同类型的部分,例如。结构部分功能部分每个解剖本体可以定义一个或多个这样的部分关系。

即使是对于单一类型的部分,也可能有不止一种正确的方法将生物体的解剖结构划分为部分和子部分。因此,任何生物体都可能存在多个有效的部分(partof)层次结构。这就提出了跨这些层次结构的互操作性问题:组织何时在一个层次结构中相等的到另一层次中的组织部分这些层次结构之间的关系?

一般来说,生物学家用组织的名字来指代组织,而计算机可以很容易地处理ID号。例如,名称“/embray/limp/forelum-bud/ectodem”用于描述小鼠胚胎肢体前肢芽的外胚层。虽然这个名称唯一地标识了组织,但它是通过在名称中编码特定的部分分类层次结构来实现的。当尝试使用多个层次结构时,这会导致问题。本文讨论了一种命名方案,该方案保留了组织名称的唯一标识属性,而不必将其限制在特定层次,从而更容易集成多个部分分类层次。

生物医学文献中有大量的工作讨论了血液学(部分关系)。例如,Rogers和Rector[]描述作为GALEN项目的一部分,他们在人体解剖学中建立部分关系模型的经验。数字解剖学家基础模型(FMA)的各个方面在[4]. 在中简要讨论了人体解剖三维模型中的部件[5]. 所有这些论文都区分了不同类型的部分关系。在爱丁堡老鼠地图集项目(EMAP)中可以找到仅使用一种类型的部分的解剖本体的示例。尽管EMAP也使用关系衍生来捕获与胚胎发育有关的细胞谱系信息,但其复杂性明显低于GALEN和FMA。这种复杂性的变化是常见的,并且通常反映了构建本体的不同目的。EMAP本体用于标记正在发育的小鼠胚胎的空间数据,特别是基因表达数据[6].

我们不知道以前有任何专门处理多部分解剖层次结构集成的工作。然而,本体对齐和集成通常是一个活跃的研究领域,并且已经产生了旨在帮助手动对齐本体以及自动化本体集成的工具。此类工具的示例包括OntoMorph[7],打开合并[8]和PROMPT工具套件[9]. 在尝试使用此类工具系统地合并GALEN和FMA方面,已经开展了一些工作,但结果相当有限[10,11]. 在本文中,我们并不是试图为本体集成问题寻求一个通用的解决方案,正如证据所表明的那样,这是很难实现的。相反,我们从具体的应用程序经验着手解决这个问题,并寻求为更有限的领域找到具体的解决方案。

本文的其余部分组织如下。下一节将介绍《爱丁堡老鼠地图集》,它构成了本文的基础。然后,讨论了多部分层次结构的问题。下一节介绍开发的名称集表示,然后讨论Prolog原型系统的实现。然后在讨论部分对提议的方法进行评估,然后给出我们的结论。

爱丁堡老鼠图集

爱丁堡小鼠图谱(EMAP)和基因表达(EMAGE)数据库项目[1216]开发了一个小鼠开发数字地图集,为空间参考生物数据提供了一个生物信息学框架。核心数据库包含小鼠胚胎在不同发育阶段的三维灰度重建、胚胎解剖的系统命名(解剖本体)以及胚胎模型的定义三维区域(域),这些区域将解剖映射到空间模型。通过3D域,用户可以从胚胎的空间表示导航到本体,反之亦然。数据来自就地基因表达数据库在空间上映射到图谱上,允许用户使用3D胚胎模型和/或本体作为参考查询基因表达模式。

根据泰勒对小鼠胚胎发育的描述[17],解剖本体论被组织成26个发展阶段,称为泰勒阶段(TS1-TS26)。每个阶段主要组织为结构部分树或partonomic层次结构。1显示了TS6处树的前3级。(图中所示的浏览器可在Mouse Atlas网站上在线使用[12].)

图1
图1

解剖浏览器鼠标图谱解剖浏览器的屏幕截图显示了发育阶段TS6的小鼠胚胎解剖的前三个层次。

树中节点的子节点表示的组织旨在不重叠的(排他性的)和完成,即他们描述全部不同母体组织的一部分。例如,在图1,滋养层由壁滋养层和极滋养层组成,它们是不同的彼此之间的只有营养外胚层在那个阶段的部分。尽管这适用于EMAP,但它不是建议方法的要求。(在本文中,术语“组织”是以一种非常通用的方式使用的,既指整体解剖结构,也指特定组织。)

每个组织都可以通过其全名.A型全名是n元组:(0,1,..., n个 ). 这个路径名组织的(0,1,...,n个-1). 组件名称为 n个 例如,给定纸巾名称(使用文件目录样式表示法):

/胚胎/鳃弓/第三弓/鳃袋/内胚层/背侧

其全名为:

(胚胎、鳃弓、第三弓、鳃囊、内胚层、背部)

其路径名为:

(胚胎、鳃弓、第三弓、鳃囊、内胚层)

其组件名称为:

背部的

虽然本体论涵盖了小鼠胚胎的所有部分,但可能没有一个节点表示特定的感兴趣组织。例如,没有一个单独的节点命名(胚胎、间充质、躯干间充质,近轴间充质和体节、菌核)。然而,有一种组织命名为(胚胎、间充质、躯干间充质,近轴间充质和体节),其子部分为体节05至体节20(体节05到体节20是该组织的一部分),每个组织都有一个子部分,其成分名为菌核。EMAP采用的方法是引入一个新的组织节点,称为,并确定适当的子部分。2图中显示了该示例的解剖图部分(在Theiler阶段14)。

图2
图2

在Theiler Stage 14中提取EMAP中的部分层次结构图示了在EMAP解剖层次中对所谓“组”节点(本例中为硬化节)的需要。

虽然添加了对于EMAP来说,它解决了部分层次结构的替代安排的需要,也提出了一些新的问题。例如,它需要一个合适的算法来确定新组应属于的适当组织。此外,应该设置一些限制,以限制可以添加哪些新链接;例如,如果一个新组包含其他组织的所有部分,那么应该将该组织本身而不是其所有部分链接到该组。换句话说,我们需要一种机制来防止生物学家不必要地添加过多的部分链接。让我们假设需要引入一个新的组,该组将腿作为其组成部分之一。在这种情况下,生物学家应该在新组和腿之间引入一个单一的连接部分,而不是在新组与臀部、膝盖、小腿和大腿(腿的组成部分)之间引入多个连接部分。这些是组的一部分这一事实应该从部分关系的及物性属性中推导出来。这些和其他考虑因素似乎代表了在同一解剖空间内尝试整合多个层次结构部分这一更普遍的问题。本文的其余部分描述了此问题的可能解决方案。

层次结构的多个部分

如前所述,构建生物体层次结构的解剖部分有多种方法。这些层次结构的交叉可能发生在任何级别;它们可以共享部分或全部叶节点,但也可以共享中间节点。一个特定的层次可能只涉及生物体的一部分,如大脑或心脏,而其他层次,如EMAP,则涵盖整个生物体。

我们在本文中使用的中心示例是体节。体节是动物背部的重复解剖结构。它们产生脊椎、骨骼肌肉、皮肤和其他结构。每个体节分为3部分:皮肌节、肌节和硬皮节。皮肤肌节是一组形成皮肤和肌肉组织真皮层的细胞。肌核是体节中充满液体的腔体,而硬骨切片形成椎骨。

大多数本体要求每个概念都由名称唯一标识。在解剖本体论的背景下,如EMAP,当想要指代体节18的硬化节时,仅仅使用硬化节这一名称显然是不够的。一般来说,组织的全名是必需的,但在某些情况下,其中一部分可能就足够了,例如,只有一种组织在Theiler 14期具有组件名称somite 18。

重点放在图中给出的解剖结构的体节部分2,我们可以绘制两个可能的层次结构,如图所示H1中的(体节,体节05,真皮肌节)和H2中的“体节,皮肤肌节05,体节5”在语义上明确表示同一小鼠胚胎组织,尽管使用了不同的名称。因此,当涉及到集成多个层次时,解剖本体在组织命名中体现其特定层次部分是没有帮助的。因此,建议通过使用名称集来识别特定组织来避免这个问题。

图3
图3

体节的替代层次本体体位部分的两种可能的层次结构,以及它们之间的关系。

结果

部分层次结构的名称集表示

基本名称集

部分层次中的每个组织都由从根到组织的路径上的组件名称集来标识(包括组织本身的组件名称)。例如,在H1中,体节5和20的皮肤肌节分别表示为{皮肤肌节,体节,体体节05}和{皮肤肌节,体节,体位20};在H2体节20的皮肤肌节表现为{皮肤肌节,体节,体位20}。使用NS(T)表示组织的名称集,两个组织之间的等效性通过其名称集的等效性来确定:

NS公司( ) =NS公司( j ) → = j

j 表示 j 作为直接子公司,并让 j 表示 j 作为子部分(直接或间接)1,即。   j ... k个 暗示 k个 ,则可以从名称集派生关系的一部分,如下所示:

NS公司( ) NS公司( j ) → j

j k个· k个 k个 j ) → j

第一行简单地说 j 作为子部分,如果第一个名称集是第二个名称集的适当子集。第二行说明 j 作为直接子部分(或儿童组织),如果 j 作为其子部分之一 他们自己也有 j 作为他们自己的子部分之一。在表示本体的图中,从 j 如果且仅当, j .

名称集表示并不显式处理时间关系。例如,必须明确捕捉发育中胚胎解剖结构的变化,即,如果某一特定子部分从一个发育阶段消失到下一个阶段,这应反映在后一阶段的本体论表示中缺少该子部分。此外,给定的表示并没有明确区分实例组织。例如,虽然一般认为腿有小腿部分,但在特定情况下可能不是这样。拟议代表不处理此类实例问题;当今生物信息学中使用的许多现有模型生物解剖本体也同样不表示实例级别的信息。

组织的休息

“修复”组织是指代表该组织的所有部分的组织,而不是那些在修复组织的“兄弟”中明确表示的组织。例如,胚胎间充质标记为1在图中4不包括第一鳃弓的间质(标记为)或胚胎的任何其他部分(图中未显示)。

图4
图4

名称集表示和层次结构的一部分选定组织的名称集表示在层次的一部分上下文中显示。

查看的名称集表示1(在图中4),我们看到了NS公司(1) NS公司(). 根据上述定义,1 跟随。然而,事实并非如此。换句话说,前面介绍的基本名称集表示法不足以处理剩余组织。

正负名称集

为了处理“排除项”,例如恢复纸巾所需的排除项,我们引入负名称集(NS公司 n个 )除了我们已有的名称集之外(我们将称之为正名称集(NS公司 第页 )从现在起)。一张纸巾 第页 在其负名称中包含任何“兄弟”组织的组件名称 ,如果 具有与相同组件名称的子部分 第页 例如,鳃弓被添加到1因为(摘自图4).

现在可以从组织的名称集表示中导出部分关系,如下所示:

NS公司 第页 ( ) NS公司 第页 ( j ) NS公司 n个 ( ) ∩NS公司 第页 ( j ) = j

j k个· k个 k个 j ) → j

第一行说明 j 作为子部分,如果 j ,和的正名称集的交集 j 和的负名称集 为空。添加了交集部分,以强制执行处理重新提交案件所需的排除。第二行的含义与之前相同。

返回图中的示例4,1现在表示为NS公司 第页 (1)={胚胎、肌酶}和NS公司 n个 (1)={鳃弓},表示为NS公司 第页 ()={第一弓、鳃弓、胚胎、间充质}和NS公司 n个 () = {}. NS公司 n个 (1) ∩NS公司 第页 ()={鳃弓},即非空,不是的子部分1,根据需要。

为了使排除能够正常工作,必须将否定名称集传播到其子部分,正如正名称集已经隐含的情况一样。因此,2(在图中4)也将包括鳃弓在其负面名称集,保持成为其子公司之一。

多部分层次结构的集成

假设两个或多个层次结构的一部分基于同一组组件名称,那么集成这些层次结构就成了一项微不足道的任务。不同层次组织之间的关系(身份和部分)直接遵循上述规则。例如,将这些规则应用于图中的层次结构,图形层次结构的集成部分5可以自动生成。

图5
图5

体节的合并本体将体节的两个可能层次合并而成的层次的一部分。

给定两个或多个层次的集成名称集表示,无法确定哪个组织属于哪个原始层次。例如,如果根据管理部分关系的规则,要求提供体节的直接子部分,则图中第二级的所有组织5将被退回。为了解决这个问题,需要捕获额外的信息。通过添加视图集每个组织。例如,体节的视图集将是{H1,H2},就像图中所有叶节点组织的视图集一样5中间组织节点的视图集为{H1}(左侧)或{H2}(右侧)。因此,重新创建一个原始层次结构只需要使用视图集过滤集成层次结构。除了重建原始层次结构外,还可以使用适当的名称集“查询”轻松创建集成层次结构上的新视图,甚至是原始层次结构上的新视图。

原型

在Prolog中实现了鼠标地图集解剖本体的名称集表示原型;我们为工作开发的原型的扩展小鼠胚胎解剖的形式化[6]. 这个原始原型包含以下两个谓词:

组织(S、T、FN)。

  • S: 阶段ID,例如用于泰勒阶段14的14;

  • T: 组织ID号(登录号);

  • FN:由列表[N1,N2,N3,…]表示的组织的全名;

hasPart(TID1、TID2)。

  • TID2是TID1的直接部分,即。TID公司1TID公司2;

为了评估名称集表示,我们使用组织谓词的扩展版本(原型描述中省略了视图处理以保持示例简单):

ext_tissue(S、T、FN、NSp、NSpL、NSn、NSnL)。

  • S、 T、FN:同上;

  • NSp:由列表[N1,N2,N3,…]表示的组织阳性名称集;

  • NSpL:NSp的长度;

  • NSn:由列表[N1,N2,N3,…]表示的组织的阴性名称集;

  • NSnL:NSn的长度;

例如,图中的胚胎间充质组织4表示为:

ext_tissue(14705,[“胚胎”,“间充质”],

[“胚胎”,“间充质”],2,

[“鳃弓”、“肢”、“器官系统”],3)。

以下Prolog子句用于确定 第页 c(c) 为真:

子部分(Tp,Tc):-

外部发行(Sp、Tp、_、NSpp、NSpLp、NSnp、_),

外部发布(Sp、Tc、_、NSpc、NSpLc、_和_),

NSpLc>NSpLp,

ord_subset(NSpp、NSpc),

ord_disjoint(NSpc、NSnp)。

Prolog库中的谓词ord_subset和ord_disjoint用于实现表示的集合论方面。尽管这些谓词支持有序集,但这对于我们的表示来说是不需要的(但库中没有无序集谓词)。NSpLc>NSpLp需要强制执行真子集关系。

以下两个Prolog子句用于确定 第页 c(c) 为真:

not_immediate_subPart(Tp,Tc):-

子部分(Tp,Tm),

子部分(Tm,Tc)。

immediate_subPart(Tp,Tc):-

子部分(Tp,Tc),

不是not_imediate_subPart(Tp,Tc)。

给定的Prolog实现并不是特别有效,可以进行一些优化。然而,由于原型的目的不是为最终用户提供一个健壮的应用程序,而是为评估目的提供拟议方法的参考实施,因此证明它已经足够了。

本文没有对所提出方法的不同实施策略的相对优点提出任何主张。Prolog的替代方案包括使用关系数据库系统或本体语言,例如OWL(W3C提供了OWL的更多详细信息[18]). 后者特别令人感兴趣,因为它在生物信息学领域得到了广泛接受。在这项工作开始时,使用OWL开发本体的工具仍处于早期阶段,因此,我们决定不使用它们。然而与此同时,Protege[19]和OilEd[20]已经足够成熟,并确实提供了适当的替代实现平台。

讨论

为了进行评估,对小鼠地图集解剖结构的名称集表示进行了一些测试。这里将讨论这些问题,以及对拟议方法的一些一般性意见。

必须坚持的第一个假设是,没有两个组织(在任何给定阶段)具有相同的名称集表示。这是使用测试的

测试1:-

ext_tissue(S,T1,_,NSp,_,NSn,_),

外部发布(S、T2、_、NSp、_、NS号、_),

T1不=T2。

test1返回no,即根据需要,没有找到具有相同名称集的两个不同组织。

为了测试是否可以从名称集表示中重建所有部分关系,我们使用了

测试2:-立即_子部分(T1,T2),无部分(T1,T2。

test3:-hasPart(T1,T2),而不是immediate_subPart(T1,T2)。

test2和test3都返回no,即名称集表示不会导致任何不需要的部分关系(test2),并且所有现有的部分关系都可以根据需要通过名称集(test3)找到。

部分层次集成的最小形式是添加新组织节点,这相当于添加在EMAP中。最近确定的一个群体的需求是在泰勒17期的所有组织(胚胎、间质、躯干间质、轴旁间质、体节、肌梭)。使用谓词

immediate_subPart_ns(S、NSp、NSn、T)。

  • S: 阶段ID;

  • NSp:新组织节点阳性名称集(组);

  • NSn:新组织节点(组)的阴性名称集;

  • T: 通过名称集和阶段识别的组织直接子部分的组织ID;

我们可以用以下形式编写“查询”:

immediate_subPart_ns(17,[“胚胎”,“间充质”,“心肌”,

“轴旁间质”,“体节”,“躯干间质”],[],T),组织(_,T,FN),

writeName(FN),nl,失败。

并得到以下结果:

(“胚胎”、“间充质”、“躯干间充质

(“胚胎”、“间充质”、“躯干间充质

...

(“胚胎”、“间充质”、“躯干间充质

类似地,使用谓词immediate_superPart_ns(),我们可以获得:

(“胚胎”、“间质”、“躯干间质”,“轴旁间质”和“体节”)

immediate_superPart_ns()与immediate _subPart_ns)类似,其Prolog实现也非常类似。因此,省略了细节。

创建EMAP的一位生物学家证实了这些结果的正确性。其他类似的测试也同样有效。然而,对所有这些情况的约束是,新组组织的名称集必须仅包含已在现有层次中使用的名称。

这就提出了如何处理引入新组件名称的问题。例如,无法自动添加组(胚胎、头部),因为现有层次结构在其名称集中不使用头部。为了使集成有效,首先需要将head添加到现有层次结构中的适当名称集。这可以在适当的最高级别上完成,因为子部分从其超部分继承所有名称集元素,因此可能不需要像最初预期的那样多的工作。

然而,对于头部示例,我们确实确定了两个额外的问题,这两个问题在这种情况下可能是典型的。首先,需要就新引入组织的组成部分达成一些协议。在我们的例子中:在解剖学上,有多少颈部被认为是头部的一部分?第二个问题涉及这样一个事实,即现有组织可能需要进一步分割,以获得新引入组织的适当子部分。例如,颈动脉从头部进入小鼠胚胎的身体,即只有一部分颈动脉实际上是头部的一部分。因此,颈动脉需要分为两个子部分,一部分用于头部,另一部分用于其余部分。在我们的名称集方法中,前者在其阳性名称集中包含头部,而后者在其阴性名称集中包含头。当然,只有头部部分成为头部的一部分。这两个问题都没有给我们的方法带来任何直接后果。

当合并不同粒度的本体时,与之前相同的原则适用:共享组件名称必须以一致的方式使用。假设本体论O(运行)1包括中脑作为大脑的一部分,但没有进一步的细节,以及O(运行)2是一种大脑解剖学本体论,将中脑分为脑导水管、底板、侧壁等,然后我们会发现{大脑、中枢神经系统、胚胎、中脑、小鼠、神经系统、器官系统}是年中脑的阳性名称集O(运行)1和{brain,cerebral aqueduct,midbrain}作为正面名称O(运行)2从而产生了{大脑、中枢神经系统、脑导水管、胚胎、中脑、小鼠、神经系统、器官系统}这两个名称集的结合,作为合并本体中中脑的表示。两个原始名称集{brain,midbrain}交叉处的组件名称的含义必须以一致的方式使用,以使合并生效,尽管由于粒度的不同,许多组件名称在本体中会有所不同,例如,术语神经系统和器官系统不太可能在脑特定本体中找到。(我们在本次讨论中省略了否定名称集,但其含义与肯定名称集的含义基本相同。)

仔细研究这些“基本组织术语”,称为组件名称到目前为止,显示其中一些具有额外的结构复杂性,如果希望利用这些复杂性的语义,则需要扩展所提出的名称集表示。例如,在泰勒18期,组织(胚胎、鳃弓、第一弓、下颌组件、间充质)有两个亚部分,称为(…,来自头部中胚层的间充质,…,来自神经嵴的间充液)。因此,命名反映了组织之间的谱系关系,组织的身份部分由这种关系建立。虽然可以对名称集表示进行扩展,以允许包含此类信息并对其进行后续推理,但这将导致名称集的语义过载,因此,为了简单起见,不需要进一步考虑-(组件)名称被视为描述组织的原子字符串,而沿袭关系是在名称集外部建模的。

理论上,通过系统地(自上而下)将每个组织从一个层次添加到另一个层次,可以实现两个层次的合并,即从概念上来说,问题可以简化为如上所述的迭代添加“组节点”。

本文中讨论的方法在没有就基本组件术语达成一致的情况下是行不通的,因此与现有的关于合并自治本体的工作不同。这就提出了两个问题:这些条款应该以什么为基础达成一致,以及如果在合并这些部分经济层次之前必须达成一致,那么从拟议的解决方案中可以获得什么好处。关于第一个问题,如果存在一个基本术语,例如皮肤,那么必须能够将小鼠解剖到将所有相应组织与其余小鼠组织分离的水平,例如,将所有皮肤组织与其余的小鼠组织分离。因此,基本术语的其他示例是头部、骨骼、肢体和前肢。此时,科学家可以自由地使用这些术语的组合(用于正负名称集)来描述他们感兴趣的解剖学概念,例如{head,skin}表示头部的皮肤。然后,可以使用本文提出的方法自动合并不同科学家创建的不同解剖层次。因此,为了回答上面的第二个问题,我们的解决方案的好处在于不需要多个科学家同意一个单一的解剖学分类法,其中定义了所有的组织概念,并对其进行了定义部分指定的关系。相反,它提供了一个更加灵活的解决方案,而不必牺牲用这些解剖概念注释的多个数据集之间的互操作性。

本质上,该解决方案基于结构部分关系的传递性。因此,可以想象实现不同于基于名称集的实现,以获得相同的结果。然而,基本思想是一样的。使用名称集概念可以让生物学家更直接地访问解决方案,他们比使用计算机生成的ID更熟悉命名解剖概念。我们认为,同样的方法可能适用于其他具有类似传递关系的本体领域,但由于我们还没有测试这个想法,因此我们将不在本文中详细阐述它。

此外,这里描述的工作只处理基于相同类型的部分关系。一些初步研究表明,如果存在不同的类型,并且这些类型是在is-a层次结构中组织的,那么所建议的集成机制仍将在通用类型部分的级别上工作。例如,假设H1是基于类型1的层次结构的一部分,假设H2是基于型号2的层次结构中的一部分。如果类型1的部分和类型2的部分都是更一般的类型0的部分的专门版本,即类型1的一部分是类型0的一部分,类型2的一部分则是类型0中的一部分。那么我们可以使用所建议的方法来集成H1和H2。然而,集成的层次结构只支持部分类型0语义。我们在这方面的工作仍处于早期阶段,超出了本文的范围。更多细节将在其他地方报告。

本文介绍的工作重点是在一个物种(小鼠)中整合不同的部分分类层次。我们注意到,在试图整合不同有机体的部分分类体系时,类似的方法可能很有用。然而,这是目前研究工作的主题,将另行报道。

结论

解剖本体在生物医学信息学中发挥着重要作用。在这种本体中建模的关键关系之一是部分然而,对于任何给定的有机体,有多种方法可以将其划分为多个部分和子部分,从而形成多个有效的部分分类体系。为了能够在利用这些解剖学本体的生物信息学资源之间进行互操作,必须以某种方式协调相应的层次结构。本文解决了组织的唯一识别名称通常反映其使用的部分分类层次的问题。尽管这些名称实际上是“成分名称”的有序集(表示特定层次结构的顺序),但这些集合中的顺序并不一定是唯一标识任何组织的必要条件。此外,名称中的组件集可用于派生层次结构中的所有部分关系。基于这些观察结果,我们开发了一种名称集表示法,它有助于集成不同的部分分类层次结构。虽然这并没有消除就一组合适的基本组织术语及其含义达成一致的要求,但它确实消除了对部分分类体系进行标准化的需要。提出的方法已经在爱丁堡老鼠地图集的解剖本体中进行了测试。出于评估目的,实现了Prolog原型。

注释

1 j 是一个直接子部分属于 ,如果 j 是的一部分 没有其他组织 k个 这样的话 j 是的一部分 k个 k个 是的一部分 .如果这种组织 k个 存在, j 是一个间接子部分属于 .

工具书类

  1. OpenGALEN公司[http://www.opengalen.org]

  2. 海外建筑运营管理局开放生物本体论[http://obo.sourceforge.net网站]

  3. 罗杰斯J,校长A:GALEN的零件和整体模型:经验和比较。 美国医学信息学协会秋季年会论文集2000, 714–718.

    谷歌学者 

  4. Noy F、Musen M、Mejino J、Rosse C:推动包络线:基于框架的人体解剖学表现的挑战。 技术代表SMI-2002–0925.pdf,斯坦福医学信息学2002

    谷歌学者 

  5. 舒伯特·R、霍恩·K:交互式可探索三维解剖模型的零件分类。 1998年AMIA年度研讨会论文集1998

    谷歌学者 

  6. 汉堡A、戴维森D、波尔多克R:小鼠胚胎解剖的形式化。 生物信息学2004,20:259–264. 10.1093/生物信息学/btg400

    第条 中国科学院 公共医学 谷歌学者 

  7. 查洛普斯基H:OntoMorph:符号知识的翻译系统。 知识表示和推理原理:第七届国际数据工程大会(ICDE'04)2004

    谷歌学者 

  8. Dou D、McDermott D、Qi P:通过本体合并和自动推理实现本体翻译。 在第13届知识工程和知识管理国际会议(EKAW2002)上,本体论研讨会2002

    谷歌学者 

  9. Noy NF,马萨诸塞州博物馆:PROMPT套件:用于本体合并和映射的交互式工具。 国际J Hum计算螺柱2003,59(6):983–1024. 10.1016/j.ijhcs.2003.08.002

    第条 谷歌学者 

  10. 莫克·P、伯恩斯坦·P:采用通用匹配算法对齐人体解剖学的本体。 第20届国际数据工程大会(ICDE'04)2004

    谷歌学者 

  11. Zhang S、Mork P、Bodenraider O:从调整两种解剖学表现中吸取的教训。 Proc First正式生物医学表征国际研讨会2004

    谷歌学者 

  12. 爱丁堡老鼠地图集项目[http://genex.hgu.mrc.ac.uk]

  13. Brune R、Bard J、Dubreuil C、Guest E、Hill W、Kaufman M、Stark M、Davidson D、Baldock R:胚胎第9天小鼠的三维模型。 求文献一篇1999,216(2):457–468. 2006年10月10日/dbio.1999.9500

    第条 中国科学院 公共医学 谷歌学者 

  14. Davidson D、Baldock R:超越序列的生物信息学:绘制胚胎中的基因功能。 Nat Rev基因2001,2:409–418. 10.1038/35076500

    第条 中国科学院 公共医学 谷歌学者 

  15. Davidson D、Bard J、Brune R、Burger A、Dubreuil C、Hill W、Kaufman M、Quinn J、Stark M、Baldock R:鼠标图谱和图形基因表达数据库。 精液细胞开发生物1997,8(5):509–517. 2006年10月10日/scdb.1997.0174

    第条 中国科学院 公共医学 谷歌学者 

  16. Ringwald M、Baldock R、Bard J、Kaufman M、Eppig J、Richardson J、Nadeau J、Davidson D:用于鼠标开发的数据库。 科学类1994,265:2033–2034.

    第条 中国科学院 公共医学 谷歌学者 

  17. 泰勒K:家鼠:胚胎发育图谱Springer Verlag;1989

     谷歌学者 

  18. W3C万维网联盟[网址:http://www.w3.org]

  19. Protege公司[http://protege.stanford.edu]

  20. OilEd公司[http://oild.man.ac.uk]

下载参考资料

作者信息

作者和附属机构

作者

通讯作者

与的通信阿尔伯特汉堡.

其他信息

作者的贡献

AB开发了名称集表示,实现了原型并进行了部分评估。YY就EMAP和EMAGE的当前实现提供了与提议的名称集表示相关的输入。DD执行了部分评估过程。RB为名称集表示的发展做出了贡献。DD和RB是EMAP和EMAGE的总体项目负责人。所有作者都为论文的撰写和/或修订做出了贡献。

作者提交的图像原始文件

权利和权限

转载和许可

关于本文

引用这篇文章

Burger,A.、Davidson,D.、Yang,Y。等。整合解剖学本体论中的部分分类层次。BMC生物信息学 5, 184 (2004). https://doi.org/10.1186/1471-2105-5-184

下载引文

  • 收到:

  • 认可的:

  • 出版:

  • DOI程序:https://doi.org/10.1186/1471-2105-5-184

关键词