跳到主要内容

通过OQuaRE中静态和动态缩放功能的组合支持本体演化过程的分析

摘要

背景

生物医学界现在已经发展了大量的本体论。生物医学本体的管理是一项复杂的任务,生物医学本体发展迅速,因此新版本经常在本体库中发布。这意味着在短时间内存在大量的本体版本。鉴于这种活动水平,本体设计者需要在生物医学本体进化的有效管理中得到支持,因为不同的变化可能会影响本体的工程和质量。这就是为什么需要有助于分析本体论变化和进化的影响的方法。

结果

在本文中,我们从本体质量的角度来处理这个问题。在之前的工作中,我们开发了一个基于定量度量的本体评估框架,称为OQuaRE。在这里,OQuaRE被用作一种方法的核心组件,该方法能够使用OQuaRE中包含的质量维度分析生物医学本体的不同版本。此外,我们描述并使用两种尺度来评估给定本体版本之间的变化。第一个是OQuaRE中使用的静态量表,第二个是新的动态量表,基于给定本体(生命周期)的所有版本定义的语料库质量度量的观察值。在这项工作中,我们解释了OQuaRE是如何被用来理解本体论的进化的。它的使用已经通过生物信息学操作本体、数据类型、格式和主题(EDAM)进行了说明。

结论

OQuaRE中包含的两个尺度提供了关于本体论进化的补充信息。静态尺度(原始OQuaRE尺度)在EDAM本体版本中的应用揭示了基于良好本体工程原理的设计。动态标尺的应用使我们能够更详细地分析本体的演化,通过不同版本之间的差异进行衡量。基于OQuaRE的变化统计质量分数从OQuaRE质量角度,可以识别本体工程中的某些更改触发更改的关键版本。在EDAM的情况下,当对连续版本对进行比较分析时,本研究让我们确定,本体的第五个版本对本体的质量度量具有最大的影响。

背景

近年来,生物医学界在本体论的发展方面加大了努力,这很可能会继续下去[1]. 本体开发人员倾向于在Web上发布他们的本体,并且可以从不同的来源进行访问。生物门户[2]例如,在编写时包含了500多个本体,并且经常发布新内容。BioPortal支持通过用户提交新版本进行更新,可通过web浏览器和web服务进行访问[2].

本体论的管理通常是一项复杂的任务,因为它们具有高度的活动性和快速的进化[]. 因此,本体的版本数量可能会快速增长。进化过程将本体的发展变成一个动态的过程。本体的每个不同版本都构成了这个过程的快照。版本分析由[4]其中,本体版本化被定义为通过创建和管理本体的不同变体来处理本体中的更改的能力,并指出了强调版本之间差异的重要性。稍后[5]声称本体的版本控制系统必须比较和显示结构更改,而不是文本表示或源文件中的更改。他们描述了一种版本比较算法,该算法可以在本体之间产生结构差异,并通过一个界面提供给用户进行分析[6]. 如中所述[7],本体中的版本化和进化之间没有区别,因为两者都说明了对本体中变更的管理。

如果我们从逻辑的角度来处理本体论的变化,那么这些变化通常是通过修改给定本体论的公理来实现的。这些修改可能意味着添加或删除类、属性、个人或约束,以及修改属性的特征、域和范围。这些数量和类型的变化是不同方法的输入,这些方法试图理解本体论的演变:

  • 布巴斯蒂斯[,8]通过考虑两个连续版本之间的5种主要本体更改,分析了生物医学本体的活动程度:向现有命名类(NC)添加或删除公理,NC补充道,NC使过时并编辑注释属性。

  • Copeland等人,2013年[9]关注断言和推断公理的变化,并考虑到本体中的推理能力[10].

  • 在[11]提出了一个web应用程序,它提供了一个交互式的、用户友好的界面来识别大型生命科学本体中的(un)稳定区域。使用了一种基于特定时间间隔内本体的几个后续版本之间的更改计算区域更改强度的方法。

认为跨不同版本对本体所做的更改应该对其质量产生影响是有道理的。此外,假设本体中的更改应该对该本体的质量产生积极影响也是合理的。在这种背景下,这项工作的主要贡献是从本体质量的角度研究本体的演化,因为据我们所知,这方面迄今为止尚未进行过大量研究。本体论中的质量分析在本体论评估社区中以不同的方式进行,例如在以下工作中:

  • Gangemi等人,2006年[12]将其视为基于本体描述的诊断任务,使用三类标准(结构、功能和可用性分析)。

  • 罗杰斯2006[13]提出了一种使用四个定性标准(哲学严谨性、本体论承诺、内容正确性和目的适合性)的方法。

  • Yao等人,2005年,Tartir和Arpinar,2007年[14,15]提出了评估本体中结构属性的指标。

  • Duque-Ramos等人,2011年[16]提出了OQuale,它采用软件质量评估的SQuaRE标准来定义定性和定量的本体质量框架。

我们的提案基于OQuaRE框架[16],这是一个定性和定量的本体质量框架。OQuaRE基于软件产品质量标准ISO/IEC 25000:2005(SQuaRE)[17]. SQuaRE的应用(1)为软件产品质量提供了一个全面的规范和评估模型;(2) 根据观察结果,使质量评估具有重现性和客观性;(3)允许使用一种通用语言来指定用户、开发人员和评估人员可以理解的用户需求。所有这些属性都是本体质量评估方法所需要的。本体论,被认为是一种特殊的信息对象或计算工件[18],具有一系列与面向对象设计共享的概念[19]. 例如,可以利用类、个体和属性的存在来调整面向对象编程度量以适应本体。这使我们相信SQuaRE的原则可以适用于本体论。因此,OQuaRE的主要目标是为本体质量评估提供一个客观、标准化的框架,适用于不同的本体评估场景,其中本体作为最终产品进行评估。为此,OQuaRE包含一个通用的缩放函数,该函数将度量值转换为质量分数。

在这项工作中,我们采用OQuaRE的目的是测量本体进化对其质量的影响。在[20],我们描述了OQuaRE如何用于评估生物信息学操作本体的不同版本、数据类型、格式和主题(EDAM)的质量[21]. 使用OQuaRE中定义的标准质量模型和指标,该方法能够检测不同版本EDAM的测量质量的变化。目前的工作是[20],介绍了方法的演变和进展。首先,我们进一步形式化了基于OQuaRE性能测量同一本体版本之间差异的方法。其次,我们利用这种形式化提出了一个更敏感的缩放函数,以便能够从质量度量的角度检测连续版本本体之间的微小差异。这将使OQuaRE具有两种不同的缩放功能;一个用于评估本体和最终产品,另一个用于评价给定本体的不同版本。后者用作反馈,以调整或定义静态标尺的新轮廓。第三,对OQuaRE中的变化与本体活动轮廓的关系进行了统计分析。OQuaRE框架的这种扩展将从质量角度更好地理解本体的演化,并有助于演示如何使用本体质量方法来研究本体演化。

方法

OQuaRE公司

OQuaRE改编自SQuaRE[17]. SQuaRE通过五个部门定义了软件产品评估的质量模型和过程:质量模型、质量测量、质量要求、质量评估和质量管理。第一,质量要求被识别。其次,使用质量模型,通过以下方式进行量化质量指标。这三个分区由质量评价部门,由质量管理部门。SQuaRE的使用需要定义这五个部分。OQuaRE定义了本体评估所需的所有元素:评估支持、评估过程和度量。OQuaRE使用SQuaRE提出的四个层次来构建本体的质量评估:质量需求、质量特征、子特征和度量。OQuaRE使用SQuaRE提出的六个质量特征来衡量质量:功能充分性、可靠性、可操作性、可维护性、兼容性和可转移性。此外,OQuaRE定义了一个新的特征“结构化”,它解释了本体结构的质量(见表1). 每个质量特征都有一组相关的质量子特征,这些子特征通过质量度量进行测量。质量度量是质量评估的度量单位。OQuaRE的当前版本有49个亚特征和14韵律学一些OQuaRE子特征被重用并改编自SQuaRE,但其他一些是特定于本体评估的。例如,功能充分性子特征是从中确定的本体的预期用途中提取的[22]. 遵循自下而上的方法,OQuaRE指标组合以组成子特征,并根据特征对子特征进行分组。桌子2分别描述14OQuaRE公司计算指标,以及一些指标如何与亚特征。为了简单起见,我们没有包括所有这些,但可以在[16,23].

表1我们方法中使用的OQuaRE特征和亚特征
表2 OQuaRE指标及其计算方法的简要说明
表3特征、次特征和相关指标之间的关联汇总

本体的评估包括通过质量模型.OQuaRE度量重用并调整来自本体评估和软件工程社区的一组众所周知的度量[14,22,24]. 质量指标在不同范围内提供定量值,称为原始质量指标值。OQuaRE应用SQuaRE中推荐的缩放方法,该方法分配[1,5](5级)范围内的值:

  • 1-“不可接受”

  • 2-“不可接受-需要改进”

  • 3-“最低可接受”

  • 4-“可接受”

  • 5-“超出要求”

假设用户想要评估本体需求“本体的多重继承”,这可能需要评估“结构”特征。该特征有9个子特征,但在本例中仅使用两个子特征(见图。1)为了简单起见,即“混乱”和“形式关系支持”。OQuaRE的可追溯性质量指标质量要求如图所示。1“Tangledness”取决于TMOnto度量,其值取决于具有1个以上直接祖先的类的平均数量,因此使用两个原始测量(类的数量和直接祖先的数量)来计算度量的原始值,在本例中为1.28。原始值转换为质量分数使用缩放函数。缩放方法(见表4)基于软件工程社区对软件度量和本体评估度量的建议和最佳实践。对于TMOnto,缩放函数将此值转换为质量分数5,因为原始值在范围[1,2]内。考虑到“Tangledness”只与TMOnto指标相关,这也是它的得分。如果一个子特征具有多个相关指标,则其得分为质量分数度量标准。在图中。1我们可以看到质量分数因为“形式关系支持”是2,所以“结构”特征的得分是3.5,即(5+2)/2。

图1
图1

OQuaRE示例,表示从OQuaRE质量需求到质量度量部门的可追溯性

表4具有[1-5]值的OQuaRE静态标度,其中1表示不可接受,3表示最低可接受,5表示超过要求

适应OQuaRE进行本体进化

定义

在本节中,我们从OQuaRE的角度定义了一系列与本体进化相关的概念。

定义1

本体的版本化语料库(v(v) C类 θ ):是版本列表{v(v) }相同本体的θ,其中表示v(v) 在里面v(v) C类 θ .

同一本体不同版本的比较突出了版本之间的变化和共性[5]. 可以使用不同性质的指标(实值指标、因子、有序因子等)进行比较。为了将它们全部包含在一个公共上下文中,该方法需要调整度量,因为它们需要满足定义中描述的约束2.

定义2

比较标准(如果 θ ):是一个离散化框架,对于每个版本v(v) v(v) C类 θ ,提供向量 可用于对这些版本进行排序的整数v(v) C类 θ .

向量的分量数 第页例如,如果我们使用TMOnto作为唯一比较准则,如果 θ 使用质量分数,范围[1,5]。此外,在这种情况下,这些整数与OQuaRE定义的不同定性级别相关,尽管可以使用不同的级别。然后,给出两个版本v(v) v(v) j个 ,如果如果 θ 分别得出5分和1分,这意味着v(v) j个 v(v) 类似地,剩余的13个指标可以添加到比较标准,这就是我们提出的一种分析本体论进化的方法。因此如果 θ v(v) 生成向量 共14个组件。向量的分量越多 有,比较和解释这些变化就越困难。出于这个原因,我们为用户提供了一些定义,其目的是描述不同类型的更改。因此,给定两个连续版本v(v) −1,v(v) v(v) C类 θ ,使用>1,并给定向量 −1 通过应用比较标准获得如果 θ ,版本规模发生变化v(v) 来自版本v(v) −1如定义3所述。

定义3

比例变化:与矢量分量不同值相关的变化矢量 关于 −1.矢量 ,计算公式为 −1,表示更改的大小和方向级别v(v) −1v(v) 版本,具有>1.

应该指出的是规模变化适用于本体的所有版本,但第一个版本除外,它对应于=1英寸v(v) C类 θ 自OQuaRE以来质量分数比较标准这个水平范围为[-4,4],因此方向可以是正的也可以是负的。例如,让我们假设v(v) C类 θ 包含六个元素v(v) 1, …,v(v) 6.应用如果 θ v(v) C类 θ 生成一个包含6行的矩阵,如表达式中所示1.该行表示向量 有14个组件=1,…,6.

$$\开始{aligned}&\quad\;1\quad\ldots\;\;\ldots\;\;\ldots\;\;\,\ldots\;\;14(r)\\开始{数组}{c}s{1}\\s{2}\\s_{3}\\s_a{4}\\s_A{5}\\s_0{6}\\end{array}&\左(开始{array}{lllll}5&\四线组4&\四线组2&\一线组1&\四\ldots&\四。&\\5&&quad 4&&quad 2&&quad 1&quad\ldots&&quad4&\四线组3&\四线组2&\四路组1&\四\ldots&\四。&\\3&\四四&\四五&\四一&\四边形\ldots&\四边形。&\\1&\四5&\四5&\四2&\四\ldots&\四。&\\5&\四1&\四4&\四3&\四点&\四。&\\\end{array}\right)\end{aligned}$$
(1)

在表达式中使用矩阵作为输入1我们应用定义3,得到一个有5行的矩阵,如表达式中所示2.该行表示矢量的比例变化 ,使用=2,…,6. 在以下背景下质量分数,中的负分量 表示相应的质量分数属于v(v) v(v) −1,正表示相反,0表示度量分数保持不变。

$$\开始{aligned}&\quad\;\;1\quad\;\ldots\quad\ldots\;\ldots\;\;\;\ldots\quad14(r)\\begin{array}{c}l{2}\\l{3}\\l_{4}\\l_1{5}\\l_a{6}\\end{arrai}&left(\begin{array}}{rrrrr}0&\quad 0&\quad 0&\ quad 0&\ quad 0&\ quad\ldots&\ quad-1&&quad-1&&quad 0&&quad 0&&quad\ldots&&quad-1&\四1&\四3&\四0&\四\四点&\四。&\\-1&\四0&\四0&\四1&\四\ldots&\四。&\\4&\四线组-4&\四线组-1&\四路组1&\四\ldots&\四。&\\\end{array}\right)\end{aligned}$$
(2)

我们建议使用第页指标和之间v(v) v(v) −1通过使用频率分布F类 与规模变化相关 ,其定义如下:

定义4

标尺中追逐的频率分布(F类 ):这是频率的有序列表如果 与不同的更改级别关联在向量中 .

变化级别介于 最小值 最大值 在OQuaRE的背景下质量分数, 最小值 最大值 分别为-4和4。因此,在这种情况下,频率分布F类 有9个分量,代表频率如果 级别的从-4到4。例如,表达式显示了我们运行示例的频率分布。解释F类 2是:共有4个第页在以下期间未发生任何规模变化的指标v(v) 1v(v) 2。两者之间的变化较大v(v) 2v(v) (F类 )因为有两个指标减少了一个等级,其他两个保持不变。

$$\开始{aligned}&\quad\,f_{-4}\;\,f{-3}\;\;f{-2}\;\;f_{-1}\;\;\,f{0}\quad\,f{1}\quad,f{2}\quad.,f{3}\quad\,f{4}\\begin{array}{c} F类_{2} \\F{3}\\F{4}\\F_{5}\\F}6}\结束{数组}和\左(开始{数组{lllllll}\quad 0&\quad 0&\ quad 0&\ quad 0&\ quad 4&\ quard 0&\ quad 0&\quard 0 0&\quad 0 \\quad 0 0&\ quaid 0&\Quard 0&\qid 2&\quaid 2&\ quade 0&\gaid 0&\ gaid 0 0&\\quad 0&\ quard 0&\ Quard 0&\gard 1&\ quare 1&\ quart 0&\ gard 0\\quard 0&\ Quard 0&\ Quard 1&\ Quaid 2&\ quadr 1&\quare 0&\0&&quad 0\\\quad 1&&quad 0&&quad 0&&quad 1&&quad 0&&quad 1&quad 0&&quad 0&&quad 0&&quad 1\end{array}\ right)\end{aligned}$$
(3)

因此,频率分布F类 可用于描述两个连续版本之间的不同类型的更改v(v) −1v(v) 关于OQuaRE集合质量分数接下来,我们定义一些相关的统计信息,如加权平均数。

定义5

正向平均变化:正变化水平的加权平均值,计算如下:

$$\frac{\sum_{1}^{l_{max}}l\次f_{l}}{\sum_{1}^{l_{max}}}f_{l}}$$

定义6

反向平均变化:负变化水平的加权平均值,计算如下:

$$\frac{\sum_{l_{min}}^{-1}l\次f_{l}}{\sum{l_}min}}^{-1{f_{1}}$$

为了避免向前或向后平均值可能存在未定义的值,我们还将向前和向后变化的大小定义为前面定义的分子,但要考虑绝对值||在后向均值变化中。现在,定义7提供了全球平均变化的定义。

定义7

平均变化:变化水平的加权平均值,计算如下:

$$\frac{\sum{l{min}}^{l{max}}l\times f_{l}}{\sum{l{min}}^{l_{max}f_{l}}$$

在我们的运行示例中,频率分布F类 没有为正向平均变化提供确定的有限值,而反向平均变化为-1,平均变化为-0.5。正向和反向更改的大小分别为0和2。

的值平均值变化可以解释为:

  • 当正向均值变化大于反向均值变化时,取正值;反之,取负值。

  • 当正向和反向平均值变化取相等且有限的值时,它变为零。

  • 如果v(v) v(v) −1都是相同的。在这种情况下,正向和反向平均值变化不采用确定的有限值(未定义的值)。

这个平均值变化提供有关中更改的信息质量分数为了分析无论变更方向如何,都已变更的指标数量,我们接下来定义了概念变化幅度.

定义8

变化幅度:尺度发生变化的指标百分比,计算如下:

$$\frac{\sum_{l\neq 0}f_{l}}{\sum_{l{min}}^{l{max}}f_{l}}$$

在我们的示例中变化幅度第个版本,共个版本v(v) 2是50%。发生更改的指标数量最多的是v(v) 6(请参见F类 6在表达式中),有一个变化幅度100%,但平均值变化为0.0。主要增加了质量分数发生在v(v) 4(请参见F类 4在表达式中)带有平均值变化0.75.

本体进化的动态缩放函数

我们建议利用v(v) C类 θ 导出动态缩放函数。为此,此类语料库中的每个本体都使用OQuaRE进行处理,因此计算14的原始值质量指标。这些原始值用于在中生成比例k个用k-means聚类确定类别[25]它通过最小化类内方差将相似值分组到同一类别中,并强调类别之间的差异,从而最大化类间方差。在本文中,类别的数量为k个=5,因为OQuaRE刻度为[1,5]。如图所示。2度量RROnto测量关系的丰富性,并使用对象和数据属性的平均使用次数除以subClassOf关系和对象属性。RROnto的标准刻度如表所示4.

图2
图2

RROnto度量的静态和动态刻度示例。x轴表示观察者的度量原始值vC公司。半透明矩形显示刻度级别的限制。当静态标度保持不变时,动态将取决于观察者在vC公司

为中的所有版本获取的RROnto原始值v(v) C类 θ 在图的x轴上表示。2静态标度表示在图的上部,使用k均值获得的动态标度表示在下部。而原始RROnto值0.74与质量分数静态标尺为4,动态标尺为5。应该指出的是,动态标度迫使数据被分类在1到5之间,1是在v(v) C类 θ 其中5个最高。如果不同数据的数量不足以生成5个类别,则算法不包括缩放函数的最低类别中的任何值(例如,参见图中DITOnto度量的实线。). 因此,动态量表的应用应帮助用户研究观察到的质量度量值在v(v) C类 θ .

图3
图3

版本中静态和动态缩放度量的图形表示

生物信息学操作本体、数据类型、格式和主题(EDAM)

我们将研究EDAM本体的演变[21,26]. EDAM是生物信息学中普遍存在的一个建立良好且熟悉的概念的本体。EDAM包括数据类型、数据标识符、数据格式、操作和主题。我们选择此本体作为示例,因为:

  • 它有很好的文档记录,其开发人员使用控制版本系统(CVS)[27]这样我们就可以追踪变化。

  • 它的源文件可以在线访问。最新版本(v1.9)发布在官方项目网页上。可以在BioPortal(18个版本)和CVS(13个版本)中找到旧版本的链接。

  • 自2013年10月至2014年4月,该项目每月平均接待900人次,有6个申报项目使用EDAM。

  • 版本的数量(18)使其成为研究其进化的感兴趣的本体。它的大小(平均值为2597类)是中等的,这有助于在该方法的首次应用中分析结果。

结果和讨论

实验装置

版本化语料库由BioPortal中的18个EDAM版本组成,作为CVS内容,使用内部开发的实现OQuaRE框架的软件工具进行处理。该框架和工具可在http://sele.inf.um.es/oquare作为web表单和web服务。该框架使用OWL API[28]和Neo4j[29]用于计算OQuaRE指标。我们使用函数进行了动态缩放的计算箱.var包的Rcmdr杂项属于R(右)[30].

我们对18个版本应用了归一化过程。在规范化过程中,我们删除了弃用的类并检查了本体的一致性。在应用归一化之前,该工具丢弃了18个版本中的4个版本:一个版本无法由OWL API处理,另外三个版本被推理人Hermit发现不一致[31]. 因此,版本化的语料库包含14个本体。在本文的其余部分中,我们根据每个版本的原始id版本标记每个版本。应该指出的是,某一版本的变化统计v(v) 根据先前处理的版本进行计算。例如改变在里面v(v) 16是根据v(v) 12因为v(v) 13,v(v) 14v(v) 15无法处理。

标准化过程保持一致v(v) 13v(v) 14因此,他们被纳入研究。我们决定进行两种类型的实验:一种是使用弃用的类(14个一致的本体),另一种是不使用弃用类(16个一致本体),目的是研究过时类对本体结构的影响。我们应用该工具获得了所有版本的度量、子特征和特征的分数。这些测量是比较标准,这允许通过使用静态缩放函数和动态缩放函数来获得分数。在展示这些结果后,我们将从以下方面讨论EDAM的演变质量分数并分析了两种缩放方法的优缺点。整套结果可在http://miuras.inf.um.es/oquare/jbsm2016.

用静态天平分析质量特性

5显示了在质量特征水平上获得的结果。两个质量分数显示了每个质量特征:原始(org)和归一化(nrm)。粗体数字突出显示规模变化接下来,我们讨论在质量特征中观察到的变化。

表5 18个EDAM本体版本的OQuaRE特征度量值

我们可以在表中观察到5意思是质量分数范围从第一个版本的3.99到最后一个版本的3.85,因此质量分数一直保持在3到4之间。A类质量分数大于3表明EDAM开发人员已经应用了良好的本体工程原理。然而,这种差异并没有产生规模变化在全球范围内。尽管如此,调查为什么质量分数减少是相关的,因为较低的OQuaRE级别为用户提供了更精细的信息。例如,在构建或修改大型复杂本体的过程中做出的决策可能会在其工程中产生附带影响,从质量角度来看,这可能会有不同的含义。例如,减少属性的使用可能有助于本体的可维护性,但可能需要更少的查询。因此,与属性使用相关的OQuaRE度量值越低,对本体的“可维护性”越有利,但对“形式关系支持”越不利。如果我们只使用平均值,就很难理解不同的变化如何影响不同的质量方面质量分数这就是为什么建议在特征、次特征甚至指标级别进行分析。

首先,我们描述了哪些特征规模变化.分析质量分数对特征的分析(在第一个版本和最后一个版本之间)表明,7个质量特征中有6个在量表上发生了变化:4个是阳性,2个是阴性。在剩下的案例中,没有规模变化“功能充分性”。“可靠性”特征的得分从3分降至2分v(v) 2; “结构性”的从4英寸减少到3英寸v(v) 11年,“可操作性”、“兼容性”、“可维护性”和“可转移性”得分从3级增加到4级v(v) 5此外,自那时以来,本体一直将分数保持在这个水平。这种行为发生在所有相关的子特征上。整套子特征的得分可在http://miuras.inf.um.es/oquare/jbsm2016.

用静态量表分析质量指标

接下来,我们描述在OQuaRE指标因为这使我们能够专注于具体的结构变化,这可以帮助我们讨论和解释在更高层次上获得的变化。(虚线)显示质量分数14 OQuaRE指标的静态规模。可以观察到,任何版本的9个OQuaRE指标都没有改变。已更改的5个指标是LCOMOnto、NOMOnto、RFCOnto、TMOnto和RROnto。接下来,我们将在OQuaRE特征和子特征的层次上讨论这些指标的变化所产生的影响。

  • RROnto有3个规模变化前两个变化是连续的,这是由于使用了属性,这两个变化之间减少了86%v(v) 4v(v) 6。重构一组公共属性通常是良好的本体工程实践的标志,但使用情况衡量属性通过公理与实体链接的次数。例如,当v(v) 4定义了16个属性,有6734种用法,v(v) 5v(v) 6定义相同数量的属性,但分别使用1979和937种用法。房地产的使用量在v(v) 10v(v) 11这一变化比前一个变化小,但加上关系数量的异常增加(18%),引发了规模变化RROnto的。这种关系数量的增加是由于v(v) 11:已弃用的类在第一分类级别被分组为本体类的后代,这增加了关系的数量。

  • RFCOnto和NOMOnto有1个规模变化从4英寸增长到5英寸v(v) 4这种行为也与属性的使用有关。然而,对于这些度量,这种原始度量对质量分数因为,在NOMOnto的情况下,每个类的平均属性使用次数越低,本体的可维护性就越容易。这种行为引发了中特征“可操作性”、“兼容性”和“可转移性”的规模变化v(v) 5.

  • TMOnto测量本体中父对象的分布。10%的班级有一位以上的直系家长v(v) 4年,该值增长至24%v(v) 5。由于多重继承,此度量在整个本体中具有负面影响,尽管这可能需要反映本体中的某些方面。这一事实影响了“纠结性”亚特征的减少,也导致了“结构性”特征的减少。然而,对于这一指标,这一变化本身并没有引发规模的变化,这是在年产生的v(v) 11在RROnto的合作下。

  • LCOMOnto在其计算中使用本体中的路径数,但遇到了一个规模变化在里面v(v) 2此度量用于子特征“内聚”、“知识重用”、“可学习性”、“恢复性”和“可用性”。此外,该指标是唯一用于衡量“内聚性”和“可用性”的指标,因此它对这两个亚特征的影响比其他亚特征更大。一方面,“结构性”特征的最低分数是“内聚性”,但这并没有引起v(v) 2另一方面,“可恢复性”和“可用性”按“可靠性”特征分组,因此,LCOMOnto度量的行为触发了规模变化在里面v(v) 2.

弃用类的影响

弃用类的出现率从3.51%增长(v(v) 1)至29.58%(v(v) 18). 弃用的类导致了中的不一致v(v) 13v(v) 14.表5显示了在特征级别上,带有(Org)和不带弃用类(Nrm)的本体之间没有显著变化,但在度量级别上发生了一些变化。弃用类的结构特征变化预计RROnto将下降至v(v) 11,而它发生在v(v) 17在标准化版本中。此外,LCOMOnto在v(v) 8v(v) 13在标准化版本中。这种对LCOMOnto的影响在具有弃用类的本体中是无法理解的。弃用的类仍保留在本体中,因此它们会影响OQuaRE结果。例如,RROnto使用subClassOf分母中的关系,不推荐使用的类(参见表2)贡献。删除弃用的类会影响此度量,从而产生预期或延迟的效果规模变化此外,缩放函数缓冲了LCOMOnto产生的较小变化。

动态天平的应用

我们已经使用构成实验的EDAM本体版本获得了一个动态尺度v(v) C类 θ 应用k均值聚类后获得的值如表所示6此外,图。显示了静态(虚线)和动态刻度(实线)的度量值的演变。可以看出,动态标尺比静态标尺能够捕捉到这些值的更多变化。这是一个预期的结果,因为每个度量的[1,5]尺度限制都是从不同版本本体的度量的原始值中导出的。这意味着这两种尺度反映了不同的方面,因此,在帮助理解工程和本体的演化方面是互补的。接下来,我们将讨论如何通过两种尺度检测变化。

表6使用实验中EDAM版本应用k-means算法后获得的动态标尺坐标虚拟计算机

两种量表都检测到一些指标的变化。在RROnto的情况下,尽管第一个版本的静态标尺从4开始,动态标尺从5开始,但这两个标尺都检测到相同版本对之间的变化,除了v(v) 17然而,RFCOnto、TMOnto、NOMOnto或LCOMOnto没有出现这种情况。动态标尺更为敏感,因此它检测到这4个特征在成对版本之间的更多变化。静态量表没有检测到九个指标的变化,但动态量表检测到了。例如,虽然DITOnto值在静态比例中保持为1,但在动态比例中,它从5开始,到4结束。此外,它减少到2英寸v(v) 7.

DITOnto的值保持为1,EDAM本体的所有版本都具有静态比例。DITON度量本体的深度。我们的语料库获得的原始值为(11、11、11,11、13、13、14、13、十三、十三、十二、十二)。它们都大于8,按比例缩放为质量分数1,根据应用的最佳实践。然而,在本体论领域中,DITOnto的适当值可能取决于许多因素,正是在这里动态尺度可以补充静态尺度。根据[32]结构良好的OO系统有一个类森林,而不是一个大型继承格。然而,在为手头的任务确定最佳方法时,仍然必须判断指标的值是高还是低,以获得更好的代码质量。根据[32],DITOn越低越好,因此OQuaRE缩放方法将DITOn的“低值”匹配为5,将“高值”匹配到1。然后,动态量表使用对本体版本观察到的最低和最高值分别分配分数5和1。用这个刻度,最高的质量分数来自v(v) 1-v(v) 4,然后它从v(v) 4v(v) 5和再次从v(v) 6-v(v) 7,然后它保持稳定,直到v(v) 12,再次提高了一个级别。如前所述,应该指出的是,DITOnto的动态缩放方法没有跨越范围[1…5],因为只观察到4个原始值。

版本间主要变更分析

频率分布的图形表示F类 如图所示。4图的左半部分显示了频率分布F类 用静态标尺获得,右边是用动态标尺获得的。对于每个框,y轴表示级别中的组件 最小值 最大值 ; 应该指出,该图仅表示y轴上具有至少一个观测频率的分量如果 中的任何版本都不同于0v(v) C类 θ ). 最后,x轴表示每个分量的频率。例如,对于静态比例和v(v) 8(F类 =8)频率 0是13,因为13个指标的值没有规模变化与前一版本相关;类似地,使用动态刻度和v(v) 2(F类 2)频率 −1是1,因为1度量(LCOMOnto)降低了一个级别。

图4
图4

尺度变化的频率分布

现在我们描述如何使用量级平均值变化分析连续版本之间的主要变化。这将通过讨论表中显示的数据来完成7,其中第2-5行显示了使用静态刻度的四个变化统计值,第6-9行显示了动态刻度的这些统计值。

表7静态和动态刻度统计:变化幅度,向前平均变化,向后均值变化、和平均变化

变化幅度分析

这个变化幅度的静态刻度不同于0v(v) 2,v(v) 5,v(v) 6v(v) 11(见表7第2行)。例如,最大的量级的更改v(v) 528%,这是RFCOnto、NOMOnto、TMOnto和RROnto变化的结果;OQuaRE中的这些变化质量指标可以在图中观察到。(虚线)。对于v(v) 2,v(v) 6v(v) 11,的变化幅度是7%,因为只有一个指标的级别发生了变化。没有更改质量分数对于其余版本。这个变化幅度13个版本中有11个版本的动态范围不同于0。这是动态天平灵敏度较高的结果。此刻度可以识别以下版本v(v) v(v) 18与前一个非常相似,因为量级平均值变化分别为0%和0.00。我们的意思是,它们之间没有足够的变化来产生规模变化任何OQuaRE指标。

为了分析成对的连续版本,我们将使用中值(M(M) 电子 )14个指标值之间的绝对差异,以及用于对比替代假设的Wilcoxon检验M(M) 电子 >0.表格8通过增加临界值和第页-与零假设相关的值(M(M) 电子 =0)。这些结果表明:

  • 我们拒绝无效假设(M(M) 电子 =0),因此我们可以解释所有变化都是显著的。

    表8从低到高临界值和第页-与零假设相关的值M(M) 电子 在使用14个OQuaRE指标的中位数和连续版本对的绝对值差异进行Wilcoxon检验后
  • 我们已经评估了变化幅度使用质量分数(缩放指标)。临界值显示差异中值的大小(M(M) 电子 )显著高于0.05水平。使用此标准对版本之间的更改进行排序,我们得到最大更改发生在v(v) 5.

  • 根据该分析,变化最大的四个版本也是变化最大的4个版本变化幅度对于动态比例,如表所示7“幅度”行。这表明了动态缩放函数中使用的标准的优点。

平均变化分析

这个平均值变化使用静态量表是负数,因为一个指标的分数减少了v(v) 2,v(v) 6v(v) 11(见表7第6行)。然而变化幅度经历了不同的演变。最大的量级发生于v(v) 5,但平均变化v(v) 5为0.0,因为正加权变化的数量等于负加权变化的数目。对于这种特殊情况,两个指标增加了1级(RFCOnto和NOMOnto)和2级(TMOnto和RROnto)(参见图中的虚线)。). 动态标尺的灵敏度也较高平均值变化值,因为检测到更多更改。例如,如果我们专注于v(v) 5,无论改变了多少指标,“平均值返回”(1.67)都高于“平均值For”(1.25)。因此,“平均值”为-0.71,因此负面变化多于正面变化。

作为补充向后的正向平均变化量如图所示。5。此图的上半部(“前向尺寸”)代表正向变化,而下半部(”后向尺寸“)代表负向变化。版本发生了最大的积极变化v(v) 16最大的负面影响是v(v) 5.

图5
图5

静态和动态天平的尺寸统计:正向平均变化量后向平均变化大小

变更概况质量分数

无论使用何种比例平均值变化可用于计算基于OQuaRE框架的质量配置文件。此配置文件考虑了累计平均值变化在本体的整个生命周期中。6显示了质量分数使用两种刻度:

  • 静态标尺的使用显示出负面趋势平均值变化.累计平均值变化所有版本和所有对的值都保持为负值,这也反映在质量分数特征的平均值为3.99到3.85,这在前面已经讨论过。

    图6
    图6

    累加的图形表示平均值变化使用静态和动态刻度

  • 动态尺度的互补使用允许观察不同的演变。前7个版本的平均变化为负值,而接下来的9个版本为正值。因此,累积平均变化从-1,35增长到1,63。最后,其下降至1.49v(v) 17并保持不变v(v) 18.

最后,如果我们考虑到用于定义BioPortal中每个版本的状态:它们被视为从版本1到版本10的beta版。使用动态标尺,我们观察到质量分数减少到v(v) 7,尤其是v(v) 5用最低的平均值变化(参见图。6). 在测试阶段进行这样的更改是有意义的。一旦考虑发布本体质量分数超过了平均值。

本体中质量分数和活动水平之间的关系

到目前为止,我们已经分析了与质量分数现在,我们研究这些变化与本体中活动水平之间的可能关系。这个活动水平已在中测量[]根据本体类的变化,即添加、删除或修改的类的数量。这三个变量由Bubastis计算[8],所以我们称之为Bubastis变量.

http://miuras.info.um.es/oquare/jbsm2016,可以找到几个主成分分析(PCA)研究。在这里,我们使用与平均值变化(使用动态刻度)和Bubastis变量用于执行主成分分析,目的是获取这两个不同本体方面之间的关系,以及获取两个版本之间变化的二维表示。

新轴的变量坐标如表所示9,它们以图形方式表示在图。7上半部。图的变量表示。7表明存在两个标准化的不相关因素:

  • 这个Bubastis变量与因子1(以x轴表示)具有最大的正相关性(对于“新”、“更改”和“删除”类别,分别为0.88、0.80和0.85),因此我们将该因子解释为表示与Bubastis活动相关的活动量增加的梯度。我们称之为这个因素Bubastis活动.

    图7
    图7

    主成分分析:因子和主成分图

    表9新轴变量坐标的二维表示
  • 动态平均值变化与因子2(以y轴表示)的正相关最大(0.92),而动态向后大小与该因子的负相关。这些事实使我们能够将第二个因素解释为OQuaRE下限的梯度质量分数到更高的。我们称之为这个因素OQuaRE动态质量.

根据之前的评论,第一对角线中表示的版本在活动和质量上都是相关的,它们离原点越远。

前两个因素解释了表中六个变量中80%以上的信息9; 第一个因素解释了大约48%的此类信息。除了这两个因素外,图。7我们还使用皮尔逊检验观察了下一个相关性:(1)删除类和新类的数量(0.99,第页-值0.0000);以及(2)动态平均变化几乎与新的(-0.01,第页-值0.9650)和删除的类(0.07,第页-值0.8137)和(3)动态转发大小几乎与更改类的数量无关(0.01,第页-值0.9808)。那些配对第页-数值低于0.05表明存在显著相关性。

7底部表示我们的v(v) C类 θ ,其中可以突出显示四个更改:

  • 这个布巴斯蒂斯放射性属于v(v) 16低于平均值。然而,这项活动使用动态量表使OQuaRE质量分数显著增加。

  • 这个布巴斯蒂斯放射性属于v(v) 10v(v) 11与其他版本相比异常高。此外,使用动态量表的OQuaRE质量分数高于平均值。

  • 这个布巴斯蒂斯放射性属于v(v) 5超过了平均值,使用动态量表降低了OQuaRE质量分数,改变的班级数量也很高。

  • 这个布巴斯蒂斯放射性属于v(v) 18是OQuaRE质量分数中使用动态量表的最低值,接近平均值。

此表示法获得的最相关变化与图中所示的平均变化统计获得的变化相同。5,其中v(v) 5v(v) 16后向和前向尺寸值分别最高。

EDAM本体论的演进

在本节中,我们将讨论如何应用我们的方法来深入了解EDAM本体及其在以下方面的演变质量分数以及使用静态或动态天平的好处。

如果我们从OQuaRE的角度分析EDAM本体的质量,我们可以识别不同的优势和缺陷,从而将我们的注意力转移到这些方面质量分数为分析的最新版本获取v(v) 18(见表5). 根据OQuaRE静态量表,平均值3.85表明应用了良好的本体工程原理。对特征和子特征的分析为我们提供了更多的信息。接下来,我们对得分最高和最低的结果进行评论:可维护性、功能充分性和可靠性(分别为4.23、4.11和2.75)。

  • 最高的质量分数可维护性(4.23)。所有相关的亚特征都有质量分数大于4(参见http://miuras.inf.um.es/oquare/jbsm2016). 这揭示了EDAM的一些优势,例如由于本体的变化而降低的负面副作用率(修改稳定性4.60),以及验证本体并检测其缺陷的可能性(可测试性4.00)。

  • 第二高质量分数适用于功能充分性(4.11)。例如,EDAM很适合用作受控词汇表,以避免术语的异构性,因为它们的所有类都有用自然语言表示的标签。然而,并不是所有的亚特征都能获得高分。例如,EDAM的一个弱点是通过推理子特征的得分来阐明的。尽管它是使用形式语言定义的,但由于属性的使用率较低,因此其得分为1.0。缺乏实例也促成了这一得分。

  • 可靠性得分最低(2.75),其次特征是可恢复性(2.50)和可用性(3.00)。可恢复性得分低于3,因此可以将其视为EDAM的一个弱点,因为在本体内容不一致、不完整或冗余的情况下,很难重新建立本体并恢复本体的性能。

只有另一个具有质量分数3分以下为形式关系支持,得分为1分。形式关系支持度量本体表示不同于分类法的形式理论支持的关系的能力。这是通过分析属性的使用情况(RROnto)来计算的。如前几节所示,RROnto在最新版本中的得分为1,而第一个版本的值为4,这使得它成为最新版本本体的潜在弱点。之前关于RROnto的讨论来自不同版本的比较,因此是从进化的角度进行的。继续从OQuaRE的角度分析EDAM本体的演变,我们可以得出以下结论:

  • v(v) 5,v(v) 2,v(v) 7v(v) 11是最高的版本吗变化幅度即,有更改的度量数。使用静态量表对特征进行的分析表明,平均而言,没有规模变化在EDAM本体中。这也可以从累积的负趋势中观察到平均值变化使用静态标尺时(表6). 有趣的是,动态尺度揭示了以下观察结果:平均变化趋势是积极的v(v) 7v(v) 18.

  • 在特征层次上,静态尺度在EDAM本体中的应用表明,本体的演化对四个特征产生了较高的质量分数,对其中两个特征产生的质量分数较低,如表所示1.

  • OQuaRE指标级别的变化分析有助于我们确定属性的使用是导致质量分数之间v(v) 4-v(v) 6,再次介于v(v) 10v(v) 11此外v(v) 11触发了规模的变化。应该指出,应用我们的方法可以得出这些类型的建议。

关于方法的讨论

在前面的章节中,我们描述了我们工作的主要结果,并对该方法在EDAM中的应用进行了一些讨论。接下来,我们对该方法的不同方面进行了一些讨论。

在我们之前的工作中,OQuaRE使用的标准静态缩放函数的应用证明了其在检测本体的强度和缺陷,甚至检测同一本体版本之间的更改方面的有用性。然而,我们相信,使用更精确和敏感的方法来检测变化将使OQuaRE能够更好地支持本体进化过程。这就是为什么我们提出了动态缩放函数,它应该与静态缩放函数一起使用,因为它们提供了补充信息。因此,这并不意味着静态缩放函数不能单独用于本体进化。它可以用于测量不同版本在其历史中是如何变化的,并考虑到固定的标准。例如,这里我们使用静态函数评估EDAM,将从工程角度评估本体的当前配置作为参考。这种静态缩放方法使用户能够使用一个通用框架来度量本体的质量,但是,当然,如果上下文被明确标识,那么这个框架可以扩展或适合特定的上下文。然而,动态缩放功能应该为经常发布新版本的本体提供更有用的信息,或者为那些不构成与之前版本相比的主要更改的本体提供更多信息。

开发一个可用于这些不同需求场景的通用参考框架是一项具有挑战性的任务。一个悬而未决的问题是,是否可以普遍设置静态缩放方法的范围。动态缩放功能试图通过基于本体在进化过程中的行为进行评估来克服这种不确定性。应该指出动态刻度不是取代或替代静态的。事实上,动态函数并没有使用连续函数离散化度量的原始值,而是对观测值设置了限制(参见图。2). 然而,动态缩放结果可用于根据重新调整的静态缩放定义新轮廓。

作为未来的工作,我们建议使用本实验中获得的经验教训来分析更大的本体集。根据我们的经验,就本体论的某些方面达成社区协议并不总是一件容易的任务,例如生物医学本体论在多大程度上需要公理丰富性[33]. 一方面,那些用作简单的普通分类法或受控词汇表的生物医学本体不需要复杂的公理化。另一方面,那些用作领域本体的生物医学本体应该尽可能严格和公理丰富。

这场争论也与OQuaRE质量模型有关。例如,度量NOMOnto的静态缩放(见表4)可以被解释为倾向于更简单的分类法而不是高度公理化的本体,因为公理化程度较低的本体不难获得较高的质量分数对于NOMOnto。另一个例子是,没有实例的本体在某些指标上得分较低,但有时实例的缺失是此类本体的设计标准。在这种情况下,不应应用考虑实例的指标,或认为这些指标不相关。我们目前正在致力于启用OQuARE配置文件,这将允许用户或用户社区自定义OQuARE指标、子特征和特征之间的关联。未来的OQuaRE用户将能够包括新的指标或定义缩放功能。新的指标必须与当前的子特征相关联。此解决方案对有特殊需求的用户和社区非常有用。

我们认为可以扩展动态规模的概念,并通过使用类似Bioportal的存储库来获得基于存储库的规模[2]或AberOWL[34]作为参考。基于存储库的缩放是应用本文提出的动态缩放方法的结果,但考虑到v(v) C类 θ 哪里θ表示存储库中的本体和版本。这种基于存储库的缩放将为用户提供一些反馈,以根据大量现有本体确定静态缩放函数的范围。然而,对于某些本体来说,使用包含数百或数千个版本的大型存储库可能是一项挑战。我们计划使用“滑动窗口”方法,包括本体的最后10-20个版本,或者x个覆盖本体的整个生命周期并在一段时间内将它们平均分开的版本。这种具有代表性的版本示例将用于创建动态缩放函数。最后,引入新的无监督聚类算法,自动确定质量分数基于原始数据的每个度量也将在我们的未来工作中进行。

结论

我们开发了一种将版本分析与本体质量评估框架相结合的方法。本文的主要目的是研究OQuaRE框架如何从本体质量的角度,通过告知、,关于在不同版本的本体中观察到的变化。

这项工作中提出的两个缩放函数应该联合使用,以便更好地理解本体的工程和进化。当需要从工程角度检查和评估本体的单个版本时,或者当连续版本之间存在显著差异时,静态尺度更有用。然而,当一个本体的不同版本不太明显并且我们的目标是面向进化的研究时,动态尺度能够提供更多的信息。如果我们假设标度函数使值正常化,而不考虑使用的标度类型,则可以按照本工作中的方法将值分组并与变化幅度平均值变化版本之间。应该注意的是,根据本体的内容如何符合本体所代表的领域来判断本体的演变超出了本工作的范围。这将是基于实现的补充方法的主要目标[35,36].

该方法在EDAM中的应用表明,在其开发中应用了良好的本体工程原理。分析质量分数在次特征和度量级别上,都显示了OQuaRE框架识别本体的弱点和优点的能力。OQuaRE度量能够识别不同版本本体的工程中的更改。本体开发人员的设计决策已经产生了18个版本的EDAM本体,我们已经能够从OQuaRE提供的质量角度描述这些决策的影响:四个特征的得分增加,一个特征保持不变,两个特征的得分下降。此外,我们的研究还发现了课堂活动水平与课堂活动可变性之间的关系质量分数用于EDAM本体。评估这些质量分数变化与本体开发人员的设计决策之间的关系超出了本工作的范围。我们的方法为开发人员提供了数据,他们可以用来评估他们的决策是否对本体的质量分数产生预期的影响。

总之,我们认为OQuaRE框架有助于分析本体进化的工程,并为开发人员提供有关其本体进化的相关信息。

缩写

EDAM公司:

生物信息学操作本体、数据类型、格式和主题

OQuaRE公司:

本体质量需求与评价

面向对象:

面向对象的

主成分分析:

主成分分析

广场:

软件产品质量需求与评价

工具书类

  1. Hoehndorf R、Haendel M、Stevens R、Rebholz-Schumann D。JBMS生物医学本体论专题系列:挑战和新方向。《生物医学杂志》。2014; 5:15. 数字对象标识:10.1186/2041-1480-5-15.

    第条 谷歌学者 

  2. Noy NF、Shah NH、Whetzel PL、Dai B、Dorf M、Griffith N、Jonquet C、Rubin DL、Storey MA、Chute CG、Musen MA。生物门户:鼠标点击的本体论和集成数据资源。核酸研究2009;37(补充2):170–3。数字对象标识:10.1093/nar/gkp440.

    第条 谷歌学者 

  3. Malone J、Holloway E、Adamusiak T、Kapushesky M、Zheng J、Kolesnikov N、Zhukova A、Brazma A、Parkinson H。用实验因子本体论建模样本变量。生物信息学。2010; 26(8):1112–8. 数字对象标识:10.1093/生物信息学/btq099.

    第条 谷歌学者 

  4. Klein MCA,Fensel D.语义网络上的本体版本控制In:Cruz IF,Decker S,Euzenat J,McGuinness DL,编辑。SWWS’01会议录,第一届语义Web工作研讨会,7月30日至8月1日。美国加利福尼亚州:斯坦福大学:2001年。第75-91页。

    谷歌学者 

  5. Noy NF,Musen MA。本体管理框架中的本体版本控制。IEEE智能系统。2004; 19(4):6–13. 数字对象标识:10.1109/MIS.2004.33.

    第条 谷歌学者 

  6. Noy NF、Kunnatur S、Klein M、Musen MA。本体进化过程中的变化追踪。收录:McIlraith S、Plexousakis D、van Harmelen F,编辑。语义网——ISWC 2004。德国:施普林格-柏林-海德堡:2004。第259-73页。数字对象标识:2007年10月10日/b102467.

    谷歌学者 

  7. Noy FN,Klein M.本体论进化:与模式进化不同。知识信息系统。2004; 6(4):428–40. 数字对象标识:2007年10月10日/10115-003-0137-2.

    第条 谷歌学者 

  8. Bubastis:一个本体区分工具。http://www.ebi.ac.uk/efo/bubastis/。2016年3月1日访问。

  9. Copeland M、Gonçalves RS、Parsia B、Sattler U、Stevens R.《发现错误:检测版本化本体中的问题》,编辑:Cimiano P、Fernández M、Lopez V、Schlobach S、Völker J。语义网:ESWC 2013卫星事件:ESWC2013卫星事件,法国蒙彼利埃,2013年5月26日至30日,修订论文集。柏林,海德堡:施普林格-柏林-海德堡出版社:2013年。第113-24页。

    谷歌学者 

  10. 王晓霞,张德强,顾T,Pung HK。使用owl进行基于本体的上下文建模和推理。摘自:2004年普及计算与通信研讨会。程序。第二届IEEE年会。美国:IEEE:2004。第18-22页。

    谷歌学者 

  11. Christen V,Hartung M,GroßA.区域进化探索者——一种发现本体区域进化趋势的工具。生物语义学杂志。2015; 6(1):26. 数字对象标识:10.1186/s13326-015-0020-6.

    第条 谷歌学者 

  12. Gangemi A,Catenacci C,Ciaramita M,Lehmann J.建模本体评估和验证In:Sure Y,Dominguem J,编辑。语义网:研究与应用:第三届欧洲语义网会议,ESWC 2006年布德瓦,黑山,2006年6月11-14日会议记录。柏林,海德堡:施普林格出版社:2006年。第140-54页。doi:10.1007/11762256_13,10.1007/11762256_13.

    谷歌学者 

  13. 罗杰斯JE。医学本体论的质量保证。方法Inf Med.2006;45(3):267–74.

    谷歌学者 

  14. Yao H,Orme A,Etzkorn L.本体设计和应用的聚合度量。计算机科学杂志。2005; 1(1):107–13. 数字对象标识:10.3844/jcssp.2005.107.113.

    第条 谷歌学者 

  15. Tartir S,Arpinar IB.使用OntoQA进行本体评估和排名。收录于:ICSC’07:语义计算国际会议记录。美国哥伦比亚特区华盛顿:IEEE计算机学会:2007年。第185-92页。数字对象标识:101109年10月19日/国际化学品管制委员会2007.65.

    谷歌学者 

  16. Duque-Ramos A、Fernández-Breis JT、Stevens R、Aussenac-Gilles N.OQuaRE:基于SQuaRE的本体质量评估方法。《研究与实践信息技术杂志》。2011; 43(2):159–76.

    谷歌学者 

  17. ISO(国际标准化组织)。ISO/IEC 25000:2005,软件工程-软件产品质量要求和评估(SQuaRE)-SQuaRE指南。http://www.iso.org/iso/catalogie_detail.htm?csnumber=35683。2016年6月访问。

  18. Guarino N、Oberle D、Staab S.什么是本体?收件人:Staab S,Studer R,编辑。本体论手册。柏林,海德堡:施普林格出版社:2009年。第1-17页。数字对象标识:10.1007/978-3-540-92673-3_0.

    谷歌学者 

  19. Rumbaugh J、Blaha M、Premerlani W、Eddy F、Lorensen W。面向对象的建模与设计。美国新泽西州上鞍河:Prentice-Hall公司;1991

    数学 谷歌学者 

  20. Quesada-Martínez M、Duque-Ramos A、Fernández-Breis JT。使用OQuaRE分析本体的演化:在EDAM中的应用。摘自:《2015年生物医学本体论国际会议论文集》。里斯本:CEUR研讨会记录:2015年。第62-6页。

    谷歌学者 

  21. EDAM本体:生物信息学操作、数据类型、格式和主题。http://edamontology.org。访问日期:2016年3月1日。

  22. Stevens R,Lord P.《本体论在生物信息学中的应用》,摘自:Staab S,Studer R,编辑。本体论手册。柏林,海德堡:施普林格出版社:2009年。第735-56页。数字对象标识:10.1007/978-3-540-92673-3_33.

    谷歌学者 

  23. Oquare维基。http://miuras.inf.um.es/oquarewiki。2016年3月1日访问。

  24. Tartir S、Arpinar IB、Moore M、Sheth AP、Aleman meza B.OntoQA:基于度量的本体质量分析。摘自:IEEE分布式、自治、语义异构数据和知识源知识获取研讨会。美国:IEEE:2005。

    谷歌学者 

  25. Jin X,Han J.K-Means Clustering In:Sammut C,Webb GI,编辑。机器学习百科全书。马萨诸塞州波士顿:Springer:2010年。第563-4页。数字对象标识:10.1007/978-0-387-30164-8_425.

    谷歌学者 

  26. Ison J、KalašM、Jonassen I、Bolser D、Uludag M、McWilliam H、Malone J、Lopez R、Pettifer S、Rice P.EDAM:生物信息学操作本体、数据类型和标识符、主题和格式。生物信息学。2013; 29(10):1325–1332. 数字对象标识:10.1093/生物信息学/btt113.

    第条 谷歌学者 

  27. EDAM本体的GitHub存储库。https://github.com/edamontology/edamonology/releases。2016年3月1日访问。

  28. Horridge M,Bechhofer S.《OWL API:OWL本体的Java API》。《Semant网络杂志》。2011; 2(1):11–21.

    谷歌学者 

  29. 尼奥,4j。http://neo4j.com。2016年3月1日访问。

  30. John Fox DP、Muenchen R.RcmdrMisc:R指挥官杂项职能。https://cran.r-project.org/web/packages/RcmdrMisc/index.html。2016年3月1日访问。

  31. HermiT OWL Reasoner公司。http://hermit-reasoner.com。2016年3月1日访问。

  32. Chidamber SR,Kemerer CF。面向对象设计的度量套件。IEEE Trans-Softw Eng.1994;20(6):476–93. 数字对象标识:10.1109/32.295895.

    第条 谷歌学者 

  33. Egaña-Aranguren M.生物生物学中本体设计模式的作用和应用。博士论文:曼彻斯特大学;2009

  34. Hoehndorf R、Slater L、Schofield PN、Gkoutos GV。Aber-OWL:生物学中基于本体的数据访问框架。BMC生物信息学。2015; 16(1):1–9. 数字对象标识:10.1186/s12859-015-0456-9.

    第条 谷歌学者 

  35. Ceusters W,Smith B.生物医学本体论进化的基于实现的方法。收件人:AMIA。年度研讨会论文集/AMIA研讨会。AMIA研讨会。美国:AMIA:2006。第121-125页。

    谷歌学者 

  36. SeppäläS、Smith B、Ceusters W。应用基于实现的本体论版本管理方法跟踪基本形式本体中的更改。摘自:《信息系统中的形式本体——第八届国际会议论文集》,FOIS 2014年9月22日至25日。巴西里约热内卢:内部监督办公室出版社:2014年。第227-40页。数字对象标识:10.3233/978-1-61499-438-1-227.

    谷歌学者 

下载参考资料

基金

本论文是2015年国际博会论文的延伸[20]. 由于西班牙科学与创新部和FEDER计划的资助,该项目得以实施,资助项目有TIN2014-53749-C2-2-R、BES-2011-046192(MQM),基金会通过15295/PI/10和19371/PI/14。

数据和材料的可用性

OQuaRE框架的描述见http://miuras.inf.um.es/oquarewikiOQuaRE web平台可在http://sele.inf.um.es/oquare。本研究中使用的本体以及本文中包含的完整结果可在http://miuras.inf.um.es/oquare/jbsm2016.

作者的贡献

构思并设计了方法:ADR、MQM、MIM、JTFB、RS。实施了方法并进行了实验:MQM、ADR、MIM,JTFB和RS。分析了结果:ADR,MQM,MIM,JTFB,RS。有助于撰写手稿:MQM,ADR,MIM。JTFB,RS.所有作者都批准了最终手稿。

竞争性利益

作者声明,他们没有相互竞争的利益。

道德批准和参与同意

不适用。

作者信息

作者和附属机构

作者

通讯作者

与的通信杰苏亚尔多·托马斯·费尔南德斯·布雷斯.

权利和权限

开放式访问本文根据Creative Commons Attribution 4.0 International License的条款分发(http://creativecommons.org/licenses/by/4.0/),它允许在任何媒体上不受限制地使用、分发和复制,前提是您对原始作者和来源给予适当的信任,提供知识共享许可的链接,并指明是否进行了更改。知识共享公共领域专用豁免(http://creativecommons.org/publicdomain/zero/1.0/)适用于本文中提供的数据,除非另有说明。

转载和许可

关于本文

检查更新。通过CrossMark验证货币和真实性

引用这篇文章

Duque-Ramos,A.,Quesada-Martínez,M.,Iniesta-Moreno,M。等。通过OQuaRE中静态和动态缩放功能的组合,支持对本体演化过程的分析。J生物识别精液 7, 63 (2016). https://doi.org/10.1186/s13326-016-0091-z

下载引文

  • 收到:

  • 认可的:

  • 出版:

  • 内政部:https://doi.org/10.1186/s13326-016-0091-z

关键词