摘要
背景
结果
结论
背景
-
布巴斯蒂斯[ 三 , 8 ]通过考虑两个连续版本之间的5种主要本体更改,分析了生物医学本体的活动程度:向现有命名类(NC)添加或删除公理,NC补充道,NC使过时并编辑注释属性。 -
在[ 11 ]提出了一个web应用程序,它提供了一个交互式的、用户友好的界面来识别大型生命科学本体中的(un)稳定区域。 使用了一种基于特定时间间隔内本体的几个后续版本之间的更改计算区域更改强度的方法。
-
Gangemi等人,2006年[ 12 ]将其视为基于本体描述的诊断任务,使用三类标准(结构、功能和可用性分析)。 -
罗杰斯2006[ 13 ]提出了一种使用四个定性标准(哲学严谨性、本体论承诺、内容正确性和目的适合性)的方法。 -
Duque-Ramos等人,2011年[ 16 ]提出了OQuale,它采用软件质量评估的SQuaRE标准来定义定性和定量的本体质量框架。
方法
OQuaRE公司
-
1-“不可接受” -
2-“不可接受-需要改进” -
3-“最低可接受” -
4-“可接受” -
5-“超出要求”
适应OQuaRE进行本体进化
定义
定义1
定义2
定义3
定义4
定义5
定义6
定义7
-
当正向均值变化大于反向均值变化时,取正值;反之,取负值。 -
当正向和反向平均值变化取相等且有限的值时,它变为零。 -
如果 v(v) 我 和 v(v) 我 −1 都是相同的。 在这种情况下,正向和反向平均值变化不采用确定的有限值(未定义的值)。
定义8
本体进化的动态缩放函数
生物信息学操作本体、数据类型、格式和主题(EDAM)
-
它有很好的文档记录,其开发人员使用控制版本系统(CVS)[ 27 ]这样我们就可以追踪变化。 -
它的源文件可以在线访问。 最新版本(v1.9)发布在官方项目网页上。 可以在BioPortal(18个版本)和CVS(13个版本)中找到旧版本的链接。 -
自2013年10月至2014年4月,该项目每月平均接待900人次,有6个申报项目使用EDAM。 -
版本的数量(18)使其成为研究其进化的感兴趣的本体。 它的大小(平均值为2597类)是中等的,这有助于在该方法的首次应用中分析结果。
结果和讨论
实验装置
用静态天平分析质量特性
用静态量表分析质量指标
-
RROnto有3个 规模变化 前两个变化是连续的,这是由于使用了属性,这两个变化之间减少了86% v(v) 4 和 v(v) 6 。重构一组公共属性通常是良好的本体工程实践的标志,但使用情况衡量属性通过公理与实体链接的次数。 例如,当 v(v) 4 定义了16个属性,有6734种用法, v(v) 5 和 v(v) 6 定义相同数量的属性,但分别使用1979和937种用法。 房地产的使用量在 v(v) 10 和 v(v) 11 这一变化比前一个变化小,但加上关系数量的异常增加(18%),引发了 规模变化 RROnto的。 这种关系数量的增加是由于 v(v) 11 :已弃用的类在第一分类级别被分组为本体类的后代,这增加了关系的数量。 -
RFCOnto和NOMOnto有1个 规模变化 从4英寸增长到5英寸 v(v) 4 这种行为也与属性的使用有关。 然而,对于这些度量,这种原始度量对 质量分数 因为,在NOMOnto的情况下,每个类的平均属性使用次数越低,本体的可维护性就越容易。这种行为引发了中特征“可操作性”、“兼容性”和“可转移性”的规模变化 v(v) 5 . -
TMOnto测量本体中父对象的分布。 10%的班级有一位以上的直系家长 v(v) 4 年,该值增长至24% v(v) 5 。由于多重继承,此度量在整个本体中具有负面影响,尽管这可能需要反映本体中的某些方面。 这一事实影响了“纠结性”亚特征的减少,也导致了“结构性”特征的减少。 然而,对于这一指标,这一变化本身并没有引发规模的变化,这是在年产生的 v(v) 11 在RROnto的合作下。 -
LCOMOnto在其计算中使用本体中的路径数,但遇到了一个 规模变化 在里面 v(v) 2 此度量用于子特征“内聚”、“知识重用”、“可学习性”、“恢复性”和“可用性”。 此外,该指标是唯一用于衡量“内聚性”和“可用性”的指标,因此它对这两个亚特征的影响比其他亚特征更大。 一方面,“结构性”特征的最低分数是“内聚性”,但这并没有引起 v(v) 2 另一方面,“可恢复性”和“可用性”按“可靠性”特征分组,因此,LCOMOnto度量的行为触发了 规模变化 在里面 v(v) 2 .
弃用类的影响
动态天平的应用
版本间主要变更分析
变化幅度分析
-
我们拒绝无效假设( M(M) 电子 =0),因此我们可以解释所有变化都是显著的。 表8从低到高临界值和 第页 -与零假设相关的值 M(M) 电子 在使用14个OQuaRE指标的中位数和连续版本对的绝对值差异进行Wilcoxon检验后 -
我们已经评估了 变化幅度 使用 质量分数 (缩放指标)。 临界值显示差异中值的大小( M(M) 电子 )显著高于0.05水平。 使用此标准对版本之间的更改进行排序,我们得到最大更改发生在 v(v) 5 . -
根据该分析,变化最大的四个版本也是变化最大的4个版本 变化幅度 对于动态比例,如表所示 7 “幅度”行。 这表明了动态缩放函数中使用的标准的优点。
平均变化分析
变更概况 质量分数
-
静态标尺的使用显示出负面趋势 平均值变化 .累计 平均值变化 所有版本和所有对的值都保持为负值,这也反映在 质量分数 特征的平均值为3.99到3.85,这在前面已经讨论过。 -
动态尺度的互补使用允许观察不同的演变。 前7个版本的平均变化为负值,而接下来的9个版本为正值。 因此,累积平均变化从-1,35增长到1,63。 最后,其下降至1.49 v(v) 17 并保持不变 v(v) 18 .
本体中质量分数和活动水平之间的关系
-
这个 Bubastis变量 与因子1(以x轴表示)具有最大的正相关性(对于“新”、“更改”和“删除”类别,分别为0.88、0.80和0.85),因此我们将该因子解释为表示与Bubastis活动相关的活动量增加的梯度。 我们称之为这个因素 Bubastis活动 . 表9新轴变量坐标的二维表示 -
动态 平均值变化 与因子2(以y轴表示)的正相关最大(0.92),而动态向后大小与该因子的负相关。 这些事实使我们能够将第二个因素解释为OQuaRE下限的梯度 质量分数 到更高的。 我们称之为这个因素 OQuaRE动态质量 .
-
这个 布巴斯蒂斯放射性 属于 v(v) 16 低于平均值。 然而,这项活动使用动态量表使OQuaRE质量分数显著增加。 -
这个 布巴斯蒂斯放射性 属于 v(v) 10 和 v(v) 11 与其他版本相比异常高。 此外,使用动态量表的OQuaRE质量分数高于平均值。 -
这个 布巴斯蒂斯放射性 属于 v(v) 5 超过了平均值,使用动态量表降低了OQuaRE质量分数,改变的班级数量也很高。 -
这个 布巴斯蒂斯放射性 属于 v(v) 18 是OQuaRE质量分数中使用动态量表的最低值,接近平均值。
EDAM本体论的演进
-
最高的 质量分数 可维护性(4.23)。 所有相关的亚特征都有 质量分数 大于4(参见 http://miuras.inf.um.es/oquare/jbsm2016 ). 这揭示了EDAM的一些优势,例如由于本体的变化而降低的负面副作用率(修改稳定性4.60),以及验证本体并检测其缺陷的可能性(可测试性4.00)。 -
第二高 质量分数 适用于功能充分性(4.11)。 例如,EDAM很适合用作受控词汇表,以避免术语的异构性,因为它们的所有类都有用自然语言表示的标签。 然而,并不是所有的亚特征都能获得高分。 例如,EDAM的一个弱点是通过推理子特征的得分来阐明的。 尽管它是使用形式语言定义的,但由于属性的使用率较低,因此其得分为1.0。 缺乏实例也促成了这一得分。 -
可靠性得分最低(2.75),其次特征是可恢复性(2.50)和可用性(3.00)。 可恢复性得分低于3,因此可以将其视为EDAM的一个弱点,因为在本体内容不一致、不完整或冗余的情况下,很难重新建立本体并恢复本体的性能。
-
v(v) 5 , v(v) 2 , v(v) 7 和 v(v) 11 是最高的版本吗 变化幅度 即,有更改的度量数。 使用静态量表对特征进行的分析表明,平均而言,没有 规模变化 在EDAM本体中。 这也可以从累积的负趋势中观察到 平均值变化 使用静态标尺时(表 6 ). 有趣的是,动态尺度揭示了以下观察结果: 平均变化 趋势是积极的 v(v) 7 到 v(v) 18 . -
在特征层次上,静态尺度在EDAM本体中的应用表明,本体的演化对四个特征产生了较高的质量分数,对其中两个特征产生的质量分数较低,如表所示 1 . -
OQuaRE指标级别的变化分析有助于我们确定属性的使用是导致 质量分数 之间 v(v) 4 - v(v) 6 ,再次介于 v(v) 10 − v(v) 11 此外 v(v) 11 触发了规模的变化。 应该指出,应用我们的方法可以得出这些类型的建议。
关于方法的讨论
结论
缩写
EDAM公司: -
生物信息学操作本体、数据类型、格式和主题 OQuaRE公司: -
本体质量需求与评价 面向对象: -
面向对象的 主成分分析: -
主成分分析 广场: -
软件产品质量需求与评价
工具书类
Hoehndorf R、Haendel M、Stevens R、Rebholz-Schumann D。JBMS生物医学本体论专题系列:挑战和新方向。 《生物医学杂志》。 2014; 5:15. 数字对象标识: 10.1186/2041-1480-5-15 . Noy NF、Shah NH、Whetzel PL、Dai B、Dorf M、Griffith N、Jonquet C、Rubin DL、Storey MA、Chute CG、Musen MA。生物门户:鼠标点击的本体论和集成数据资源。 核酸研究2009; 37(补充2):170–3。 数字对象标识: 10.1093/nar/gkp440 . Malone J、Holloway E、Adamusiak T、Kapushesky M、Zheng J、Kolesnikov N、Zhukova A、Brazma A、Parkinson H。用实验因子本体论建模样本变量。 生物信息学。 2010; 26(8):1112–8. 数字对象标识: 10.1093/生物信息学/btq099 . Klein MCA,Fensel D.语义网络上的本体版本控制In:Cruz IF,Decker S,Euzenat J,McGuinness DL,编辑。 SWWS’01会议录,第一届语义Web工作研讨会,7月30日至8月1日。 美国加利福尼亚州:斯坦福大学:2001年。 第75-91页。 Noy NF,Musen MA。本体管理框架中的本体版本控制。IEEE智能系统。 2004; 19(4):6–13. 数字对象标识: 10.1109/MIS.2004.33 . Noy NF、Kunnatur S、Klein M、Musen MA。本体进化过程中的变化追踪。收录:McIlraith S、Plexousakis D、van Harmelen F,编辑。 语义网——ISWC 2004。 德国:施普林格-柏林-海德堡:2004。 第259-73页。 数字对象标识: 2007年10月10日/b102467 . Noy FN,Klein M.本体论进化:与模式进化不同。 知识信息系统。 2004; 6(4):428–40. 数字对象标识: 2007年10月10日/10115-003-0137-2 . Bubastis:一个本体区分工具。 http://www.ebi.ac.uk/efo/bubastis/ 。2016年3月1日访问。 Copeland M、Gonçalves RS、Parsia B、Sattler U、Stevens R.《发现错误:检测版本化本体中的问题》,编辑:Cimiano P、Fernández M、Lopez V、Schlobach S、Völker J。 语义网:ESWC 2013卫星事件:ESWC2013卫星事件,法国蒙彼利埃,2013年5月26日至30日,修订论文集。 柏林,海德堡:施普林格-柏林-海德堡出版社:2013年。 第113-24页。 王晓霞,张德强,顾T,Pung HK。使用owl进行基于本体的上下文建模和推理。 摘自:2004年普及计算与通信研讨会。 程序。 第二届IEEE年会。美国:IEEE:2004。 第18-22页。 Christen V,Hartung M,GroßA.区域进化探索者——一种发现本体区域进化趋势的工具。 生物语义学杂志。 2015; 6(1):26. 数字对象标识: 10.1186/s13326-015-0020-6 . Gangemi A,Catenacci C,Ciaramita M,Lehmann J.建模本体评估和验证In:Sure Y,Dominguem J,编辑。 语义网:研究与应用:第三届欧洲语义网会议,ESWC 2006年布德瓦,黑山,2006年6月11-14日会议记录。 柏林,海德堡:施普林格出版社:2006年。 第140-54页。 doi:10.1007/11762256_13, 10.1007/11762256_13 . 罗杰斯JE。医学本体论的质量保证。 方法Inf Med.2006; 45(3):267–74. Yao H,Orme A,Etzkorn L.本体设计和应用的聚合度量。 计算机科学杂志。 2005; 1(1):107–13. 数字对象标识: 10.3844/jcssp.2005.107.113 . Tartir S,Arpinar IB.使用OntoQA进行本体评估和排名。 收录于:ICSC’07:语义计算国际会议记录。 美国哥伦比亚特区华盛顿:IEEE计算机学会:2007年。 第185-92页。 数字对象标识: 101109年10月19日/国际化学品管制委员会2007.65 . Duque-Ramos A、Fernández-Breis JT、Stevens R、Aussenac-Gilles N.OQuaRE:基于SQuaRE的本体质量评估方法。 《研究与实践信息技术杂志》。 2011; 43(2):159–76. ISO(国际标准化组织)。 ISO/IEC 25000:2005,软件工程-软件产品质量要求和评估(SQuaRE)-SQuaRE指南。 http://www.iso.org/iso/catalogie_detail.htm?csnumber=35683 。2016年6月访问。 Guarino N、Oberle D、Staab S.什么是本体? 收件人:Staab S,Studer R,编辑。 本体论手册。 柏林,海德堡:施普林格出版社:2009年。 第1-17页。 数字对象标识: 10.1007/978-3-540-92673-3_0 . Rumbaugh J、Blaha M、Premerlani W、Eddy F、Lorensen W。面向对象的建模与设计。 美国新泽西州上鞍河:Prentice-Hall公司; 1991 Quesada-Martínez M、Duque-Ramos A、Fernández-Breis JT。 使用OQuaRE分析本体的演化:在EDAM中的应用。 摘自:《2015年生物医学本体论国际会议论文集》。 里斯本:CEUR研讨会记录:2015年。 第62-6页。 EDAM本体:生物信息学操作、数据类型、格式和主题。 http://edamontology.org 。访问日期:2016年3月1日。 Stevens R,Lord P.《本体论在生物信息学中的应用》,摘自:Staab S,Studer R,编辑。 本体论手册。 柏林,海德堡:施普林格出版社:2009年。 第735-56页。 数字对象标识: 10.1007/978-3-540-92673-3_33 . Oquare维基。 http://miuras.inf.um.es/oquarewiki 。2016年3月1日访问。 Tartir S、Arpinar IB、Moore M、Sheth AP、Aleman meza B.OntoQA:基于度量的本体质量分析。 摘自:IEEE分布式、自治、语义异构数据和知识源知识获取研讨会。 美国:IEEE:2005。 Jin X,Han J.K-Means Clustering In:Sammut C,Webb GI,编辑。 机器学习百科全书。 马萨诸塞州波士顿:Springer:2010年。 第563-4页。 数字对象标识: 10.1007/978-0-387-30164-8_425 . Ison J、KalašM、Jonassen I、Bolser D、Uludag M、McWilliam H、Malone J、Lopez R、Pettifer S、Rice P.EDAM:生物信息学操作本体、数据类型和标识符、主题和格式。 生物信息学。 2013; 29(10):1325–1332. 数字对象标识: 10.1093/生物信息学/btt113 . EDAM本体的GitHub存储库。 https://github.com/edamontology/edamonology/releases 。2016年3月1日访问。 Horridge M,Bechhofer S.《OWL API:OWL本体的Java API》。 《Semant网络杂志》。 2011; 2(1):11–21. 尼奥,4j。 http://neo4j.com 。2016年3月1日访问。 John Fox DP、Muenchen R.RcmdrMisc:R指挥官杂项职能。 https://cran.r-project.org/web/packages/RcmdrMisc/index.html 。2016年3月1日访问。 HermiT OWL Reasoner公司。 http://hermit-reasoner.com 。2016年3月1日访问。 Chidamber SR,Kemerer CF。面向对象设计的度量套件。 IEEE Trans-Softw Eng.1994; 20(6):476–93. 数字对象标识: 10.1109/32.295895 . Egaña-Aranguren M.生物生物学中本体设计模式的作用和应用。 博士论文:曼彻斯特大学; 2009 Hoehndorf R、Slater L、Schofield PN、Gkoutos GV。 Aber-OWL:生物学中基于本体的数据访问框架。 BMC生物信息学。 2015; 16(1):1–9. 数字对象标识: 10.1186/s12859-015-0456-9 . Ceusters W,Smith B.生物医学本体论进化的基于实现的方法。 收件人:AMIA。 年度研讨会论文集/AMIA研讨会。 AMIA研讨会。 美国:AMIA:2006。 第121-125页。 SeppäläS、Smith B、Ceusters W。应用基于实现的本体论版本管理方法跟踪基本形式本体中的更改。 摘自:《信息系统中的形式本体——第八届国际会议论文集》,FOIS 2014年9月22日至25日。 巴西里约热内卢:内部监督办公室出版社:2014年。 第227-40页。 数字对象标识: 10.3233/978-1-61499-438-1-227 .
基金
数据和材料的可用性
作者的贡献
竞争性利益
道德批准和参与同意
作者信息
作者和附属机构
通讯作者
权利和权限