跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
数据库(牛津)。2013; 2013年:bas056。
2013年1月16日在线发布。 数字对象标识:10.1093/数据库/bas056
PMCID公司:PMC3625048型
PMID:23327936

BioCreative 2012年研讨会轨道三概述:交互式文本挖掘任务

关联数据

补充材料

摘要

在许多数据库中,生物化学主要涉及文献管理,这通常涉及检索相关文章、提取将转换为注释的信息以及识别新的输入文献。随着生物文献数量的增加,使用文本挖掘来帮助生物化变得越来越重要。许多小组已经从计算机科学/语言学的角度开发了文本挖掘工具,并且有许多倡议从文献中整理生物学的某些方面。一些生物化成工作已经使用了文本挖掘工具,但还没有很多基础广泛的系统工作来研究文本挖掘工具的哪些方面有助于其在管理任务中发挥作用。在这里,我们报告了将文本挖掘工具开发人员和数据库生物清除器聚集在一起测试工具的实用性和可用性的工作。六个呈现不同生物化成任务的文本挖掘系统参与了正式评估,并招募了适当的生物化学家进行测试。该评估的性能结果表明,与手动管理相比,一些系统能够显著加快管理任务(约1.7至2.5倍),从而提高管理效率。此外,与手动管理集的性能相比,一些系统能够提高注释准确性。就宣布者之间的协议而言,导致某些系统存在显著差异的因素包括生物鉴定员在指定管理任务上的专业知识、管理的固有困难以及对注释指南的关注。任务完成后,注释员被要求完成一项调查,以帮助确定各种系统的优缺点。这项调查的分析突出了任务完成对生物化学家对系统的整体体验有多重要,而不管系统在设计、可学习性和可用性方面的高分如何。此外,在本任务期间,还分析了改进注释指南和系统文档、使工具适应最终用户可能具有的需求和查询类型以及从效率、用户界面、结果导出和传统评估指标方面评估性能的策略。该分析将有助于计划在BioCreative IV中进行更深入的研究。

介绍

生物数据库是研究人员日常工作中使用的工具集的一个组成部分,用于收集和提供对我们不断扩展的生物学知识的访问。它们能够更系统地访问非结构化文本中隐藏的信息,有助于对生物数据集进行编程分析。数据库生物化是提供高质量信息的关键活动。它可以被定义为分析、解释和整合生物信息,主要是通过在一个共同的生物框架内注释和互连研究数据和结果来增加价值(1). 为了实现这一点,专家生物化学家可能需要阅读并从生物医学文献中提取相关信息。这种文献整理在生物转化过程中,无论是在速度(效率)还是成本(生物净化器的时间)方面,都是一个相当大的瓶颈;然而,如果文本挖掘工具能够以足够的准确性和速度执行有用的任务,那么它们就有可能加快管理过程(2). 赫希曼等。(2)对代表23个数据库的30个生物化学家进行了一项调查,确定了生物化学家的一些优先事项,并表明三分之二的生物化学家团队曾尝试过文本挖掘,近一半的生物化育团队在某些方面使用了文本挖掘。生物保护者需要易于使用、易于安装、易于预期最终用户维护的工具。生物测定器并没有提供正式评估分数方面的高性能工具,而是更关注能够帮助生物化过程的实际方面。其中一些方面包括要求生成排名结果和置信度得分,将自动提取的注释链接到文本中的证据段落,提供可视化帮助(例如突出显示不同级别的注释),并允许以标准格式灵活导出结果(2). 考虑到这些需求,BioCreative(生物学信息提取的关键评估,http://www.biocreative.org/) (3–6)其目的是促进对研究人员和生物化学家社区有用的文本挖掘和文本处理工具的开发,在BioCreative III中引入了交互式任务(IAT)(7). BioCreative III的一个关键方面是,有代表性的终端用户团体积极参与指导有用工具和标准的开发和评估。IAT虽然具有示范性,但促进了开发人员和生物固化器的互动,并激发了可用于生物固化工作流程的接口的开发/改进(8). 文本挖掘和生物化社区对这项任务的积极接受促使组织了以生物化工作流中的交互式文本挖掘为中心的2012年生物创意研讨会。特别是,本文中介绍的工作是一个交互式文本挖掘和用户评估任务。比如BioCreative III IAT(7)它是非竞争性的,目标是吸引用户,提供试验不同方法的手段,以正式评估交互系统,并收集规范和指标,为2013年10月举行的生物创意IV挑战奠定基础。作为国际生物保护会议的卫星,主办这次研讨会为生物净化师参与这项活动提供了一个独特的机会。

BioCreative III IAT的经验教训

在BioCreative III IAT中,目标是开发一个交互式系统,以便于手动注释文章中出现的所有基因的唯一数据库标识符。这项任务包括按重要性对基因进行排序(最好基于描述的有关基因的实验信息量)(7). 还有一个可选任务,帮助用户检索给定基因的最相关文章。为了帮助仔细设计此任务,用户咨询小组(UAG;http://www.biocreative.org/about/biocreative-iii/UAG/)在评估IAT系统和为未来更严格的IAT系统评估提供详细指导方面发挥了积极作用(7).

从这项活动中获得的一些重要经验包括:(i)开发人员与生物净化剂的早期合作对于在整个系统开发过程中协同工作很重要;(ii)系统培训需要足够的时间;(iii)选择与用户专业领域相关的语料库(例如模型生物数据库的物种特定文档和路径数据库的路径中心文档),以及(iv)鼓励文本挖掘开发人员参与生物化成会议,以促进与生物验证者的交互。正如生物清除剂调查所观察到的,用户在其管理过程中采用自动化工具在很大程度上取决于工具的性能和整体便利性。

基于这些观察结果,我们设计了这里描述的BioCreative 2012研讨会互动轨道。

材料和方法

本节概述了BioCreative 2012年IAT规划,从修改之前的BioCreetive IAT开始,招募参与者和协调员,准备数据集和评估。图1总结了BioCreative 2012 IAT活动的工作流程,分为三个主要阶段:准备、培训和评估,并指出了团队、生物鉴定员和协调员执行的任务,以及一些重要的日期。一些细节描述如下。

保存图片、插图等的外部文件。对象名称为bas056f1p.jpg

BioCreative 2012研讨会工作流程。图表显示了此活动的三个主要阶段:(1)准备阶段包括由团队准备系统和文件,招募生物净化师测试每个系统,并为指定的生物净化小组修改系统;(2)培训阶段积极涉及团队和生物鉴定员,前者为使用系统提供必要的支持,后者学习管理任务和系统功能,必要时报告系统错误()评估阶段包括语料库的选择和专家的手动注释(以创建黄金标准),该语料库由生物测定器进行注释,半手动,半系统辅助,以及用户调查的时间记录和填写。小组和协调员收集了结果,并在研讨会上进行了介绍。一些重要的日期显示在右侧。

IAT参加2012年生物创意研讨会

基于UAG在BioCreative III中提出的考虑,我们在BioCreative 2012研讨会中对IAT进行了一些修改,例如

  1. 各小组在评估之前提交了系统文档、必要时的管理指南、生物测定器实践集和系统基准。这是为了确保工具的性能和范围足以完成拟议的生物化任务。
  2. 该系统可以包括与BioCreative III相对的任何生物化任务,后者仅限于基因标准化/排序。招募了在相关生物矿化任务方面有经验的生物保护者,并在该过程的早期与开发人员配对。这种互动使系统能够根据用户的策展兴趣进行调整,使结果与他们更相关。
  3. 与BioCreative III相比,生物化学家对系统进行培训和评估的时间显著延长(从10天延长到20天)。
  4. BioCreative 2012年研讨会作为国际生物保护会议的卫星举办,以鼓励文本挖掘开发人员参与生物保护会议,以及生物保护人员参与BioCreetive研讨会。

招募参与者

文本挖掘团队

我们公开邀请文本挖掘团队参与IAT,展示专注于任何给定生物化任务的系统。要求注册团队提交一份文件,描述其系统,并解决与系统相关性和影响、适应性、交互性和性能相关的问题。此外,研究小组被要求指出该系统的局限性,提供生物化任务的详细信息,并建议评估指标。每个系统都指派了一名协调员来监督和协助活动(参见“协调员”一节)。带有简要说明的系统列表(表1)并将随附文件发布在BioCreative网站上(http://www.biocreative.org/tasks/bc-workshop-2012/track-ii-systems/)让生物验证器选择并注册测试。

表1

在BioCreative 2012 Track III中注册的系统

保存图片、插图等的外部文件。对象名称为bas056t1.jpg
保存图片、插图等的外部文件。对象名称为bas056t2.jpg

系统描述,包括BioCreative中提出的任务和报告的内部基准测试结果。术语标签EQ是严格基于原始描述创建的EQ语句,与任何本体无关,而基于标签的EQ是相应的形式语句(使用本体术语)。b条该系统仅参加了研讨会。

生物保护者

我们通过国际生物保育学会(ISB)邮件列表、ISB会议和BioCreative网站分发参与呼吁,邀请生物保育员参加BioCreetive IAT。生物馆长可以选择参与不同级别的活动,即通过协助选择和注释数据集来创建黄金标准,通过参与基于第表1和/或参加研讨会。约40名生物净化师参加了此次活动,表2显示了它们所代表的各种数据库/机构以及不同的参与水平(数据集注释和系统评估)。

表2

参与2012年生物创意研讨会的数据库/机构

数据库/机构类型数据库/机构金标准注释车间前评估车间评估
工业阿斯利康(1)
默克塞罗诺(1)
辉瑞(1)
文学类NLM(1)
模式生物(MOD)/基因本体联盟(GOC)AgBase(1)
字典库(2)
FlyBase(1)
MaizeDB(1)
MGI(3)
SGD(1)公司
TAIR(2)
蜗杆底座(1)
XenBase(1)
ZFIN(1)
本体论植物本体(1)
蛋白质本体论(2)
通路反应组(2)
表型总资产(1)
现象景观(3)
蛋白质-蛋白质相互作用生物电网(1)
薄荷(1)
其他(约11)

括号中的数字是每个机构的生物净化器数量。生物保护者在数据集注释和系统评估中提供帮助

协调员

协调员是2012年生物创意研讨会指导委员会的成员,他们协助监督和促进生物化学家和开发者之间的沟通。协调员的一些角色包括:(i)为系统匹配和引入生物测定器,(ii)监督语料库的创建,以作为评估中使用的黄金标准,(iii)概述活动,(iv)确保团队参与研讨会(注册),(v)指导生物验证器完成评估和(vi)收集指标所需的步骤。

数据集集合

为评估选择合适的数据集是受实际管理任务的启发,并牢记生物化工作流程。每个系统都有自己的数据集,由其协调员和参与金标准注释的领域专家选择。在大多数情况下,数据集由50篇PubMed摘要组成,这些摘要是从可能的相关文章库中随机选择的。数据集选择和捕获的信息摘要见表3注意,注释语料库的格式因系统输出而异。此表还显示了参与此类语料库注释的组,以及最终评估系统的组。

表3

2012年生物创意研讨会系统数据集准备

系统车间前评估的数据集选择捕获的信息参与金标准注释的生物馆长评估中涉及注释的生物馆长
文本印刷品30篇关于盘状网柄菌2011年至2012年,dictyBase中尚未注释。该集合包含124句话中61个GO细胞成分注释,由高级dictyBase biocurator注释论文标识符、注释实体、论文部分、可管理句子、句子中的成分术语、GO术语、GOID和证据代码。dictyBase高级策展人dictyBase与植物本体
过程控制系统从50篇关于鱼类或其他脊椎动物的文章中随机选择50篇NeXML格式的表型特征文本描述。金标准50个字符的描述,由高级Phenoscape生物鉴定师注释实体术语、实体ID、质量术语、质量ID、质量否定、质量修饰符、实体定位器、计数等Phenoscape高级策展人ZFIN和Phenoscape
PubTator出版社TAIR集:从2011年11月采集的50个摘要(24个相关),用于TAIR已经策划的拟南芥基因索引:基因名称和Entrez基因ID现有注释语料库TAIR和国家医学图书馆(NLM)
NLM集合:从基因索引辅助测试集合(人类)中取样的50个摘要文件分类信息:相关PMID列表
PPInterFinder50个摘要描述了通过使用工具/资源组合(如UniProt、PubMeMiner、FABLE和PIE)获得的人类激酶。PMID,蛋白质相互作用物名称1,蛋白质相互反应物名称2尼泊尔卢比BioGrid和MINT
eFIP公司以PMID为中心:根据涉及反应体自噬和HIV感染两种途径的蛋白质随机选择50个摘要PMID、磷酸化蛋白、磷酸化位点、相互作用物名称、效果、证据句子尼泊尔卢比默克Serono、Reactome和SGDb条
以基因为中心:适应性免疫系统涉及的4种蛋白质的10个一流摘要(反应组:REACT_75774)
T型罩以PMID为中心:2011年关于肥胖、糖尿病或高血压的期刊的50篇摘要PMID、EntrezGene ID、基因名称、疾病、基因-疾病关系、证据判决蛋白质本体高级策展人辉瑞、Reactome、GAD和MGI
以基因为中心:回顾四个基因的文献相关性

NR:未记录。馆长新手到GO注释。b条SGD策展人参加了第一次评估,此处未报告绩效结果。

评价

我们计划了两项评估,一项是基于选定语料库的研讨会前系统正式评估,其中包括系统性能和主观测量(稍后解释),另一项是非正式评估,包括演示(演示)会议期间在研讨会上进行的系统测试。后者只包括主观测量,主要代表用户对系统的第一印象。

系统的性能和可用性基于以下指标进行计算:

作为“绩效衡量”,我们包括比较系统辅助与人工管理的任务时间;以及自动系统与金标准注释(由领域专家独立手动管理的数据集)和/或手动与系统辅助注释(再次由金标准评级)的精度/召回/F测量。

我们将这些措施定义如下:

方程式图像

其中TP、FP和FN分别是真阳性、假阳性和假阴性。

对于“主观测量”,我们准备了一份调查,旨在记录用户对系统的主观体验。调查包括五个主要类别,即总体反应、系统帮助完成任务的能力、应用程序设计、学习使用应用程序和可用性,此外还包括单独评估的“系统推荐”;这些类别是基于Chin开发的用户界面满意度问卷(QUIS)等。并被证明是理解用户反应的可靠指南(9). 每个类别都包含根据七点利克特量表进行评分的问题(10). 问题的性质和形式部分受到了为QUIS开发的问题的启发,部分受到了其他工作的启发:计算机系统可用性问卷(11)感知有用性和易用性调查(12)和USE调查问卷(13). 作者修改了这些调查中使用的问题,以更好地解决生物化界面的特定方面。该调查仍在以下网址提供:http://ir.cis.udel.edu/biocreative/survey.html.

在车间前评估期间,生物检验员按照每个系统提供的格式手动管理一半的数据集,另一半使用指定的系统,记录相应的任务时间。

结果

本节描述了BioCreative 2012 worskhop IAT的结果,其组织结构如下:我们首先描述了研讨会前评估,包括每个参与系统的详细信息,然后是结果总结。然后,我们描述了研讨会上的活动,最后,我们提供了评估的一般总结,包括演示会议的结果。

参与系统

七个团队中有六个注册并提供了所需的系统描述、基准测试结果,并准备在商定的截止日期前进行测试(表1). 注册系统提出的生物化成任务具有广泛的异质性,包括提取基因-疾病关系或蛋白质-蛋白质相互作用,找到摘要中提到的基因,并将提到的基因与系统命名关联,本体匹配和检索提及特定疾病或化学品的文档。报告的指标(表1)提供证据证明系统性能合理,系统处于良好的测试状态。另外一个系统只参加了研讨会期间的演示环节。

车间前评估

馆长的任务包括培训、注释和填写用户调查(图1). 对于培训,每个生物固化器都需要执行一系列任务,包括熟悉系统和开发人员提供的管理指南。在这一阶段,鼓励生物净化剂和开发人员之间的频繁沟通,并利用了各种方式。一些小组与生物验证器举行了电话会议,或以类似网络研讨会的形式展示了他们的系统,而其他小组则通过电子邮件或协调员提供了所有文件。在此期间,用户还可以报告在测试之前可以解决的系统错误。在所有情况下,注释(评估本身)都涉及手动管理一组文档和使用所选系统管理另一组文档。手动输出符合系统提供的格式。

本节概述了各个系统的设置和结果。表4-6总结绩效和主观测量。

表4

车间前评估中的系统性能指标

系统性能度量(%)系统输出与金标准注释系统辅助注释手动注释
文本压缩
    句子级别
        类别4仅系统
            召回37.9
            精密度77.5馆长1b条策展人2b条
            F-测量50.955.126.9
        第5类仅系统41.763.3
            召回39.747.537.8
            精密度81.5
            F-测量53.4
            GO注释级别
        第4类馆长1策展人2
            召回37.114.5馆长1b条策展人2b条
            精密度78.377.886.839.5
            F-测量50.324.442.841.2
        第5类馆长1策展人257.340.3
            召回32.211.3
            精密度7571.4
            F-测量45.119.5
过程控制系统
    基于Term的EQc(c)单独的系统馆长1策展人2d日馆长3
        召回65473850
        精密度60576567
        F-测量62.451.54857.3
    基于标签的EQc(c)仅系统馆长1馆长2d日馆长3
        召回24445151
        精密度23548174
        F-测量23.548.562.660.4
菲尼克斯+查拉帕瑟菲尼克斯
    基于标签的EQc(c)馆长1策展人2d日馆长3馆长1策展人2d日馆长3
        召回513866376336
        精密度587084498860
        F-测量54.349.373.942.273.445
PubTator出版社
    NLM索引级别仅系统馆长1馆长1
        召回80.198.691
        精密度83.498.393
        F-测量81.79892
    TAIR索引文档级别仅系统策展人2策展人2
        召回769091
        精密度73.977.175
        F-测量74.98382
    TAIR分诊仅系统策展人2
        召回68.684.6
        精密度80.5100
        F-测量74.192
PPInterFinder
    仅PPI算法单独的系统馆长1策展人2馆长1策展人2
        召回尼泊尔卢比69.863.872.779.7
        精密度85.785.78790.4
        F-测量76.973.279.284.7
    PPI算法(基因提及/基因归一化)仅系统馆长1策展人2
        召回尼泊尔卢比46.946.9
        精密度85.785.7
        F-测量60.660.6
电子FIP
    以PMID为中心(句子级)单独的系统馆长1策展人2馆长1策展人2
        召回尼泊尔卢比69.288.289.577.8
        精密度94.7798570
        F-测量8083.387.273.7
    以基因为中心(文档级)仅系统馆长1策展人2馆长1策展人2
        召回尼泊尔卢比78.685.710077.8
        精密度91.785.783.377.8
        F-测量84.685.790.977.8
    文档-银行
        nDCG公司93–100
T型罩
    以PMID为中心(句子级)仅系统馆长1策展人2馆长3策展人4
        召回7056222442
        精密度79.532264042
        F-测量74.540243042
    以基因为中心(文档级)仅系统策展人1策展人2馆长3策展人4
        召回54.356302642
        精密度72.163415271
        F-测量6259353553

4类搜索使用“单词袋”来搜索(1)分析术语、(2)动词、(3)细胞成分术语和(4)基因产品名称,而5类搜索还包括表和图的单词。b条手动注释不一定对应于4类或5类搜索,因为管理员对符合这两个标准的句子进行注释。c(c)术语标签EQ是严格基于原始描述创建的实体质量声明,与任何本体无关,而基于标签的EQ是相应的形式声明(使用本体术语)。d日为了节省时间,馆长忽略了CharaParser提出的数量不详的建议。

表5

任务完成时间比率:手动/系统辅助和管理时间范围

时间比率手动/系统
时间范围(min)
系统馆长1策展人2馆长3馆长4手动系统
文本印刷品2.32.5375–692150–297
过程控制系统10.8135–210165–210
发布者1.81.783–13549–79
PPI内部查找器0.9尼泊尔卢比5862
eFIP公司2.42.588–12035–50
T型罩0.91.31.24110–140b条110–120b条

NR,未记录。只有在熟悉了工具之后。b条一位馆长使用T-HOD将60分钟手动速度显著提高至15分钟,但未显示。

表6

在车间前评估中按类别对每个系统进行总体评级

主观测量(每个部分的总体中位数)
系统总体评价任务完成情况系统设计可学习性可用性建议
文本压缩44.56663.5
过程控制系统334.5673
PubTator出版社666667
PPInterFinder2.514.55.53.52
电子FIP5.566665
THOD公司434.5553

针对每个类别链接的问题的中值。利克特量表从1到7,从最差到最好。

文本印刷品(14)

该系统旨在从论文全文中检索描述基因产品亚细胞定位的句子。为了识别这些句子,论文使用Textpresso类别进行搜索,这些类别是包含常见语义概念的术语的“词包”。亚细胞定位搜索使用的类别如下:1-分析术语、2-动词、3-细胞成分术语、4-基因产品名称,外加一个附加类别和5个表和图。匹配的句子必须包含每个类别中的至少一个术语(15). 在BioCreative中,Textpresso被应用于以下选定文件中的细胞定位管理盘状网柄菌使用GO细胞组件本体。为了评估Textpresso搜索的结果,biocurators检查了来自两个不同搜索的句子,即类别4,包括类别1-4和类别5,后者添加了第五个类别。文本印刷结果在句子水平上进行评估,并根据这些句子进行GO注释。在句子水平上,精确性定义为Textpresso检索到的相关句子的百分比(即描述的亚细胞定位),以及从测试文档中检索到的关联句子的召回百分比。在GO注释级别,精度定义为从Textpresso句子中生成的GO注释的百分比,这些句子匹配本体中的黄金标准GO术语或父术语(即正确但粒度较小的术语)。Textpresso在句子级评估数据集上的表现与第4类内部基准测试中的表现相当(精确度和召回率分别为80.1%和30.0%,比较基准测试中句子级表1和4)。4). 此外,两种类别搜索的性能相似(在表4). 基于Textpresso的GO注释结果表明,与手动注释相比,它提供了高精度的注释(比较系统辅助注释中的GO标注级别和手动注释中的表4). 就策展效率而言,一旦生物净化师熟悉系统,Textpresso通过将策展时间减少约2.5倍来提高策展效率(表5). 在所有情况下,召回率都低于准确率,这与(i)系统的技术问题,(ii)缺少类别术语,以及(iii)论文中的陈述正确描述了本地化,但缺少类别术语(即使用少于四个或五个必需的Textpresso类别来描述结果)有关。所涉及的两种生物净化剂的调查结果是不一致的。值得一提的是,其中一位策展人是GO注释的新手,该策展人的调查结果可以反映系统和策展任务的经验(表6).

Phenoscape固化系统(16)

该系统是为了从鱼类和其他脊椎动物的进化文献中筛选表型而设计的。三位生物净化师使用Phenex进行了评估(17)(Phenoscape biocurators使用的管理系统),并使用Phenospace管理系统(PCS)系统(由文本挖掘工具Phenex plus CharaParser组成)。策展任务要求策展人从许多解剖和表型质量本体中以实体和质量术语(EQ)和标识符(ID)的形式捕捉表型特征。计算了基于术语的情商(即严格根据原始描述创建的情商,与任何本体无关)和基于标签的情商的召回率和精确度(即将基于术语的EQ中的术语转换为相关本体中最匹配的类标签的结果)。性能明显低于基准测试中报告的性能(将系统结果与表4和那些表1). 然而,基于术语的PCS性能比生物清除器的性能和类似精度具有更高的召回率,而基于标签的PCS的性能约为生物清除剂性能的一半(将系统单独与手动管理进行比较)表4). 有趣的是,注释者间的一致性很低(两个注释者之间的准确率为31%至77%,召回率为49%至71%),这突出了表型管理的困难。使用Phenex和PCS对生物验证器生成的基于标签的EQ的性能进行了比较,结果表明,文本挖掘工具提高了三种生物验证者中两种的筛选准确性(比较Phenex与Phenex+Charaparser的结果表4). 使用该工具没有提高任务时间方面的治疗效率(表5). 在本次评估中,PCS的失败与(i)将基于术语的情商翻译为基于标签的情商涉及的表型管理任务的固有困难有关,因为没有明确的方法来执行某些翻译;(ii)本体覆盖的不完整性(由于55%的目标EQ类不包括在本体中,CharaParser的最大可能性能将是45%的精度/召回率);以及(iii)未能为CharaParser配备生物验证器使用的所有本体。三次生物测定器调查的结果是不一致的。所有与系统帮助完成任务的能力相关的问题都得到了一贯的低评级(≤3),而工具的可用性得到了一贯的高评级(≥4)(表6). 生物验证器的反馈表明,该工具需要更好地识别自由文本中的实体和质量,以提高系统的召回率(目前“以降低系统的低召回率”)

PubTator出版社(18)

PubTator是一个基于网络的工具,允许生物验证器创建、保存和导出注释,其外观和感觉与PubMed相似。PubTator's依赖于三个最先进的模块:基因提及的GeneTUKit(19),用于规范化的GenNorm(20)和SRG4N(21)用于物种识别。该系统是为两个特定的生物化任务而建立的,即文档分类(检索要整理的相关论文)和生物概念注释。NLM和TAIR数据库的生物馆长参与了评估。NLM生物验证器在提到的水平上工作,并标准化为NCBI基因标识符。TAIR生物验证器在文档级别工作,并按照TAIR自己的命名标准进行规范化。除了基因索引外,TAIR生物验证器还进行了文档分类,任务摘要被标记为与全面管理或其他相关。如所示表5与基线相比,PubTator辅助管理显著提高了效率(管理时间减少了约1.75倍),也略微提高了准确性(与手动管理和系统辅助管理相比表4). 根据参与调查的两个生物验证器的调查,其用户喜欢这个系统:每个类别的中位数得分≥6,所有问题的PubTator评分≥4(表6).

PPInterFinder(22)

该系统用于提取人类蛋白质-蛋白质相互作用的信息。来自PPI数据库的生物保护者对该系统进行了评估,包括来自MINT和BioGRID数据库的生物清除剂。策展场景以蛋白质为中心,重点关注人类激酶,对其注释蛋白质相互作用和磷酸化事件很重要。PPInterFinder在句子水平上进行评估,其中一个真阳性表示系统正确识别的相互作用蛋白实体的数量或比例。结果表明,当基因识别的处理阶段包含在IAT中时,该系统的性能存在显著差异(将PPI算法单独与PPI算法进行比较表4). 还应注意的是,绩效与表1这种差异是由于无法识别或标准化的蛋白质名称,这是在之前的BioCreative工作(BioCreative II和II.5 PPI任务)中已经描述过的问题。业绩较低的部分原因还在于审计师之间的协议(36项协议和19项分歧)较低,这表明注解指南可能并不明确。就保藏效率而言,根据任务时间记录,只有一个生物验证器的信息,它表明手动和系统辅助注释的时间是可比较的(表5). 根据对所涉及的两个生物清除器的调查,该系统帮助完成任务的能力一直被评为非常低的水平(表6). 应用程序设计的几个方面始终处于高端。生物保护者表示需要更精确的结果和更少的假阳性。通过组织这项任务,有可能利用生物验证器反馈和评估的特定方面来改进PPInterFinder系统。此改进考虑的方面包括通过修改关系关键字词典、增强规则、模式和关系识别算法来减少假阳性结果的数量。

eFIP公司(23)

eFIP的主要目标是建议包含与蛋白质-蛋白质相互作用相关的磷酸化蛋白质生物化相关信息的文件。eFIP系统根据摘要包含的相关信息量对摘要进行排序,并提供证据句子和带有磷酸蛋白、交互伙伴和影响词(增加、减少、阻止等)的摘要表。eFIP集成了eGRAB等文本挖掘工具(24)用于文档检索和名称消歧,RLIMS-P(25)对于磷酸化信息的提取,PPI模块用于检测涉及磷酸化蛋白的PPI,影响模块用于检测句子中磷酸化和交互事件之间的时间和因果关系。在BioCreative 2012中,计划了以下两项任务:(i)以PMID为中心任务,给定一组文件来识别可管理的文件(那些含有与PPI相关的磷酸化蛋白的文件),以及相应的证据句子和(ii)a基因中心分类任务,给定一个基因,验证eFIP检索到的文档的相关性(检索到的文章是否包含查询蛋白的磷酸化和相关PPI?)。Reactome、SGD和Merck Serono的生物馆长参与了评估。对eFIP在文档检索、句子级信息提取和文档排序方面的性能进行了评估。除了给定数据集中的文档外,还要求用户通过eFIP输出验证相关基因的排名。在句子和文档级别,eFIP实现了更高的精度(与系统辅助的手动管理相比表4)但召回率低于手动管理(在许多情况下,一个生物鉴定器忽略了多余的注释)。Cohen-kappa系数表明,种植者之间的一致性是显著的(26)0.77(54个协议/7个分歧),eFIP通过减少约2.5倍的管理时间提高了管理效率(表5). eFIP对文档排名的绩效评估由nDCG(标准化折现累积收益)根据93%至100%的摘要排名列表进行测量(表4). 一般来说,导致eFIP中精确性和召回率下降的因素主要归因于PPI模块:报告除蛋白质以外的实体之间的相互作用,未能检测复杂句子的方向性,在少数情况下无法识别交互事件。参与评估的三位生物化学家的调查表明,用户喜欢该系统(表6). 值得一提的是,类别系统完成任务的能力中的所有问题都得到了持续的高评分(≥5)。eFIP的优势之一似乎是易于在文献中找到相关文章,因为此活动的手动数据集选择对于组织者来说非常具有挑战性,因为此工具捕获了复杂的关系。

T型罩(27)

该系统收集已证明与三种心血管疾病相关的基因列表——高血压、肥胖和糖尿病,最后一种疾病被指定为1型或2型。它可以用来确认基因与这些疾病的关联,并为进一步研究提供证据。T-HOD依靠最先进的文本挖掘工具进行基因识别(28)用于疾病识别和疾病-基因关系提取(29). 对于BioCreative 2012,计划了以下两项任务:(i)一项以PMID为中心的任务,给定一组文档,识别具有基因-疾病关系的句子;(ii)一项基因为中心的工作,给定一个基因,验证T-HOD输出的相关性(检索到的文章是否包含给定基因的基因-疾病关联?)。辉瑞、Reactome、MGI和GAD的生物馆长参与了评估。对于以PMID为中心的方法中的性能指标的计算,摘要中提到的关于基因-疾病关系的信息,包括基因术语、基因ID和描述该关系的句子,都必须与金标准精确一致,才能成为真正的阳性。在以基因为中心的方法中,只有基因术语必须正确才能被视为真正的阳性。在评估中,T-HOD在文档级别的精确度与作为基准结果报告的精确度相似,但召回率较低(相比之下表1中仅包含系统文档级别表4). 有趣的是,与金标准相比,系统单独的性能显著高于生物测定器的设置(将系统单独与系统辅助注释进行比较表4). 参展商之间的总体一致性较低,为57.47%,这可以部分解释业绩结果。系统在以PMID为中心的评估中的性能低于以基因为中心的任务,这主要是因为实体识别(针对基因和疾病)和关系提取都必须正确才能获得良好的性能(表4). 在这些任务中,基因术语识别和标准化是最困难的。此外,金标准中存在一些跨句子的基因-疾病关系,但该系统尚未支持。就管理效率而言,只有一种生物净化剂报告显著增加了4倍(表5). 这个生物验证器只检查了系统建议的阳性样本,没有检查任何假阴性。然而,鉴于人工养护的时间也比其他生物养护器短得多(其他三种生物养护器为60分钟,而其他三种为110–140分钟,表5). 根据对参与评估的四个生物测定器的调查,系统帮助完成任务的能力中位数最低,而学习应用程序和可用性的能力最高(表6). 用户的一些建议包括扩展到以非疾病为中心的查询,将范围扩展到其他疾病,改进界面的某些方面(例如,显示窗口不能自动调整到浏览器的适当大小;用户无法返回重新考虑他们的上一个操作),并提供更多文档。T-HOD正在根据这些建议开发一个增强版。

生物创意2012研讨会

在2012年4月4日至5日于华盛顿特区举行的研讨会上,每个参与团队都介绍了研讨会前评估的结果。此外,基于BioCreative III演示会话的成功,我们扩展了该会话,以包括用户的可用性评估。小组展示了他们的系统,参加会议的生物验证器有机会尝试这些系统。每节课30分钟。我们通过“材料和方法”部分中描述的相同用户调查收集了意见。我们为UAG招募了新成员来协助这项工作。每个成员都被分配了两个系统,以确保所有系统都经过测试。出席会议的其他生物净化剂也可以通过选择他们选择的系统进行测试。在测试结束时,用户必须尽可能填写相同的用户调查,并提供他们对系统的第一印象。在本次活动中,我们收集了22份调查回复。结果将包含在下一节所示的分析中。尽管此任务的指标中没有报告,但另外两个小组演示了他们的系统:ToxiCat(30)和ODIN(8)他们都参加了研讨会的分诊挑战(第一轨)。调查答复可在补充表1.

评价结果的总体分析

请注意,我们知道该分析的局限性,即每个系统的生物净化器数量有限,以及系统执行的任务性质差异很大。例如,我们无法直接比较系统之间的性能指标。然而,我们可以得出一些有用的观察结果,下面将对此进行描述。研讨会前评估的绩效结果表明,一套系统能够通过显著加快管理任务来提高管理效率(比手动执行快1.7到2.5倍,表5). 至少在一种情况下,熟悉系统输出和管理工具是实现效率最大化的关键(在Textpresso系统中,一旦熟悉了管理任务,一个生物验证器就成为新手)。与手动性能相比,一些系统能够提高注释准确性(例如PubTator、eFIP和PCS,将系统辅助注释与手动注释进行比较表4). 就宣布者之间的协议而言,导致某些系统存在显著差异的因素是生物鉴定员在管理任务上的专业知识(正如GO注释中所发生的那样),策展任务的固有困难,如表型注释和不遵循所提供的注释指南的情况(例如,注释者被要求标记所有句子,但他/她选择选择了一个有代表性的句子)。结果还表明,许多系统依赖于多个不同文本挖掘模块的组合,每个模块的性能如何显著影响整个系统的性能(PPInterFinder中添加基因提及/归一化算法显著降低了系统的性能,相比之下表4).

我们假设,与总体满意度测量高度相关的问题反映出对一般生物清除剂的更大重要性;如果一个系统在一个问题上获得高分,而在总体满意度上得分较低,那么这个问题对生物验证者的经验可能并不特别重要。根据中的调查问卷http://ir.cis.udel.edu/biocreative/survey.html,表7根据相关性程度对前10个调查问题进行排名(Kendall的tau等级相关性(31),因为Likert量表是离散的),在他们对三个总体满意度测量结果的回答中:问题2(生物验证者对系统的主观评价)、7(生物验验者是否会推荐系统)和问题1,关于生物验证器是否喜欢使用系统。该排名计算如下:我们首先计算每个问题的每个系统的中位数评级,然后根据该中位数对每个问题的系统进行排名。我们通过问题2、7和1的中位数评级计算该排名和系统排名之间的Kendallτ相关性,然后取三个τ相关性的平均值。请注意,这三个问题本身高度相关(τ>0.9,这与P(P)< 0.01). 这是对所有填报调查(共38份)进行的。从表中可以清楚地看出,任务完成非常重要,其次是系统的可用性。

表7

前10个问题与总体满意度的相关性程度

问题相关性
Q4:个人经历0.719
Q10:任务完成效率0.622
问题8:任务完成速度0.569
问题5:完成任务的能力0.568
Q9:任务完成有效性0.53
问题23:术语的一致使用0.473
问题6:灵活性0.443
问题25:有用的错误消息0.438
问题15:学习执行任务0.431
问题3:易用性0.431

最后,表8对每一组问题(总体评估、任务完成、系统设计、可学习性、可用性和建议)的每个系统进行总体评分,通过取组中所有问题的所有生物清除剂评分的中位数计算得出:总体评估(问题1-6的中位数),任务完成情况(问题8-10中位数)、系统设计(问题11-14中位数),可学习性(问题15-19中位数)和可用性(问题20-25中位数)以及建议(仅问题7)。虽然系统在设计、可学习性和可用性方面通常得分很高,但从这个表中可以清楚地看出,完成任务对生物净化师的整体体验有多重要。

表8

按类别对每个系统进行总体评级

主观测量(每个部分的总体中位数)
系统总体评价任务完成情况系统设计可学习性可用性建议
PubTator出版社65.5666.57
电子FIP666675.5
塔格托(Tagtog)555564.5
文本印刷品455564.5
过程控制系统436664
PPInterFinder42.55553
T型罩434553

针对每个类别链接的问题的中位数。利克特量表从1到7,从最差到最好。该系统仅在研讨会上进行了审查。

所有团队都在一定程度上受益于参与第三轨道,特别是来自生物测定器的反馈(研讨会前和研讨会上)。因此,一些团队已经改进或正在改进他们的系统,其他团队已经与新的社区接触。例如,在PPInterFinder中,对“关系关键字”列表进行了优化,以减少误报,并在PPI提取方法中添加了新模式(22). PubTator出版社(18)正在计划扩大涵盖的生物概念,以及处理全长文章,T-HOD正在扩大疾病覆盖范围(27). 最后,Textpresso与TAIR合作,以类似的方式评估Textpresso在细胞成分管理方面的表现拟南芥基因产物(14).

讨论

当前的IAT从多个后勤方面面临着巨大的挑战:招募和协调能够正确评估系统的生物清除剂;数据集的选择;系统准备就绪和数据收集、格式化和处理问题。然而,这对开发人员和用户来说都是一次很棒的体验。用户接触到可能有助于他们管理的工具;开发人员与潜在用户互动,了解他们的真实需求。我们想指出的是,这项活动涵盖了与不同生物化策略相关的不同层次的注释类型:以文档为中心和以生物技术为中心的生物化,以及所获得结果的不同粒度层次:来自没有文本证据的实体之间的纯注释关系,以及短语、句子、段落和整个文档层面的文本证据。

下面我们将根据从这项活动中吸取的教训介绍一些建议。

什么是生物化任务?

我们发现,在生物化学家和文本挖掘小组之间就什么构成生物化成任务达成一致意见很重要,特别是对于那些与生物化成小组不密切合作的小组。至少有三个方面需要考虑,这可能会影响文本挖掘系统的实际使用:(i)一般来说,文本挖掘系统应该更加关注现有注释工作流中使用的注释指南。我们发现,在某些情况下,即使团队提供了指南,这些指南也不一定遵循代表性数据库使用的标准(例如,注释类型的定义不同)。一方面,这可能会影响系统的性能,因为生物验证器必须按照新的指南进行“再培训”,但倾向于遵循自己的指南,但更重要的是,系统的输出可能与注释标准不兼容,因此可能无法使用;(ii)另一个关键方面是系统提供灵活选项以改进对提取数据的解释的能力,因为这是生物化的关键。例如,显示一个没有指针的孤立句子来探索额外的上下文信息,这使得人类很难解释和验证文本挖掘结果,第三个是输出验证方面。许多文本挖掘系统需要在句子级验证结果(在许多情况下验证冗余信息),而生物鉴定器则在摘要/文档级进行决定。在此背景下,实施句子/文本排序方法以选择信息量更大、更具代表性的句子变得至关重要。我们计划在下一次BioCreative中为团队提供更多关于这些主题的指导。

要比较什么?

在这个“实验”中,我们比较了手动与系统辅助管理,以确定一个共同的基线,但我们知道,这可能并不代表生物鉴定员如何在其管理工作流程中进行文献管理,因此可能会影响手动任务的效率(完成任务所需的时间)。我们认为,这种方法仍然非常有用,加上生物鉴定人的反馈,我们应该能够更好地规划BioCreative IV。我们非常积极地发现,许多系统(6个中有4个)在这次比较中加快了鉴定速度(表5). 此外,我们有一个案例,比较了管理工具和带有文本挖掘模块的相同管理工具(无论是否带有CharaParser模块的Phenex)。然而,如果想要吸引来自不同数据库的各种用户来尝试该系统,那么在BioCreative环境中很难实现该选项。或者,如果系统可以提供一个界面,用户可以在其中激活或停用文本挖掘工具的使用,同时保留其他网站功能,那么结果可能会很有趣。多梅奥(32)是注释系统的一个示例,在该系统中,用户可以手动注释文本或使用选定的本体集自动注释。在这两种情况下,注释都以相同的格式(RDF)保存,提供了一种轻松计算度量的方法。这也可以更好地比较任务时间。在这方面,ODIN(8)是一种能够记录生物净化剂活动的生物净化系统。我们将在未来与UAG的讨论中探讨其中一些选项。

系统适应性

这项评估显示了如何调整不同的系统来帮助不同的数据库兴趣。对于这个特定的实验,许多系统都根据评估它们的管理小组进行了调整,例如,Textpresso将该系统用于dictyBase的文章管理,这包括与数据库密切协调,以确定有关粘液菌以及导入基因名称和同义词词汇等。同样,PubTator包含了TAIR的基因命名法,以用于此数据库,而Charaparser是为了与Phenex管理系统合作而建立的。我们应该记住,即使系统可以用于数据库,它们也可能需要一些小的开发来将其适应不同的用户组。因此,我们将非常注意在BioCreative IV中为此分配足够的时间。

轨道III的灵活性

为了更好地了解不同工具的情况,我们为任何生物成型任务打开了这条轨道。事实上,表1显示了参与系统提出的任务的多样性。该活动旨在在许多方面具有灵活性。首先,关于指标,我们要求团队为其系统建议适当的指标。大多数系统报告了不同级别(句子、文档等)的召回率、精确度和F-measure。此外,还提出了一些用于文件排名以及编者间协议的特殊措施,这些措施可能会成为未来的标准衡量标准。第二,关于系统输入,最初我们建议采用以PMID为中心的方法来管理一组文档,执行任务,因为我们希望将系统公开给各种示例。然而,管理方法各不相同,因此我们也允许其他类型的输入。例如,在PCS中,输入是NeXML格式的表型字符列表(33)而其他系统则以基因为中心(例如PubTator、eFIP)或以疾病为中心(如T-HOD)。最后,我们没有为系统输出或接口功能要求任何特定格式。

这种灵活性虽然可能会增加任务规划和数据分析方面的工作量,但为观察最先进系统所使用的方法、标准和功能提供了一种很好的方法。我们相信,这些结果将有助于为BioCreative IV挑战选择适当的指标和标准。

接合生物滤器

生物创意2012年IAT研讨会参与团队的反馈表明,生物化学家的参与是该活动最有价值的方面之一。此外,招聘管理任务领域专家至关重要。在这方面,IAT的协调员联系了许多小组,并与小组进行了协商,试图为每个系统找到合适的生物净化剂,但时间框架、缺乏明显的奖励和其他承诺是阻碍生物净化剂参与研讨会前评估的一些障碍。基于这一经验,我们现在对生物清除剂所需的承诺有了更好的认识,我们希望UAG不仅能为BioCreative IV规划提供建议,还能够提供如何招募生物清除器的见解,甚至成为生物清除员的来源。在这方面,UAG在研讨会期间直接接触活动是一项资产。

最后,尽管存在所有挑战、障碍和可能的错误,生物鉴定员和文本挖掘团队都对未来参与这项活动表示了兴趣。IAT作为一种媒介,用于试验不同的方法,以正式评估交互系统。与BioCreative III IAT的经验类似,我们希望所学到的经验教训将有助于塑造未来的BioCreative IV任务,不仅有助于改进IAT,还有助于改善涉及生物成型的挑战。

补充数据

补充数据可在数据库在线。

补充数据:

致谢

作者想感谢所有参与此次活动的团队和生物净化师。

基金

国家科学基金资助DBI-0850319号文件; 美国国立卫生研究院拨款5G08LM010720-02; Z.L.和W.J.W.的参与得到了国家医学图书馆国立卫生研究院院内研究计划的支持。M.K的参与得到了CONSOLIDER拨款CSD2007-00050和MICROME拨款222886-2的支持。

利益冲突。未申报。

工具书类

1Burge S、Attwood TK、Bateman A等,《生物保护者和生物化:21世纪挑战调查》。数据库。2012;2012物品ID bar059;doi:10.1093/database/bar059。[PMC免费文章][公共医学][谷歌学者]
2Hirschman L、Burns GA、Krallinger M等。生物化工作流的文本挖掘。数据库。2012;2012物品ID bas020;doi:10.1093/database/bas020。[PMC免费文章][公共医学][谷歌学者]
三。Hirschman L,Yeh A,Blaschke C,Valencia A。生物CreAtIvE概述:生物信息提取的关键评估。BMC生物信息学。2005;6:S1。 [PMC免费文章][公共医学][谷歌学者]
4.Krallinger M、Morgan A、Smith L等。生物短信系统评估:第二个生物创意社区挑战概述。基因组生物学。2008;9:S1。 [PMC免费文章][公共医学][谷歌学者]
5Leitner F、Mardis SA、Krallinger M等,《生物创意II.5概述》。IEEE/ACM传输。计算。生物信息。2010;7:385–399.[公共医学][谷歌学者]
6Arighi C、Lu Z、Krallinger M等。生物创意III研讨会概述。BMC生物信息学。2011;12:S1。 [PMC免费文章][公共医学][谷歌学者]
7Arighi C、Roberts P、Agarwal S等。生物创意III互动任务:概述。BMC生物信息学。2011;12:S4。 [PMC免费文章][公共医学][谷歌学者]
8Rinaldi F、铁线莲S、Garten Y等。使用ODIN进行PharmGKB再验证实验。数据库。2012;2012物品ID bas021;doi:10.1093/database/bas021。[PMC免费文章][公共医学][谷歌学者]
9Chin JP、Diehl VA、Norman KL。ACM CHI计算机系统人为因素会议记录。纽约:1988年。人机界面用户满意度测量仪的研制;第213-8页。[谷歌学者]
10Likert R.一种测量态度的技术。架构(architecture)。精神病。1932:1–55. [谷歌学者]
11Lewis JR.。IBM计算机可用性满意度问卷:心理测量评估和使用说明。国际人类计算杂志。互动。1995;7:57–78. [谷歌学者]
12戴维斯FD。感知有用性、感知易用性和用户对信息技术的接受度。MIS季刊。1989;13:319–40. [谷歌学者]
13Lund AM。使用USE问卷测量可用性。技术通信可用性协会SIG新闻稿。2001:2. [谷歌学者]
14Van Auken K,Fey P,Berardini TZ,et al.生物化工作流中的文本挖掘:在WormBase、dictyBase和TAIR中的文献管理应用程序。数据库。2012;2012物品ID bas040;doi:10.1093/database/bas040。[PMC免费文章][公共医学][谷歌学者]
15Van Auken K,Jaffery J,Chan J等。蛋白质亚细胞定位的半自动管理:一种基于文本挖掘的基因本体论(GO)细胞成分管理方法。BMC生物信息学。2009;10:228. [PMC免费文章][公共医学][谷歌学者]
16崔C,Balhoff J,Dahdul W,et al。2012年生物创意研讨会论文集。美国华盛顿特区:2012年。用于系统发育系统文献管理的PCS;第144-151页。[谷歌学者]
17.Balhoff JP、Dahdul WM、Kothari CR等。Phenex:表型多样性的本体论诠释。公共科学图书馆一号。2010;5:e10500。 [PMC免费文章][公共医学][谷歌学者]
18Wei C-H,Harris BR,Li D,等。使用文本挖掘工具加速文献管理:使用PubTator管理PubMed摘要中的基因的案例研究。数据库。2012;2012物品ID bas041;doi:10.1093/database/bas041。[PMC免费文章][公共医学][谷歌学者]
19.Huang M,Liu J,Zhu X.GeneTUKit:用于文档级基因规范化的软件。生物信息学。2011;27:1032–1033. [PMC免费文章][公共医学][谷歌学者]
20魏C、黄一、徐毅、高H。第九届IEEE生物信息学和生物工程国际会议研讨会:语义生物医学计算:2009年。台湾台中:2009年。基于相似性推理网络和消歧挖掘的生物医学名称实体规范化;第461-466页。[谷歌学者]
21Wei C-H,Kao H-Y,Lu Z.SR4GN:用于基因规范化的物种识别软件工具。公共科学图书馆一号。2012;7:e38460。 [PMC免费文章][公共医学][谷歌学者]
22Raja K、Subramani S、Natarajan J.PPInterFinder-从文献中提取人类蛋白质因果关系的挖掘工具。数据库。2012;2012物品ID bas052;doi:10.1093/database/bas052。[PMC免费文章][公共医学][谷歌学者]
23Tudor CO,Arighi CN,Wang Q,等。磷酸化蛋白质相互作用网络文本挖掘的eFIP系统。数据库。2012;2012物品ID bas044;doi:10.1093/database/bas044。[PMC免费文章][公共医学][谷歌学者]
24Tudor C、Schmidt C、Vijay-Shanker K.eGIFT:从文献中挖掘基因信息。BMC生物信息学。2010;11:418. [PMC免费文章][公共医学][谷歌学者]
25Hu ZZ,Narayanaswamy M,Ravikumar KE,等。基于规则系统的蛋白质磷酸化的文献挖掘和数据库注释。生物信息学。2005;21:2759–2765.[公共医学][谷歌学者]
26Landis R,Koch C.分层kappa型统计在评估多个观察者之间多数同意中的应用。生物计量学。1977:363–374.[公共医学][谷歌学者]
27.戴海杰,吴JC,蔡瑞特,等。T-HOD:文本型高血压、肥胖、糖尿病候选基因数据库。数据库。2012;2012《生物创意研讨会论文集》,华盛顿特区,第121-131页。[PMC免费文章][公共医学][谷歌学者]
28戴海杰、张永春、蔡RT-H、徐伟林。使用马尔可夫逻辑网络整合基因规范化阶段和共同参考解析。生物信息学。2011;27:2586–2594.[公共医学][谷歌学者]
29蔡锐,赖P-T,戴H-J,等。高血压基因:利用位置和自动生成的模板特征从生物医学文献中提取关键高血压基因。BMC生物信息学。2009;10:S9。 [PMC免费文章][公共医学][谷歌学者]
30Vishnyakova D、Pasche E、Ruch P。2012年生物创意研讨会会议记录。美国华盛顿特区:2012年。选择用于比较毒理基因组数据库管理的相关文章;第31-38页。[谷歌学者]
31Kendall M.等级相关性的新度量。生物特征。1938;30:81–89. [谷歌学者]
32Ciccarese P、Ocana M、Clark T。使用DOMEO对科学出版物进行开放语义注释。J.生物识别。语义学。2012;:S1。 [PMC免费文章][公共医学][谷歌学者]
33Vos RA、Balhoff JP、Caravas JA等。NeXML:比较数据和元数据的丰富、可扩展和可验证表示。系统。生物。2012;61:675–689. [PMC免费文章][公共医学][谷歌学者]

文章来自数据库:生物数据库与治疗杂志由以下人员提供牛津大学出版社