计算机工程与应用››2024,第60卷››发行(10): 121-131.内政部:10.3778/j.issn.1002-8331.2301-0152

模式识别与人工智能 • 上一篇   下一篇

两阶段问答范式的生物医学事件触发词检测

行帅,熊玉洁,苏前敏,黄继汉  

  1. 1上海工程技术大学 电子电气工程学院,上海 201620
    2上海中医药大学 药物临床研究中心,上海 201203
  • 出版日期:2024-05-15 发布日期:2024-05-15

基于两阶段问答范式的生物医学事件触发检测

邢帅、熊玉杰、苏倩敏、黄继涵  

  1. 1.上海工程科技大学电子与电气工程学院,上海,201620,中国
    2.上海中医药大学药物临床研究中心,上海,201203
  • 在线:2024-05-15 出版:2024-05-15

摘要:现有的生物医学事件触发词检测存在以下缺陷:保留了与触发词无关的冗余信息;忽略了实体与事件之间的潜在关联性;传统方法容易受到数据稀缺性的影响。针对上述问题,提出了一种两阶段问答范式的生物医学事件触发词检测方法。在事件类型识别阶段,采用基于句法距离的注意力捕获更有意义的上下文特征,排除无关信息的干扰;为了有效利用实体中的潜在特征,采用全局统计的单词-实体-事件共现特征,指导事件类型感知注意力挖掘词与事件之间的强关联性。在触发词定位阶段,根据识别出的事件类型,制定问题回答该事件对应的触发词索引,从而利用丰富的问答数据库实现数据增强。在MLEE公司语料库上的结果表明,两阶段问答范式、句法距离和事件类型感知注意力都有效地提升了模型性能,所提出的模型取得了81.39%F1分数,并在多个事件类型上的详细结果均优于其他基线模型。

关键词: 生物医学事件, 触发词检测, 句法距离, 单词-实体-事件共现特征, 两阶段问答范式

摘要:现有的生物医学事件触发检测方法存在以下缺陷:保留了与触发无关的冗余信息;忽略实体和事件之间的潜在相关性;传统方法容易受到数据稀缺的影响。针对上述问题,提出了一种基于两阶段问答范式的生物医学事件触发检测方法。在事件类型识别阶段,为了排除无关信息的干扰,允许基于句法距离的注意捕获更有意义的上下文特征。为了有效利用实体中的潜在特征,使用基于全局统计的单词-事件共现特征来引导事件类型感知注意,探索单词和事件之间的强大关系。在触发器定位阶段,根据识别出的事件类型问题回答句子中事件的触发器索引,从而利用丰富的问答数据库实现数据增强。在MLEE语料库上的结果表明,两阶段问答范式、句法距离注意和事件类型感知注意有效地提高了模型的性能,并且该模型达到了81.39%的F1-核心,在多事件类型的详细结果方面优于其他基线模型。

关键词: 生物医学活动, 触发检测, 句法距离, 单词-单词-事件共现功能, 两阶段问答范式