摘要:现有的生物医学事件触发词检测存在以下缺陷:保留了与触发词无关的冗余信息;忽略了实体与事件之间的潜在关联性;传统方法容易受到数据稀缺性的影响。针对上述问题,提出了一种两阶段问答范式的生物医学事件触发词检测方法。在事件类型识别阶段,采用基于句法距离的注意力捕获更有意义的上下文特征,排除无关信息的干扰;为了有效利用实体中的潜在特征,采用全局统计的单词-实体-事件共现特征,指导事件类型感知注意力挖掘词与事件之间的强关联性。在触发词定位阶段,根据识别出的事件类型,制定问题回答该事件对应的触发词索引,从而利用丰富的问答数据库实现数据增强。在MLEE公司语料库上的结果表明,两阶段问答范式、句法距离和事件类型感知注意力都有效地提升了模型性能,所提出的模型取得了81.39%F1分数,并在多个事件类型上的详细结果均优于其他基线模型。
行帅, 熊玉洁, 苏前敏, 黄继汉. 两阶段问答范式的生物医学事件触发词检测[J] ●●●●。计算机工程与应用, 2024, 60(10): 121-131.
邢帅、熊玉杰、苏倩敏、黄继涵。基于两阶段问答范式的生物医学事件触发检测[J]。计算机工程与应用,2024,60(10):121-131。