计算机工程与应用››2023,第59卷››发行(14): 158-165.内政部:10.3778/j.issn.1002-8331.2205-0400

模式识别与人工智能 • 上一篇   下一篇

结合知识图谱和文本层次结构的词义消歧方法

曹渝昆,金成坤,唐艺嘉,魏子越,李云峰  

  1. 1上海电力大学 计算机科学与技术学院,上海 201306
    2中国商飞上海航空工业集团)有限公司 信息中心,上海 201203
  • 出版日期:2023-07-15 发布日期:2023-07-15

结合知识图和文本层次的词义消歧

曹玉坤、金成坤、唐一佳、魏子月、李云峰  

  1. 1.上海电力大学计算机科学与技术学院,中国上海201306
    2.中国商飞上海航空工业(集团)有限公司信息技术中心,上海,201203
  • 在线:2023-07-15 出版:2023-07-15

摘要:当前带监督的词义消歧模型利用不同词义的注释信息和预训练的语言模型已经得到了较高的消歧结果。但是带监督的词义消歧模型的语义数据需要人工手动标注,使得带监督的词义消歧模型的扩展性较差。提出了一种结合知识图谱和文本层次结构的双编码器词义消歧方法,通过引入知识图谱中的结构化知识以补充更多的扩展语义信息,采用上下文输入文本的层次结构描述单词和短语的含义,并构筑基于BERT(误码率)的双编码器,引入图注意力机制来降低上下文输入文本中的噪声信息,从而提高短语形式目标词的消歧准确率,最终提高方法的消歧效果。通过在5个测试数据集中与最新的9个对比算法的对比,该方法的消歧准确率大都优于对比算法,取得了较好的效果。

关键词: 词义消歧, 知识图谱, BERT、, 图注意力机制

摘要:现有的监督词义消歧模型利用不同词义的标注信息和预训练语言模型,取得了较高的消歧效果。然而,由于难以获取用于手动标注的语义数据,有监督的词义消歧模型的可扩展性较差。本文提出了一种结合知识图和文本层次结构的双编码器词义消歧方法,通过在知识图中引入结构化知识来补充更多扩展的语义信息,利用上下文输入文本的层次结构来描述单词和短语的含义,并构造了一种基于BERT的双编码器,引入图形注意网络来减少上下文输入文本中的噪声信息,从而提高短语形式目标词的消歧准确性,最终提高该方法的消歧效果。通过在五个测试数据集上与最新的九种比较算法进行比较,该方法的消歧精度大多优于比较算法,取得了较好的结果。

关键词: 词义消歧, 知识图, BERT、, 图形注意网络