计算机工程与应用››2022,第58卷››发行(18): 218-226.内政部:10.3778/j.issn.1002-8331.2102-0110

模式识别与人工智能 • 上一篇   下一篇

面向时钟领域的BERT-LCRF系统命名实体识别方法

唐焕玲,王慧,隗昊,赵红磊,窦全胜,鲁明羽  

  1. 1山东工商学院 计算机科学与技术学院,山东 烟台 264005
    2山东工商学院 信息与电子工程学院,山东 烟台 264005
    三。山东省高等学校协同创新中心:未来智能计算,山东 烟台 264005
    4山东省高校智能信息处理重点实验室山东工商学院),山东 烟台 264005
    5.大连海事大学 信息科学技术学院,辽宁 大连 116026
  • 出版日期:2022-09-15 发布日期:2022-09-15

面向时钟域的BERT-LCRF命名实体识别方法

唐欢玲、王辉、魏浩、赵洪磊、窦全生、卢明宇  

  1. 1.山东工商大学计算机科学与技术学院,山东烟台,264005,中国
    2.山东工商大学信息与电子工程学院,山东烟台,264005,中国
    3.山东省高等学校创新中心:未来智能计算,山东烟台264005
    4.山东省高校智能信息处理重点实验室(山东工商大学),中国山东省烟台市264005
    5.大连海事大学信息科学与技术学院,大连,辽宁116026
  • 在线:2022-09-15 出版:2022-09-15

摘要:命名实体识别是构建时钟领域知识图谱的关键步骤,然而目前时钟领域存在标注样本数量少等问题,导致面向时钟领域的命名实体识别精度不高。为此,利用预训练语言模型BERT(误码率)进行时钟领域文本的特征提取,利用线性链条件随机场(线性CRF)方法进行序列标注,提出了一种BERT-LCRF系统的命名实体识别模型。对比实验结果表明,该模型能够充分学习时钟领域的特征信息,提升序列标注精度,进而提升时钟领域的命名实体识别效果

关键词: 命名实体识别, 预训练语言模型, 条件随机场, 自注意力机制, 深度学习

摘要:命名实体识别是构建时钟域知识图的关键步骤。然而,当前的时钟域存在标记样本数量少等问题,导致时钟域中命名实体识别的准确性较低。为此,本文使用预训练语言模型BERT来提取时钟域中文本的特征,然后使用线性链条件随机场(linear-CRF)方法进行序列标记,并提出了一种BERT-LCRF命名实体识别模型。对比实验结果表明,该模型能够充分学习时钟域的特征信息,提高序列标注的准确性,进而提高时钟域命名实体识别的效果。

关键词: 命名实体识别, 预培训语言模型, 条件随机场, 自动关注机制, 深度学习