计算机工程与应用››2024,第60卷››发行(10): 105-112.内政部:10.3778/j.issn.102-83312302-0237

•模式识别和人工智能• 以前的文章   下一篇文章

基于深度标签辅助分类任务的层次标签文本分类方法

曹玉坤、魏子月、唐一佳、金成坤、李云峰  

  1. 1.上海电力大学计算机科学与技术学院,中国上海201306
    2.中国商飞上海航空工业(集团)有限公司信息技术中心,上海,201203
  • 在线:2024-05-15 出版:2024-05-15

深层次标签辅助分类任务的层次标签文本分类方法

曹渝昆,魏子越,唐艺嘉,金成坤,李云峰  

  1. 1上海电力大学 计算机科学与技术学院,上海 201306
    2中国商飞上海航空工业集团)有限公司 信息中心,上海 201203

摘要:分层标签文本分类是自然语言处理中的一项具有挑战性的任务,需要将每个文档正确地分类为与层次结构相对应的多个标签。然而,在标签集中,标签中包含的语义信息不足,加上分类为深层标签的文档数量较少,深层标签训练不足,导致标签训练中存在严重的不平衡问题。针对上述问题,提出了一种基于深度标签辅助分类任务(DLAC)的双通道分层标签文本分类方法。该方法提出了一种深层标签辅助分类器,该分类器有效地利用与父标签节点对应的深层标签的文本特征(即浅层标签的丰富特征),基于标签的语义增强来提高深层标签的分类性能。在三个数据集上的十一种算法的实验结果表明,该模型有效地提高了深层标签的分类性能,取得了较好的结果。

关键词: 分层标签文本分类, 标签层次结构, 全球标签分类频道, 深度标记辅助分类通道

摘要:层次标签文本分类是自然语言处理领域中一项具有挑战性的任务,每个文档需要被正确分类到对应具有层次结构的多个标签中。然而在标签集中,由于标签包含的语义信息不充分,同时被归类到深层次标签的文档数量过少,深层次标签训练不充分,导致显著的标签训练不平衡问题。基于此,提出了深层次标签辅助分类任务的层次标签文本分类方法(DLAC)该方法提出了一种深层次标签辅助分类器,在标签语义增强的基础上有效利用文本特征与深层次标签对应的父标签结点即浅层次标签的丰富特征)来提升深层次标签的分类性能。与11种算法在三个数据集上的对比实验结果表明,模型能够有效提升深层次标签的分类性能,并取得良好效果。

关键词: 层次标签文本分类, 标签层次结构, 全局标签分类通道, 深层次标签辅助分类通道