计算机工程与应用››2024,第60卷››问题(9): 237-243.内政部:10.3778/j.issn.1002-8331.2302-0396

模式识别与人工智能 • 上一篇   下一篇

混合特征及多头注意力的中文短文本分类

江结林,朱永伟,许小龙,崔燕,赵英男  

  1. 1南京信息工程大学 软件学院,南京 210044
    2南京信息工程大学 江苏省大气环境与装备技术协同创新中心,南京 210044
    三。南京特殊教育师范学院 数学与信息科学学院,南京 210038
    4南京信息工程大学 计算机学院、网络空间安全学院,南京 210044
  • 日本:2024-05-01 发布日期:2024-04-29

具有混合特征和多头部注意的中文短文本分类

姜杰林、朱永伟、徐小龙、崔燕、赵英南  

  1. 1.南京信息科技大学软件学院,南京210044
    2.南京信息科技大学江苏省大气环境与设备技术协同创新中心,中国南京210044
    3.南京特殊教育师范大学数学与信息科学学院,南京210038
    4.南京信息科技大学计算机科学与工程学院,南京210044
  • 在线:2024-05-01 出版:2024-04-29

摘要:传统的短文本分类研究方法存在两方面不足,一是不能全面地表示文本的语义信息,二是无法充分地提取和融合文本全局和局部信息。基于此,提出一种混合特征及多头注意力(HF-MHA)的中文短文本分类方法。该方法利用预训练模型计算中文短文本的字符级向量和词级向量表示,以得到更全面的文本特征向量表示;采用多头注意力机制捕捉文本序列中的依赖关系,以提高文本的语义理解;通过卷积神经网络分别提取两种向量表示的特征,并将其融合为一个特征向量,以整合文本的全局和局部信息;通过输出层得到分类结果。在三个公开数据集上的实验表明,HF-MHA公司能够有效地提升中文短文本分类的性能。

关键词: 中文短文本分类, 注意力机制, 字符级向量

摘要:传统的短文本分类方法有两个缺点:不能充分表示文本的语义信息,不能有效地提取和整合文本的全局和局部信息。在此基础上,提出了一种混合特征和多头部注意的中文短文本分类方法(HF-MHA)。该方法使用预训练模型计算中文短文本的字符级和单词级向量表示,以获得更全面的文本特征向量表示。然后采用多头部注意机制捕获文本序列中的依赖关系,以提高对文本的语义理解。它使用卷积神经网络分别提取两种矢量表示的特征,并将其集成到一个特征向量中,以集成文本的全局和局部信息。最后,通过输出层得到分类结果。在三个公共数据集上的实验表明,HF-MHA可以有效地提高中文短文本分类的性能。

关键词: 中文短文本分类, 注意机制, 字级矢量, 字符级向量