计算机工程与应用››2024,第60卷››发行(8): 165-172.内政部:10.3778/j.issn.1002-8331.2302-0088

模式识别与人工智能 • 上一篇   下一篇

双元双模态下二次门控融合的多模态情感分析

刘青文,买日旦·吾守尔,古兰拜尔·吐尔洪  

  1. 新疆大学 信息科学与工程学院,乌鲁木齐 830046
  • 出版日期:2024-04-15 发布日期:2024-04-15

多模态情感分析中双双模态与双G融合

刘庆文、迈里丹·乌舒尔、古兰拜尔·图尔洪  

  1. 新疆大学信息科学与工程学院,乌鲁木齐830046
  • 在线:2024-04-15 出版:2024-04-15

摘要:为了平衡情感信息在不同模态中分布的不均匀性,获得更深层次的多模态情感表征,提出了一种基于双元双模态二次门控融合的多模态情感分析方法。对文本、视觉模态,文本、语音模态分别融合,充分考虑文本模态在三个模态中的优势地位。同时为了获得更深层次的多模态交互信息,使用二次融合。在第一次融合中,使用融合门决定向主模态添加多少补充模态的知识,得到两个双模态混合知识矩阵。在第二次融合中,考虑到两个双模态混合知识矩阵中存在冗余、重复的信息,使用选择门从中选择有效、精简的情感信息作为双模态融合后的知识。在公开数据集CMU-MOSEI公司上,情感二分类的准确率和F1分别为86.2%、86.1%、表现出良好的健壮性和先进性。

关键词: 多模态情感分析, 双元双模态, 二次融合, 门控注意力机制

摘要:为了平衡情感信息在不同模态中的不均匀分布,获得更深层次的多模态情感表征,本文提出了一种多模态情感分析中的双模态双门融合方法(BBBGF)。在文本-视觉模式、文本-音频模式的融合过程中,充分考虑了文本模式在三种模式中的主导地位。同时,利用双融合技术从更深层次上获取多模态情感交互信息。在第一次融合中,使用一个融合门来决定将补充模态的多少知识添加到主模态中,并得到两个双模混合知识矩阵。在第二种融合中,考虑到两个双模混合知识矩阵中的冗余和重复信息,使用选择门来选择有效和非重复的情感信息作为最终知识。在公开数据集CMU-MOSEI上,情感二值分类的准确率和F1值分别达到86.2%和86.1%,表现出良好的鲁棒性和先进性。

关键词: 多模态情感分析, 双双模态, 双门融合, 门控注意力