CK-Transformer: Commonsense Knowledge Enhanced Transformers for Referring Expression Comprehension

Zhi Zhang; Helen Yannakoudakis; Xiantong Zhen; Ekaterina Shutova

doi:10.18653/v1/2023.findings-eacl.196

CK公司-变压器：用于指称表达式理解的常识增强型变压器

摘要

多模态指称表达理解（REC）的任务旨在定位自然语言表达所描述的图像区域，最近在研究领域受到了越来越多的关注。在本文中，我们特别关注将表达理解与常识知识（KB-Ref）联系起来，这项任务通常需要超越空间、视觉或语义信息的推理。我们提出了一种新的常识知识增强型变换器（CK-Transformer）框架，该框架有效地将常识知识集成到图像中对象的表示中，便于识别表达式所指的目标对象。我们对KB-Ref任务的几个基准进行了广泛的实验。我们的结果表明，所提出的CK-Transformer达到了一种新的技术水平，与现有技术相比，准确度绝对提高了3.14%。

选集ID：: 2023.结果-每个196
体积：: 计算语言学协会的研究结果：EACL 2023
月份：: 五月
年份：: 2023
地址：: 克罗地亚杜布罗夫尼克
编辑：: 安德烈亚斯·弗拉科斯,伊莎贝尔·奥根斯坦
地点：: 调查结果
信号：
出版商：: 计算语言学协会
注：
页：: 2586–2596
语言：
网址：: https://aclantology.org/2023.findings-eacl.196
内政部：: 10.18653/v1/2023.结果-每个196
比比键：
引用（ACL）：: Zhi Zhang、Helen Yannakoudakis、Xiantong Zhen和Ekaterina Shutova。2023CK转换器：用于指称表达式理解的常识增强型转换器.英寸计算语言学协会的研究结果：EACL 2023，第2586–2596页，克罗地亚杜布罗夫尼克。计算语言学协会。
引用（非正式）：: CK转换器：用于指称表达式理解的常识增强型转换器（Zhang等人，《2023年调查结果》）
复制引文：
PDF格式：: https://aclantology.org/2023.findings-eacl.196.pdf
视频：: https://aclantology.org/2023.findings-eacl.196.mp4网址

PDF格式引用搜索视频