句法规划在合成图像字幕中的作用

伊曼纽尔·布利亚雷洛,德斯蒙德·埃利奥特


摘要
图像字幕的重点是对从与训练集相同的分布中提取的图像进行泛化,而不是对更具挑战性的问题,即对不同的图像分布进行泛化。最近,Nikolaus等人(2019年)引入了一个数据集来评估图像字幕中的构图泛化,其中评估了模型用看不见的形容词-名词和名词-动词构图描述图像的能力。在这项工作中,我们研究了通过规划字幕的句法结构来提高合成概括的不同方法。我们的实验表明,联合建模标记和语法标记可以提高基于RNN和基于变换的模型的泛化能力,同时也可以提高标准度量的性能。
选集ID:
2021.每条主线48
体积:
计算语言学协会欧洲分会第16届会议记录:主要卷
月份:
四月
年份:
2021
地址:
在线
编辑:
保拉·梅洛,乔格·蒂德曼,Reut Tsarfaty公司
地点:
EACL公司
SIG公司:
出版商:
计算语言学协会
注:
页:
593–607
语言:
网址:
https://aclantology.org/2021.eacl-main.48
内政部:
10.18653/v1/2021.eacl-main.48
比比键:
引用(ACL):
伊曼纽尔·布利亚雷洛(Emanuele Bugliarello)和德斯蒙德·埃利奥特(Desmond Elliott)。2021句法规划在作文图像字幕中的作用.英寸计算语言学协会欧洲分会第十六届会议论文集:主要卷,第593-607页,在线。计算语言学协会。
引用(非正式):
句法规划在合成图像字幕中的作用(Bugliarello&Elliott,EACL 2021)
复制引文:
PDF格式:
https://aclantology.org/2021.eacl-main.48.pdf
代码
电子插件/syncap
数据
中景COCO