使用对象标签增强视频翻译上下文

杰里米·格温努普,蒂姆·安德森,布莱恩·奥雷,埃里克·汉森,杜凯文(Kevin Duh)


摘要
我们提出了一种简单而有效的方法,通过在相应的视频片段中使用检测对象的标签来增强训练文本,从而提高在多模态语料库上训练的机器翻译模型的质量。然后我们在基线和两种自动语音识别(ASR)条件下测试标签增强的效果。与融合视觉和文本特征的多模态技术相比,我们的模块化方法易于实现,结果更易于解释。与使用基线和增强标签训练的Transformer翻译体系结构进行了比较,结果表明,在How2数据集上,BLEU提高了+1.0。
选集ID:
2023年iwslt-1.8
体积:
第20届国际口语翻译大会(IWSLT 2023)会议记录
月份:
七月
年份:
2023
地址:
加拿大多伦多(现场和在线)
编辑:
伊丽莎白·塞尔斯基,马塞洛·费德里科,海洋木瓜
地点:
IWSLT公司
SIG公司:
SIGSLT公司
出版商:
计算语言学协会
注:
页:
130–137
语言:
网址:
https://aclantology.org/2023.iwslt-1.8
内政部:
10.18653/v1/2023。iwslt-1.8
比比键:
引用(ACL):
Jeremy Gwinnup、Tim Anderson、Brian Ore、Eric Hansen和Kevin Duh。2023用对象标签增强视频翻译语境.英寸第20届国际口语翻译大会(IWSLT 2023)会议记录,第130-137页,加拿大多伦多(同人和在线)。计算语言学协会。
引用(非正式):
使用对象标签增强视频翻译上下文(Gwinnup等人,IWSLT 2023)
复制引文:
PDF格式:
https://aclantology.org/2023.iwslt-1.8.pdf