接地的PCFG公司图像归纳法

李凤珍(Lifeng Jin),威廉·舒勒


摘要
最近在无监督句法分析方面的工作试图将视觉信息融入到学习中,但结果表明,这些模型需要语言偏见来与只依赖文本的模型竞争。本文提出了语法归纳模型,该模型使用图像中的视觉信息进行标记解析,并在几种语言的基础语法归纳方面取得了最新的结果。结果表明,视觉信息在高频词分布更广的语言中尤其有用。有视觉信息和无视觉信息的模型的比较表明,扎根模型能够利用视觉信息提出名词短语,从图像中为未知单词收集有用信息,并在介词短语连接预测方面取得更好的性能。
选集ID:
2020.acl-main.42年
体积:
计算语言学协会亚太分会第一届会议记录和第十届国际自然语言处理联合会议记录
月份:
十二月
年份:
2020
地址:
中国·苏州
编辑:
Kam-Fai Wong先生,凯文·奈特,华武
地点:
AACL公司
SIG公司:
出版商:
计算语言学协会
注:
页:
396–408
语言:
网址:
https://aclantology.org/2020.aacl-main.42
内政部:
比比键:
引用(ACL):
金立峰(Lifeng Jin)和威廉·舒勒(William Schuler)。2020带图像的接地PCFG感应.英寸计算语言学协会亚太分会第一届会议记录和第十届国际自然语言处理联合会议记录,第396–408页,中国苏州。计算语言学协会。
引用(非正式):
带图像的接地PCFG感应(Jin&Schuler,AACL 2020)
复制引文:
PDF格式:
https://aclantology.org/2020.aacl-main.42.pdf
数据
中景COCO