以下区域D类视觉对话讨论

毛里西奥·马祖科斯,佛朗哥·M·卢克,豪尔赫·桑切斯,埃尔南·梅纳,托马斯·瓦多拉,卢西亚娜·贝诺蒂


摘要
可视对话框假定需要对话框历史记录才能在对话框中生成正确的响应。然而,从以前的工作中还不清楚可视化对话框如何需要对话框历史。在本文中,我们定义了视觉问题需要对话历史的含义,并发布了Guesswhat?!的子集?!他们的对话历史完全改变了他们的回答的问题。我们提出了一种新颖的可解释表示,它在视觉上奠定了对话历史的基础:讨论中的区域。受“讨论中的问题”信息结构概念的启发,它根据历史的语义表示来约束图像的空间特征。我们评估了特定任务多模态模型和可视变压器模型LXMERT的体系结构。
选集ID:
2021.emnlp-main.390年
体积:
2021年自然语言处理实证方法会议记录
月份:
十一月
年份:
2021
地址:
多米尼加共和国Online和Punta Cana
编辑:
玛丽·弗兰辛·莫恩斯,黄宣景,露西娅·斯佩西亚,斯科特·文涛(Scott Wen-tau Yih)
地点:
EMNLP公司
SIG公司:
出版商:
计算语言学协会
注:
页:
4745–4759
语言:
网址:
https://aclantology.org/2021.emnlp-main.390
内政部:
10.18653/v1/2021.emnlp-main.390
比比键:
引用(ACL):
毛里西奥·马祖科斯、弗兰科·卢克、豪尔赫·桑切斯、埃尔南·梅纳、托马斯·瓦多拉和卢西亚娜·贝诺蒂。2021可视对话的讨论区域.英寸2021年自然语言处理实证方法会议记录,第4745–4759页,在线和多米尼加共和国卡纳角。计算语言学协会。
引用(非正式):
可视对话讨论区域(Mazuecos等人,EMNLP 2021)
复制引文:
PDF格式:
https://aclantology.org/2021.emnlp-main.390.pdf
软件:
2021.emnlp-main.390.软件.zip
视频:
 https://aclantology.org/2021.emnlp-main.390.mp4网址
数据
猜猜怎么了?!中景COCOVisDial(可视拨号)