@正在进行{dong-etal-2021目视检查,title=“视觉基础跟进问题:需要对话历史的空间问题数据集”,author=“董天爱泰斯托尼、阿尔贝托和贝诺蒂、卢西亚纳和伯纳迪、拉斐拉”,editor=“Alikhani、Malihe和Blukis、Valts和Kordjamshidi、Parisa和帕德马库马尔、艾什瓦里亚和谭浩”,booktitle=“第二届机器人空间语言理解和地面通信国际联合研讨会论文集”,月=八月,年=“2021”,address=“在线”,publisher=“计算语言学协会”,url=“https://aclantology.org/2021.splurobonlp-1.3”,doi=“10.18653/v1/2021.splurobonlp-1.3”,pages=“22--31”,abstract=“在本文中,我们定义并评估了一种从视觉对话中提取与历史相关的空间问题的方法。如果一个问题需要(部分),我们称其为历史相关的问题其对话历史有待解读。我们认为,一些视觉问题定义了后续空间问题所依赖的上下文。我们将限制上下文的问题称为trigger,将需要回答trigger问题的空间问题称为zoomer。我们根据问题所依赖的视觉属性(例如颜色、数字)自动提取不同的触发器和缩放器对。我们手动注释自动提取的触发器和变焦器对,以验证哪些变焦器需要其触发器。我们基于SOTA多模式编码器实现了一个简单的基线架构。我们的结果表明,在回答历史相关问题方面还有很大的改进空间。",}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“dong-etal-2021可视”><标题信息>视觉基础跟进问题:需要对话历史的空间问题数据集</titleInfo><name type=“personal”>天爱<namePart type=“family”>Dong</namePart>董</namePart<角色>作者</角色></name><name type=“personal”>阿尔贝托Testoni公司<角色>作者</角色></name><name type=“personal”>卢西亚纳贝诺蒂<角色>作者</角色></name><name type=“personal”>拉斐拉(Raffaella)贝尔纳迪<角色>作者</角色></name><originInfo><发布日期>2021-08</发布日期></originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>机器人空间语言理解和地面通信第二届国际联合研讨会论文集</titleInfo><name type=“personal”>马利赫<namePart type=“family”>Alikhani</namePart><角色>编辑器</角色></name><name type=“personal”><namePart type=“given”>阀门</namePart>Blukis系列<角色>编辑器</角色></name><name type=“personal”>帕里萨科德贾姆什迪<角色>编辑器</角色></name><name type=“personal”>Aishwarya帕德马库玛<角色>编辑器</角色></name><name type=“personal”>郝(音译)<namePart type=“family”>谭</namePart><角色>编辑器</角色></name><originInfo>计算语言学协会<位置>在线</place></originInfo>会议出版物</relatedItem>在本文中,我们定义并评估了一种从视觉对话中提取历史相关空间问题的方法。如果一个问题需要对其对话历史(部分)进行解释,我们就说它是历史依赖的。我们认为,一些视觉问题定义了后续空间问题所依赖的上下文。我们将限制上下文的问题称为trigger,将需要回答trigger问题的空间问题称为zoomer。我们根据问题所依赖的视觉属性(例如颜色、数字)自动提取不同的触发器和缩放器对。我们手动注释自动提取的触发器和缩放器对,以验证哪些缩放器需要它们的触发器。我们基于SOTA多模式编码器实现了一个简单的基线架构。我们的结果表明,在回答历史相关问题方面还有很大的改进空间</摘要>视觉上的东-塔尔-202110.18653/v1/2021.splurobonlp-1.3<位置><网址>https://aclantology.org/2021.splurobonlp-1.3</url></位置><部分>2021-08年<扩展单元=“page”><开始>22</开始><end>31</end></范围></部分></mods></modsCollection>
%0会议记录%视觉基础跟进问题:需要对话历史的空间问题数据集%天爱阿洞%阿尔贝托·A Testoni%卢西亚娜·贝诺蒂%A Bernardi,拉斐拉%Y Alikhani,马利赫%Y Blukis,Valts公司%Y Kordjamshidi,巴黎%艾什瓦尔亚·帕德马库马尔%Y Tan、Hao%机器人空间语言理解和地面通信第二届国际联合研讨会论文集%D 2021年%8月8日%I计算语言学协会%C在线%F dong-etal-2021目视检查%X在本文中,我们定义并评估了一种从视觉对话中提取历史相关空间问题的方法。如果一个问题需要对其对话历史(部分)进行解释,我们就说它是历史依赖的。我们认为,一些视觉问题定义了后续空间问题所依赖的上下文。我们将限制上下文的问题称为trigger,将需要回答trigger问题的空间问题称为zoomer。我们根据问题所依赖的视觉属性(例如颜色、数字)自动提取不同的触发器和缩放器对。我们手动注释自动提取的触发器和变焦器对,以验证哪些变焦器需要其触发器。我们实现了一个基于SOTA多模式编码器的简单基线架构。我们的结果表明,在回答历史相关问题方面还有很大的改进空间。%R 10.18653/v1/2021。splurobonlp-1.3%U型https://aclantology.org/2021.splurobonlp-1.3%U型https://doi.org/10.18653/v1/2021.splurobonlp-1.3%第22-31页
降价(非正式)
【视觉基础跟进问题:需要对话历史的空间问题数据集】(https://aclcollectory.org/2021.splurobonlp-1.3)(Dong等人,splurobonlp 2021)
国际计算语言学协会
- Tianai Dong、Alberto Testoni、Luciana Benotti和Raffaella Bernardi。2021视觉基础跟进问题:需要对话历史的空间问题数据集.英寸第二届机器人空间语言理解和地面通信国际联合研讨会会议记录,第22-31页,在线。计算语言学协会。