{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{-“日期-部分”:[[2024,3,26]],“日期-时间”:“2024-03-26T02:07:29Z”,“时间戳”:1711418849998},“引用-计数”:0,“发布者”:“人工智能发展协会(AAAI)”,“问题”:“5”,“内容域”:{“域”:[],“交叉标记限制”:false},“short container-title”:[“AAAI”],“抽象”:“视觉基础是一项重要的视觉语言任务,涉及基于查询表达式的视觉上下文理解,因此需要模型来捕捉对象之间的交互以及各种空间和属性信息。然而,视觉接地任务的标注数据由于其耗时且劳动密集的标注过程而受到限制,导致训练后的模型无法将其能力推广到更广泛的领域。为了应对这一挑战,我们提出了GroundVLP,这是一种简单而有效的零快照方法,它利用了从图像-文本对和纯对象检测数据训练的现有模型中获得的视觉接地能力,与视觉接地注释数据相比,这两种数据都更容易获得,并且提供了更广的领域。GroundVLP提出了一种融合机制,该机制结合了GradCAM的热图和开放词汇表检测器的对象建议。我们证明,在RefCOCO\/+\/g数据集上,所提出的方法显著优于其他零快照方法,在RefCO和RefCOCO+的测试分割上超过了先前的最新零快照技术约28%。此外,GroundVLP的性能与Flickr30k实体数据集上一些基于非VLP的监督模型相当,甚至更好。我们的代码位于https:\/\/github.com/om-ai-lab\/GroundVLP<\/jats:p>“,”DOI“:”10.1609\/aaai.v38i5.28278“,”type“:”journal-article“,”created“:{”date-parts“:[2024,3,25]],”date-time“:”2024-03-25T09:34:41Z“,”timestamp“:1711359281000},”page“:“4766-4775”,“source”:“Crossref”,“is-referenced-by-count”:0,“title”:[“GroundVLP:从视觉语言预训练和开放词汇对象检测中利用零镜头视觉基础“],“前缀”:“10.1609”,“卷”:“38”,“作者”:[{“给定”:“好战”,“家族”:“沈”,“序列”:“第一”,“隶属关系”:[]},{“给定”:“天成”,“家族”:“赵”,“序列”:“附加”,“隶属关系”:[]}},{“给定”:“明威”,“家族”:“Zhu“,”sequence“:”additional“,”affiliation“:[]},”{“given”:”Jianwei“,”family“:”Yin“,”serquence“:”additionable“,”feliation“:[]}],”member“:”9382“,”published-on-line“:{“date-parts”:[2024,3,24]]}“container-title”:[“AAAI人工智能会议记录”],”original-title“:[],”link“:[{“URL”:“https:\/\/ojs.aaai.org\/index.php\/aaai\/aarticle\/download\/28278\/28547“,“content-type”:“application\/pdf”,“content-version”:“vor”,“intended-application”:“text-mining”},{“URL”:“https:\\\/ojs.aai.org\/index.php\/aAAAI\/article\/ownload\/228278\/28548”,“内容类型”:“未指定”,“content-version“:”vor“,”intended-plication“:”text-mining“},{”URL“:”https:\/\/ojs.aaai.org\/index.php\/aaai\/aarticle\/download\/28278\/28547“,”content-type“:”unspecified“,”content-version“:”vor“,”intended-application“:”similarity-checking“}],”deposed“:{”date-parts“:[2024,3,25]],”date-time“:“2024-03-25T09:34:42Z”,”timestamp“:1711359282000},”score“:1,”resource“:{“primary”:{“URL“:”https:\/\/ojs.aaai.org\/index.php\/aaai\/article\/view\/28278“}},”副标题“:[],”短标题“:[],”已发布“:{”日期部分“:[[2024,3,24]]},“引用计数”:0,”日志发布“:}”问题“:“5”,”发布在线“:{”日期部分:[2024,3,25]]}}、“URL”:“http://\/dx.doi.org\/10.1 609 \/aaai.v38i5.28278“,”关系“:{},”ISSN“:[”2374-3468“,”2159-5399“],”ISSN-type“:[{”value“:”2374-3468“,”type“:“电子”},{“value”:“2159-5399”,“type”:”print“}],“subject”:[],“published”:{“date-parts”:[2024,3,24]]}}}