×

视觉场景中物体相对于文本的分布语义。 (英语) Zbl 1478.68403号

摘要:分布假说声明概念的含义是通过其出现的上下文来定义的。实际上,通常在文本语料库中分析给定单词的单词共现性和邻近性,以获得实值语义词向量,该向量用于(至少部分)编码该单词的含义。在这里,我们将这个想法从文本转移到图像,在图像中,其他对象的预先指定标签或卷积神经网络的激活充当上下文。我们提出了一个简单的算法,从图像数据库中提取和处理对象上下文,并为对象生成语义向量。我们的经验表明,这些表示在一组常规对象上表现出与最先进的分布模型相当的性能。为此,除了新提出的以对象为中心的基准之外,我们还使用了众所周知的单词基准。

MSC公司:

第68页第45页 机器视觉和场景理解
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿戈斯蒂尼(Alejandro Agostini);卡梅·托拉斯(Carme Torras);沃戈特,佛罗伦萨,机器人应用的高效交互式决策框架,Artif。智力。,247, 187-212 (2017) ·Zbl 1420.68164号
[2] 莫希特·班萨尔;金佩尔,凯文;Livescu,Karen,为依存分析量身定制连续单词表示法,(计算语言学协会第52届年会会议记录(2014年),计算语言学协会),809-815
[3] Barlow,Roger J.,《统计学:物理科学中统计方法的使用指南》,第29卷(1989),John Wiley&Sons·Zbl 0689.62001
[4] 约书亚·本吉奥;雷杰·杜恰姆(Réjean Ducharme);帕斯卡·文森特;Christian Janvin,神经概率语言模型,J.Mach。学习。第31137-1155号决议(2003年)·Zbl 1061.68157号
[5] 大卫·M·布莱。;Ng,Andrew Y。;乔丹,迈克尔·I。,潜在的迪里克莱分配,J.马赫。学习。决议,3,993-1022(2003)·Zbl 1112.68379号
[6] Elia Bruni;Tran,Nam-Khanh;Baroni,Marco,《多式分布语义学》,J.Artif。智力。决议,49,1-47(2014)·Zbl 1361.68287号
[7] 亚历山大·布达尼茨基(Alexander Budanitsky);Hirst,Graeme,评估基于词网的词汇语义相关性度量,计算。语言学家。,32, 1, 13-47 (2006) ·Zbl 1234.68399号
[8] 罗南·科洛伯特;杰森·韦斯顿(Jason Weston);莱昂·博图;迈克尔·卡伦;科雷·卡武科格鲁;库克萨,帕维尔,自然语言处理(几乎)从头开始,J.马赫。学习。第12号决议,2493-2537(2011年8月)·Zbl 1280.68161号
[9] 加布里埃拉·苏尔卡;跳舞,克里斯托弗;范立新;尤塔·威拉莫夫斯基;Bray,Cédric,带关键点包的视觉分类,(计算机视觉中的统计学习研讨会,计算机视觉中统计学习研讨会),ECCV,布拉格(2004)
[10] 邓,贾;董伟;理查德·索彻(Richard Socher);李,李佳;李凯;Fei-Fei,Li,Imagenet:大型分层图像数据库,(IEEE计算机视觉和模式识别会议。IEEE计算机图像和模式识别大会,CVPR(2009)),248-255
[11] 冯岩松;Lapata,Mirella,语义表征中的视觉信息,(2010年ACL北美分会年会,计算语言学协会),91-99
[12] 约翰·R·弗斯,《语言学理论概要》,1930-1955,(语言分析研究(1957)),1-32
[13] 安德烈亚·弗洛姆(Andrea Frome);Greg S.Corrado。;Jon Shlens;萨米·本吉奥(Samy Bengio);杰夫·迪安;Mikolov,Tomas,Devise:一个深度视觉语义嵌入模型,(神经信息处理系统进展。神经信息处理体系进展,NIPS(2013)),2121-2129
[14] Ross Girshick;杰夫·多纳休;特雷弗·达雷尔;Malik,Jitendra,《精确目标检测和语义分割的丰富特征层次》(IEEE计算机视觉和模式识别会议,IEEE计算机图像和模式识别大会,CVPR(2014)),580-587
[15] 阿瑟·格伦伯格(Arthur M.Glenberg)。;Robertson,David A.,《符号基础和意义:高维和具体意义理论的比较》,J.Mem。Lang.,43,3,379-401(2000),ISSN 0749596X
[16] Harnad,Stevan,符号接地问题,物理。D: 非线性现象。,42, 1-3, 335-346 (1990)
[17] Harris,Zellig S.,分布结构,Word,10,2-3,146-162(1954)
[18] 何开明;张向玉;任少清;孙健,图像识别的深度残差学习,(IEEE计算机视觉和模式识别会议,IEEE计算机图像和模式识别大会,CVPR(2016))
[19] 何开明;格鲁吉亚Gkioxari;彼得·多拉尔(Piotr Dollár);Girshick,Ross,Mask r-cnn,(IEEE国际计算机视觉会议。IEEE国际电脑视觉会议,ICCV(2017))
[20] 费利克斯·希尔;Reichart,Roi;Korhonen,Anna,Simlex-999:用(真实的)相似性估计评估语义模型,Comput。语言学家。,41, 4, 665-695 (2015)
[21] 基拉、杜威;Bottou,Léon,使用卷积神经网络学习图像嵌入以改进多模态语义,(自然语言处理经验方法会议,自然语言处理实证方法会议,EMNLP(2015))
[22] 科达尔,阿尔科斯;阿非拉州阿利沙希;Chrupała,Grzegorz,从自然场景的图像中学习词义,Trait。自动化。语言自然科学。认知,55,3(2014)
[23] 利维·奥马尔;Goldberg,Yoav,神经单词嵌入作为隐式矩阵分解,(神经信息处理系统的进展。神经信息处理体系的进展,NIPS(2014)),2177-2185
[24] Lin,Tsung Yi;迈克尔·梅尔(Michael Maire);贝隆吉,谢尔盖;詹姆斯·海斯(James Hays);彼得罗·佩罗纳(Pietro Perona);拉马南,德瓦;彼得·多拉尔(Piotr Dollár);Zitnick,C.Lawrence,《微软coco:上下文中的通用对象》,(欧洲计算机视觉会议,第8693卷)。欧洲计算机视觉会议,第8693卷,ECCV(2014),施普林格国际出版公司,740-755
[29] 杰弗里·彭宁顿;理查德·索彻(Richard Socher);Manning,Christopher D.,Glove:单词表示的全局向量,(自然语言处理经验方法会议。自然语言处理的经验方法会议,EMNLP(2014)),1532-1543
[30] Joshua C.Peterson。;约书亚·T·阿伯特(Joshua T.Abbott)。;Thomas L.Griffiths,《改编深层网络特征以捕捉心理表征》(《认知科学学会第38届年会论文集》(2016年))
[33] 理查德·索彻(Richard Socher);Alex Perelygin;Wu,Jean Y。;Jason Chuang;克里斯托弗·曼宁(Christopher D.Manning)。;Ng,Andrew Y。;克里斯托弗·波茨(Christopher Potts),情感树库上语义合成的递归深度模型(Recursive deep models for semantic composition over a femotion treebank),(自然语言处理经验方法会议,自然语言处理实证方法会议,EMNLP(2013)),1631-1642
[35] Szegedy,基督徒;谢尔盖·洛夫;文森特·范霍克;Alemi,Alexander A.,《Inception-v4,Inception-resnet和剩余联系对学习的影响》,(AAAI人工智能会议(2017)),12
[36] 约瑟夫·图里亚(Joseph Turian);拉蒂诺夫,列夫;Bengio,Yoshua,单词表征:一种简单通用的半监督学习方法,(计算语言学协会第48届年会论文集(2010),计算语言学协会),384-394
[37] 彼得·特纳(Peter D.Turney)。;Patrick Pantel,《从频率到意义:语义的向量空间模型》,J.Artif。智力。第37号、第1号、第141-188号决议(2010年)·Zbl 1185.68765号
[38] 杰森·韦斯顿(Jason Weston);萨米·本吉奥(Samy Bengio);Usunier,Nicolas,《大规模图像注释:学习与联合单词图像嵌入排名》,Mach。学习。,81、1、21-35(2010年10月)·Zbl 1470.68197号
[39] 熊才明;钟,维克多;理查德·索彻(Richard Socher),《问题回答的动态协同关注网络》(国际学习代表大会,国际学习代表会议,ICLR(2017))
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。