{“状态”：“确定”，“消息类型”：“工作”，“信息版本”：“1.0.0”，“邮件”：{“索引”：{-“日期部分”：[[2024,9,20]]，“日期时间”：“2024-09-20T16:12:15Z”，“时间戳”：1726848735820}，“引用计数”：48，“发布者”：“IEEE”，“内容域”:{“域”：[]，“交叉标记限制”：false}，”短容器时间“：[]”，“published-print”：{“日期部分”：[[2015,6]]}，“DOI”：“10.1109\/cvpr.2015.7298878”，“type”：“proceedings-article”，“created”：{“date-parts”：[[2015,10,15]]，“date-time”：“2015-10-15T22:42:06Z”，“timestamp”：1444948926000}，“source”：《Crossref》，“is-referenced-by-count”：2578，“title”：[“用于视觉识别和描述的长期循环卷积网络”]，“前缀”：“101109”，“author”：[{”给定：“Jeff”，“family”：“Donahue”，“sequence”：“first”，“affiliation”：[]}，{“given”：“Lisa Anne”，“家族”：“Hendricks”，“serquence”:“additional”，“filiation“：[]{，{given：”Sergio“，”family“：”Guadarrama“，”sequence“：”additional“，”affiliance“：[]}，“given”：“Subhashini”，“family”：“Venugopalan”，“sequence”：“additional”，“affiliation”：[]}，{“given”：“Trevor”，“family”：“Darrell”，”sequence“：”additional sutskever“，“年份”：“2014年”，“日志标题”：“NIPS”}，{“key”：“ref38”，“article-title”：“使用递归神经网络生成文本”，“author”：“sutskever”，“year”：“2011”，“journal-title“：”ICML“}，}”key“：”ref33：“arXiv预印本arXiv 1406 2199”}，{“key”：“ref32”，“article-title”：“ImageNet大规模视觉识别挑战”，“author”：“russakovsky”，“year”：“2014”}、{“key”：”ref31“，“artice-title“：”通过错误传播学习内部表征“，”author“：”rumelhart“，”year“：”1985“，”journal title“：，“doi-asserted-by”：“publisher”，“doi”：“10.1109\/ICCV.2013.61”}，{“key”：“ref37”，“article-title”：“UCF 101:来自野外视频的101个人类动作类的数据集”，“author”：“soomro”，“year”：“2012”，“journal-title“：”arXiv-print arXiv1212 0402：“用于查找和描述带有句子的图像的基础合成语义”，“author”：“socher”，“year”：“2013”，“journal-title”：“NIPS深度学习研讨会”}，{“key”：“ref35”，“article-title“：“用于大规模图像识别的深度卷积网络”，“author”:“simonyan”，“year”：，“文章标题”：“用于大规模图像识别的超深度卷积网络”，“作者”：“simonyan”，“年份”：“2014”，“期刊标题”：“arXiv预印本arXiv 1409 1556”}，{“密钥”：“ref10”，“文章标题”：“使用递归神经网络实现端到端语音识别”，“作者”：“graves”，“年份”：“2014”，“期刊标题”：“ICML”}，{“密钥”：“ref40”，“article-title”：“深入卷积”，“author”：“szegedy”，“year”：“2014”，“journal-title）：“arXiv预印本arXiv 1409 4842”}，{“key”：“ref11”，“doi-asserted-by”：“publisher”，“doi”：“10.1109\/ICCV.2013.337”}“：”ref13“，”doi-asserted-by“：”publisher“，”doi“：“10.1109\/TPAMI.2012.59”}，{“key”：“ref14”，“doi-asserted-by”：“publisher”，“doi”：“10.1145\/2647868.2654889”}、{“密钥”：“ref15”，“article-title”：“用于双向图像句子映射的深层片段嵌入”，“author”：“karpathy”、“year”：“2014”，“journal-title“：”NIPS 10.1109\/CVPR.2014.223“}，{“键”：“ref17”，“doi asserted by”：“publisher”，“doi”：“10.1109\/ICVW.2011.6130425”｝，｛“key”：“ref18”，“文章标题”：“将视觉语义嵌入与多模态神经语言模型统一”，“author”：“kiros”，“year”：“2014”，“journal title”：“arXiv预印本arXiv 1411 2539”｝，｛“key”：“ref19”，“文章标题”：“多模态神经语言模型”，“author”：“kiros”，“年份”：“2014年”，“日志标题”：“ICML”}，{“key”：“ref28”，“doi-asserted-by”：“crossref”，“首页”：“67”，“doi”：“10.1162\/tacl_a_00166”，“article-title”：“从图像描述到视觉表征：事件描述语义推断的新相似性度量”，“volume”：”2“author”：“peter young”，“year”：“2014\”，“journal-title“：”tacl“}”，{：“ref4”，“article-title”：“基于翘曲理论的高精度光流估计”，“author”：“brox”，“year”：“2004”，“journal-title“：”ECCV“}，{“key”：“ref27”，“article-titel”：“BLEU:一种机器翻译的自动评估方法”，“author”:“papineni”，“year”：”2002“，”journal-title“:”ACL“}：“视频输入句子输出”，“作者”：“barbu”，“年份”：“2012年”，“新闻标题”：“UAI”}，{“key”：“ref6”，“doi-asserted-by”：“publisher”，”doi“：”10.1109\/CVPR.2013.340“}，”{“key”：”ref29“，”doi-assert-by“：”publisher“，”doi:“10.1007\/978-3319-11752-2_15”}，“doi”：“10.3115\/v1\/W14-4012”}，{“键”：“参考8”，“文章标题”：“DeViSE:深度视觉语义嵌入模型”，“作者”：“from”，“年份”：“2013年”，“日志标题”：“NIPS”}，{“key”：“ref7”，“article-title”：“ImageNet:大型分层图像数据库”，“作家”：“deng”，“年”：“2009年”，”日志标题“：”CVPR“}，”{“密钥”：“ref2”，“doi-asserted-by”：“crossref”，“doi”：“10.1007 \/978-3642-25446-8_4“，”文章标题“：“人类行为识别的顺序深度学习”，“author”：“baccouche”，“year”：“2011”，“journal-title”：“human Behavior Understanding”}，{“key”：“ref9”，“article-title“：“Generating sequences with recurrent neural networks”，“author”:“graves”，《year》：“2013”，“journal-titel”：“arXiv-print arXiv1308 0850”}”，{”key“：“ref1”，“article-title”：“具有长短期记忆递归神经网络的足球视频中的动作分类”，“作者”：“baccouche”，“年份”：“2010年”，“新闻标题”：“ICANN”}，{“key”：“ref46”，“文章-时间”：“学习执行”，“作家”：“zaremba”，“年”：“2014年”，《新闻标题》：“arXiv预印本arXiv 1410 4615”}：“多模态神经语言模型”，“author”：“kiros”，“year”：“2013”，“journal-title”：“NIPS深度学习研讨会”}，{“key”：“ref45”，“doi-asserted-by”：“publisher”，“doi”：“10.1162\/neco.1989.1.2.270”}：“ref22”，“article-title”：“ImageNet分类与深度卷积神经网络”，“author”：“krizhevsky”，“year”：“2012”，“journal-title“：“NIPS”}，{“key”：“ref47”，“article-title”：“Recurrent neural network regulation”，“author”:“zaremba”，“年份”：“2014”，“日记标题”：“arXiv预印本arXiv 1409 2329”}：“publisher”，“DOI”：“10.3115\/1557769.1557821”}，{“key”：“ref42”，“article-title”：“集成语言和视觉以生成野生视频的自然语言描述”，“author”：“thomason”，“year”：“2014”，“journal-title“：”COLING“}，”{“key”：“ref24”，“article-title”：“Microsoft coco：上下文中的通用对象”，“author”:“lin”，“journal-title”：“arXiv-print arXiv1405 0312”}，{“key”：“ref41”，“doi-asserted-by”：“publisher”，“doi”：“10.1145\/2072298.2072411”}“，”作者“：”库兹涅佐娃“，“year”：“2014”，“journal-title”：“计算语言学协会学报”}，{“key”：“ref44”，“doi-asserted-by”：“publisher”，“doi”：“10.1007\/s11263-012-0594-8”}：“将图像描述作为排名任务：数据、模型和评估指标”，“卷”：“47”，“作者”：“micah hodosh”，“年份”：“2013”，“新闻标题”：“JAIR”}，{“key”：“ref43”，“doi-asserted-by”：“publisher”，“doi”：“10.1109 \/ICASSP.2012.6288816”}、{“密钥”：“ref25”，“article-title”：“用多模态递归神经网络解释图像”，“author”：“mao”，“年份”：“2014年”，“新闻标题”：“arXiv预印本arXiv 1410 1090”}]，“事件”：{“名称”：“2015 IEEE计算机视觉和模式识别会议（CVPR）”，“地点”：“美国马萨诸塞州波士顿”，“开始”：{-“日期”：[[2015,6,7]]}，“结束”：{--“日期”，“original-title”：[]，“link”：[{“URL”：“http://\/xplorestaging.ieee.org\/ielx7\/7293313\/7298593\/07298878.pdf？arnumber=7298878”，“content-type”：“unspecified”，“content-version”：“vor”，“intended-application”：“similarity-checking”}]，“deposed”：{“date-parts”：[2020,9,9]]，“date-time”：”2020-09-09T21:12:04Z，“时间戳”：1599685924000}，“分数”：1，“资源”用法：{“primary”:{“URL”：“http://\/ieeexplore.iee.org\/document\/7298878\/”}}，“subtitle”：[]，“shorttitle”：[]，“issued”：{日期部分：[[2015,6]]}，”references-count“：48，”URL“：”http://\/dx.doi.org\/10.109\/cvpr.2015.7298878“，”relation“：{}，“：[2015,6]]}}}”