{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{-“日期部分”:[[2024,9,20]],“日期时间”:“2024-09-20T16:12:15Z”,“时间戳”:1726848735820},“引用计数”:48,“发布者”:“IEEE”,“内容域”:{“域”:[],“交叉标记限制”:false},”短容器时间“:[]”,“published-print”:{“日期部分”:[[2015,6]]},“DOI”:“10.1109\/cvpr.2015.7298878”,“type”:“proceedings-article”,“created”:{“date-parts”:[[2015,10,15]],“date-time”:“2015-10-15T22:42:06Z”,“timestamp”:1444948926000},“source”:《Crossref》,“is-referenced-by-count”:2578,“title”:[“用于视觉识别和描述的长期循环卷积网络”],“前缀”:“101109”,“author”:[{”给定:“Jeff”,“family”:“Donahue”,“sequence”:“first”,“affiliation”:[]},{“given”:“Lisa Anne”,“家族”:“Hendricks”,“serquence”:“additional”,“filiation“:[]{,{given:”Sergio“,”family“:”Guadarrama“,”sequence“:”additional“,”affiliance“:[]},“given”:“Subhashini”,“family”:“Venugopalan”,“sequence”:“additional”,“affiliation”:[]},{“given”:“Trevor”,“family”:“Darrell”,”sequence“:”additional sutskever“,“年份”:“2014年”,“日志标题”:“NIPS”},{“key”:“ref38”,“article-title”:“使用递归神经网络生成文本”,“author”:“sutskever”,“year”:“2011”,“journal-title“:”ICML“},}”key“:”ref33:“arXiv预印本arXiv 1406 2199”},{“key”:“ref32”,“article-title”:“ImageNet大规模视觉识别挑战”,“author”:“russakovsky”,“year”:“2014”}、{“key”:”ref31“,“artice-title“:”通过错误传播学习内部表征“,”author“:”rumelhart“,”year“:”1985“,”journal title“:,“doi-asserted-by”:“publisher”,“doi”:“10.1109\/ICCV.2013.61”},{“key”:“ref37”,“article-title”:“UCF 101:来自野外视频的101个人类动作类的数据集”,“author”:“soomro”,“year”:“2012”,“journal-title“:”arXiv-print arXiv1212 0402:“用于查找和描述带有句子的图像的基础合成语义”,“author”:“socher”,“year”:“2013”,“journal-title”:“NIPS深度学习研讨会”},{“key”:“ref35”,“article-title“:“用于大规模图像识别的深度卷积网络”,“author”:“simonyan”,“year”:,“文章标题”:“用于大规模图像识别的超深度卷积网络”,“作者”:“simonyan”,“年份”:“2014”,“期刊标题”:“arXiv预印本arXiv 1409 1556”},{“密钥”:“ref10”,“文章标题”:“使用递归神经网络实现端到端语音识别”,“作者”:“graves”,“年份”:“2014”,“期刊标题”:“ICML”},{“密钥”:“ref40”,“article-title”:“深入卷积”,“author”:“szegedy”,“year”:“2014”,“journal-title):“arXiv预印本arXiv 1409 4842”},{“key”:“ref11”,“doi-asserted-by”:“publisher”,“doi”:“10.1109\/ICCV.2013.337”}“:”ref13“,”doi-asserted-by“:”publisher“,”doi“:“10.1109\/TPAMI.2012.59”},{“key”:“ref14”,“doi-asserted-by”:“publisher”,“doi”:“10.1145\/2647868.2654889”}、{“密钥”:“ref15”,“article-title”:“用于双向图像句子映射的深层片段嵌入”,“author”:“karpathy”、“year”:“2014”,“journal-title“:”NIPS 10.1109\/CVPR.2014.223“},{“键”:“ref17”,“doi asserted by”:“publisher”,“doi”:“10.1109\/ICVW.2011.6130425”},{“key”:“ref18”,“文章标题”:“将视觉语义嵌入与多模态神经语言模型统一”,“author”:“kiros”,“year”:“2014”,“journal title”:“arXiv预印本arXiv 1411 2539”},{“key”:“ref19”,“文章标题”:“多模态神经语言模型”,“author”:“kiros”,“年份”:“2014年”,“日志标题”:“ICML”},{“key”:“ref28”,“doi-asserted-by”:“crossref”,“首页”:“67”,“doi”:“10.1162\/tacl_a_00166”,“article-title”:“从图像描述到视觉表征:事件描述语义推断的新相似性度量”,“volume”:”2“author”:“peter young”,“year”:“2014\”,“journal-title“:”tacl“}”,{:“ref4”,“article-title”:“基于翘曲理论的高精度光流估计”,“author”:“brox”,“year”:“2004”,“journal-title“:”ECCV“},{“key”:“ref27”,“article-titel”:“BLEU:一种机器翻译的自动评估方法”,“author”:“papineni”,“year”:”2002“,”journal-title“:”ACL“}:“视频输入句子输出”,“作者”:“barbu”,“年份”:“2012年”,“新闻标题”:“UAI”},{“key”:“ref6”,“doi-asserted-by”:“publisher”,”doi“:”10.1109\/CVPR.2013.340“},”{“key”:”ref29“,”doi-assert-by“:”publisher“,”doi:“10.1007\/978-3319-11752-2_15”},“doi”:“10.3115\/v1\/W14-4012”},{“键”:“参考8”,“文章标题”:“DeViSE:深度视觉语义嵌入模型”,“作者”:“from”,“年份”:“2013年”,“日志标题”:“NIPS”},{“key”:“ref7”,“article-title”:“ImageNet:大型分层图像数据库”,“作家”:“deng”,“年”:“2009年”,”日志标题“:”CVPR“},”{“密钥”:“ref2”,“doi-asserted-by”:“crossref”,“doi”:“10.1007 \/978-3642-25446-8_4“,”文章标题“:“人类行为识别的顺序深度学习”,“author”:“baccouche”,“year”:“2011”,“journal-title”:“human Behavior Understanding”},{“key”:“ref9”,“article-title“:“Generating sequences with recurrent neural networks”,“author”:“graves”,《year》:“2013”,“journal-titel”:“arXiv-print arXiv1308 0850”}”,{”key“:“ref1”,“article-title”:“具有长短期记忆递归神经网络的足球视频中的动作分类”,“作者”:“baccouche”,“年份”:“2010年”,“新闻标题”:“ICANN”},{“key”:“ref46”,“文章-时间”:“学习执行”,“作家”:“zaremba”,“年”:“2014年”,《新闻标题》:“arXiv预印本arXiv 1410 4615”}:“多模态神经语言模型”,“author”:“kiros”,“year”:“2013”,“journal-title”:“NIPS深度学习研讨会”},{“key”:“ref45”,“doi-asserted-by”:“publisher”,“doi”:“10.1162\/neco.1989.1.2.270”}:“ref22”,“article-title”:“ImageNet分类与深度卷积神经网络”,“author”:“krizhevsky”,“year”:“2012”,“journal-title“:“NIPS”},{“key”:“ref47”,“article-title”:“Recurrent neural network regulation”,“author”:“zaremba”,“年份”:“2014”,“日记标题”:“arXiv预印本arXiv 1409 2329”}:“publisher”,“DOI”:“10.3115\/1557769.1557821”},{“key”:“ref42”,“article-title”:“集成语言和视觉以生成野生视频的自然语言描述”,“author”:“thomason”,“year”:“2014”,“journal-title“:”COLING“},”{“key”:“ref24”,“article-title”:“Microsoft coco:上下文中的通用对象”,“author”:“lin”,“journal-title”:“arXiv-print arXiv1405 0312”},{“key”:“ref41”,“doi-asserted-by”:“publisher”,“doi”:“10.1145\/2072298.2072411”}“,”作者“:”库兹涅佐娃“,“year”:“2014”,“journal-title”:“计算语言学协会学报”},{“key”:“ref44”,“doi-asserted-by”:“publisher”,“doi”:“10.1007\/s11263-012-0594-8”}:“将图像描述作为排名任务:数据、模型和评估指标”,“卷”:“47”,“作者”:“micah hodosh”,“年份”:“2013”,“新闻标题”:“JAIR”},{“key”:“ref43”,“doi-asserted-by”:“publisher”,“doi”:“10.1109 \/ICASSP.2012.6288816”}、{“密钥”:“ref25”,“article-title”:“用多模态递归神经网络解释图像”,“author”:“mao”,“年份”:“2014年”,“新闻标题”:“arXiv预印本arXiv 1410 1090”}],“事件”:{“名称”:“2015 IEEE计算机视觉和模式识别会议(CVPR)”,“地点”:“美国马萨诸塞州波士顿”,“开始”:{-“日期”:[[2015,6,7]]},“结束”:{--“日期”,“original-title”:[],“link”:[{“URL”:“http://\/xplorestaging.ieee.org\/ielx7\/7293313\/7298593\/07298878.pdf?arnumber=7298878”,“content-type”:“unspecified”,“content-version”:“vor”,“intended-application”:“similarity-checking”}],“deposed”:{“date-parts”:[2020,9,9]],“date-time”:”2020-09-09T21:12:04Z,“时间戳”:1599685924000},“分数”:1,“资源”用法:{“primary”:{“URL”:“http://\/ieeexplore.iee.org\/document\/7298878\/”}},“subtitle”:[],“shorttitle”:[],“issued”:{日期部分:[[2015,6]]},”references-count“:48,”URL“:”http://\/dx.doi.org\/10.109\/cvpr.2015.7298878“,”relation“:{},“:[2015,6]]}}}”