VQA公司 swMATH ID: 36506 软件作者: Aishwarya Agrawal、Jiasen Lu、Stanislaw Antol、Margaret Mitchell、C.Lawrence Zitnick、Dhruv Batra、Devi Parikh 描述: VQA:可视化问答。VQA是一个新的数据集,包含关于图像的开放式问题。这些问题需要对视觉、语言和常识的理解才能回答。265016幅图像(COCO和抽象场景)。每张图片至少有3个问题(平均5.4个问题)。每个问题回答10个基本事实。每个问题3个看似合理(但可能不正确)的答案。自动评估指标。 主页: https://visualqa.org 源代码: https://github.com/GT-Vision-Lab/VQA 关键词: arXiv_cs。氯;计算机视觉;模式识别;arXiv_cs。个人简历;VQA公司;可视问答 相关软件: 亚当;更快的R-CNN;克莱沃;Flickr30K手机;BERT(误码率);视觉7W;苹果汁;手套;CLEVR数据集;YOLO公司;ImageNet公司;梯度-CAM;布鲁;胭脂;github;DeepProbLog(深度探测日志);NeurASP公司;卡费;振动贝特;PyTorch公司 引用于: 10文件 标准条款 1出版物描述软件 年份 视觉问答arXiv公司Aishwarya Agrawal、Jiasen Lu、Stanislaw Antol、Margaret Mitchell、C.Lawrence Zitnick、Druv Batra、Devi Parikh 2015 全部的 前5名34位作者引用 1 约书亚·本吉奥 1 苏娜·本施 1 蔡毅 1 萨拉斯·钱达尔 1 陈嘉丽 1 陈伟 1 Cho,Kyunghyun先生 1 Dhami,德文德拉·辛格 1 德里克·多兰 1 方文浩 1 Alireza Ganjdanesh 1 乔拉尔·吉尔切尔 1 何晓海 1 托马斯·赫尔斯特罗姆 1 尼尔森·希格拉 1 黄、恒 1 克里斯蒂安·凯斯廷 1 金永嘉 1 李清 1 约翰内斯·奥奇 1 艾哈迈德·奥斯托瓦尔 1 桑敏公园 1 维克托·普凡希林 1 迈克尔·普里茨 1 清、林波 1 Gabrielle拉斯 1 Hikaru Shindo公司 1 理查德·塞利斯基 1 范·格文(Marcel A.J.van Gerven)。 1 谢佳元 1 谢宁 1 张继鹏 1 张墨芝 1 朱,韩 全部的 前5名9篇连载文章中引用 1 信息学报 1 神经网络 1 机器学习 1 神经计算 1 人工智能研究杂志 1 逻辑程序设计理论与实践 1 数学生物科学与工程 1 计算机科学评论 1 计算机科学课文 在3个字段中引用 9 计算机科学(68至XX) 2 生物学和其他自然科学(92-XX) 1 系统论;控制(93至XX) 按年份列出的引文