ViGIL@NeurIPS 2019年:加拿大温哥华
视觉地面交互与语言(ViGIL),NeurIPS 2019年研讨会,加拿大温哥华,2019年12月13日。 2019 Khanh Nguyen先生 , 哈尔·达美三世 :
救命,安娜! 通过回顾性好奇心鼓励模仿学习,使用自然多模式辅助进行视觉导航。 亚历山大·库内尔 , 安·科佩斯塔克 :
VQA中的简单空间语言功能需要什么? Tsu-Jui Fu先生 , Yuta Tsuboi先生 , 小林宗介 , 尤塔·菊池 :
通过自测从观察中学习以任务为导向的语言基础。 建南乡 , 王欣(Xin Wang) , 威廉·杨旺 :
并非所有行动都是平等的:学会在基于语言的城市导航中停下来。 吴嘉林 , 雷蒙德·穆尼 :
隐藏状态指导:使用图像条件自动编码器改进图像字幕。 尼基尔·克里斯纳斯瓦米 , 詹姆斯·普斯特约夫斯基 :
情境基础有助于人工智能的多模式概念学习。 Catalina苍蝇 , 尤金·贝里洛夫斯基 , 彼得罗·利奥 , 亚伦·C·库维尔 :
VideoNavQA:缩小视觉和具体问题回答之间的差距。 瓦苏·夏尔马 , 安基塔·卡拉 , 莫伦西 :
诱导注意不变性:保护VQA模型免受对手攻击。 王欣(Xin Wang) , 维汉·贾因 , 尤金·伊尔 , 威廉·杨旺 , 佐尔尼萨·科萨雷瓦 , 苏吉思·拉维 :
基于自然语言的多任务导航。 法利·赖 , 谢宁 , 德里克·多兰 , 阿西姆·卡达夫 :
图像中自然语言实体的语境基础。 奥尔加·科瓦莱瓦 , 柴塔尼亚·希瓦德 , 萨蒂亚南达·卡西亚普 , 卡里娜·坎贾里亚 , 亚当·科伊 , 迪迪·巴拉 , 郭玉凡 , 乔伊·T·吴 , Alexandros Karargyris公司 , 大卫·贝默 , 安娜·拉姆希斯基 , 万达纳·V·穆克吉 :
放射科可视化对话框:数据处理和第一步。 托马斯·萨特 , 伊曼特·多恩豪尔 , 朱莉娅·沃格特 :
利用Jensen-Shannon-Divergence的多模生成学习。 关林超 , 阿比纳夫·拉斯托吉 , 塞米赫·亚武兹 , Dilek Hakkani-Tür , 陈金东 , 伊恩·雷恩 :
学习问题引导的视频表示,用于多回合视频问题解答。 安吉利基·拉扎里杜 , 安娜·布塔彭科 , 奥利维尔·蒂尔曼 :
学习语言使用的结构和功能学习。 奥利维尔·蒂勒曼 , 安吉利基·拉扎里杜 , 希布尔·穆拉德 , 查尔斯·布伦德尔 , Doina Precup公司 :
人工学习系统中的社区规模效应。 哈姆德·弗里斯 , Dzmitry Bahdanau公司 , Shikhar Murty公司 , 亚伦·C·库维尔 , 菲利普·博登 :
结语:评估CLEVR模型的系统泛化。 藤山千弘 , 小林一郎 :
文本到图像生成中语义构成的综合分析。 阿尔巴·玛丽亚·埃雷拉·帕拉西奥 , 卡尔斯·文图拉 , 卡琳娜·西尔贝勒 , Ionut-Teodor索罗多克 , 杰玛·博莱达 , Xavier Giró-i-尼托 :
使用引用表达式序列的递归实例分割。 T.S.杰拉姆 , 文森特·阿尔布伊 , 托马斯·科努塔 , 埃姆雷·塞夫根 , 艾哈迈特·奥兹坎 :
选择性注意记忆中的视觉接地视频推理。 Jean-Benoit Delbrouck公司 :
用于VQA的调制自注意卷积网络。 加布里埃尔·伊尔哈科 , 维汉·贾因 , 亚历山大·库 , 尤金·伊尔 , 杰森·鲍德里奇 :
使用动态时间扭曲的指令条件导航的一般评估。 林静香 , 乌纳特·贾恩 , 亚历山大·施温 :
视觉常识推理的简单基线。 尼古拉斯·莱尔 , 塞德里克·科拉斯 , 雷米·波特拉斯 , Jean-Michel Dussoux公司 , 彼得·多明尼 , 皮埃尔·伊夫·欧德耶 :
通过社交互动和好奇驱动的多目标学习实现语言基础。 郭妍伶 , 鲍里斯·卡茨 , 安德烈·巴布 :
遵循自然语言命令的深度组合机器人规划师。 ViGIL@NeurIPS 2019 Jean-Benoit Delbrouck公司 :
对抗训练可以学习图像字幕吗? 沙奇·H·库马尔 , 埃达·奥库 , 索拉夫·萨哈伊 , 乔纳森·黄 , 喇嘛·纳奇曼 :
在视听场景感知对话框中利用主题和音频功能以及多模式注意。 杜威-基拉 , 苏夫拉特·博珊 , Hamed Firooz公司 , 大卫测试 :
监督用于图像和文本分类的多模态双变换器。 杰西·穆 , 珀西·梁 , 诺亚·D·古德曼 :
用语言塑造视觉表征,实现少镜头分类。 杰弗里·西德龙 , 马修·苏林 , 弗洛里安·斯特鲁布 , 奥利维尔·皮特金 :
自学成才的语言代理,具有后见经验,用于教学跟进回放。 桑杰·苏布拉曼尼亚语 , 萨米尔·辛格 , 马特·加德纳 :
视觉问答中的构图分析。 亚辛·姆拉贝特 , 迪娜·德姆纳·福什曼 :
视觉理解中的协议。 Homagni Saha公司 , 维杰·文卡塔拉曼 , 阿尔贝托·斯佩兰松 , 苏米克·萨卡尔 :
面向信息融合的多智能体通信展望。 沙布纳姆·达格哈吉 , 安舒马利·施里瓦斯塔瓦 , 塔伦·梅迪尼 :
基于软标记的广义零炮学习的交叉模式映射。 坎迪斯·罗斯 , 毛切火头 , 鲍里斯·卡茨 , 安德烈·巴布 :
从视觉中学习语言。 黛玉(Dian Yu) , Chandra Khatri公司 , 亚历山大·帕潘格里斯 , 安德烈亚·马多托 , 马赫迪·纳马齐法尔 , Joost Huizinga公司 , 阿德里安·埃科菲 , 郑怀秀 , 皮耶罗·莫利诺 , 杰夫·克伦 , 周瑜 , Kenji Sagae公司 , 哥坎·蒂尔 :
通过具体环境中的语言进行常识和语义引导导航。 ViGIL@NeurIPS 2019
![](https://dblp.uni-trier.de/img/cog.dark.24x24.png)