瓦苏德夫·拉尔 沙查尔·罗森曼 瓦苏德夫·拉尔 菲利普·霍华德 NeuroPrompts:一个自适应框架,用于优化文本到图像生成的提示。 159-167 2024 EACL(演示) https://aclantology.org/2024.eacl-demo.17 conf/eacl/2024d db/conf/eacl/eacl2024d.html#RosenmanLH24
阿格尼特·查特吉 加布里埃拉·本·梅莱赫·斯坦 埃斯特尔·阿夫拉洛 沙亚克·保罗 德鲁巴·戈什 Tejas Gokhale公司 路德维希·施密特 Hannaneh Hajishirzi公司 瓦苏德夫·拉尔 奇塔·巴拉尔 杨叶洲 正确操作:改进文本到图像模型中的空间一致性。 2024 腹肌/2404.01197 CoRR公司 https://doi.org/10.48550/arXiv.2404.01197 数据库/期刊/corr/corr2404.html#abs-2404-01197
武藏欣克 马修·奥尔森 大卫·科布利 邵延曾 瓦苏德夫·拉尔 LLaVA-Gemma:使用紧凑语言模型加速多模态基础模型。 2024 abs/2404.01331 CoRR公司 https://doi.org/10.48550/arXiv.2404.01331 数据库/期刊/corr/corr2404.html#abs-2404-01331
加布里埃拉·本·梅莱赫·斯坦 Raanan Y.Yehezkel Rohekar先生 亚尼夫·古维茨 马修·莱尔·奥尔森 阿纳希塔·比万迪瓦拉 埃斯特尔·阿夫拉洛 吴晨飞 南区 邵延曾 瓦苏德夫·拉尔 LVLM-Intreplet:一个用于大型可视语言模型的可解释工具。 2024 abs/2404.03118 CoRR公司 https://doi.org/10.44850/arXiv.2404.03118 数据库/期刊/corr/corr2404.html#abs-2404-03118
阿维纳什·马达苏 埃斯特尔·阿夫拉洛 加布里埃拉·本·梅莱赫·斯坦 沙查尔·罗森曼 邵延曾 格达斯·贝尔塔修斯 瓦苏德夫·拉尔 MuMUR:多语言多模式通用检索。 5 2023 六月 26 Inf.Retr.(信息回收)。J。 1 https://doi.org/10.1007/s10791-023-09422-5 db/journals/ir/ir26.html#MadasuASRTBL23
肖旭0005 吴晨飞 沙查尔·罗森曼 瓦苏德夫·拉尔 万向车 南区 BridgePower:在视觉语言表征学习中构建编码器之间的桥梁。 10637-10647 2023 AAAI公司 https://doi.org/10.1609/aaai.v37i9.26263 conf/aaai/2023 db/conf/aaai/aaai2023.html#0005WRLCD23 肖旭0005 贝莉 吴晨飞 邵延曾 阿纳希塔·比万迪瓦拉 沙查尔·罗森曼 瓦苏德夫·拉尔 万向车 南区 ManagerTower:汇集统一模式专家对视觉语言表征学习的见解。 14507-14525 2023 ACL(1) https://doi.org/10.18653/v1/2023.acl-long.811 https://aclantology.org/2023.acl-long.811 conf/acl/2023-1 db/conf/acl/acl2023-1.html#0005LWTBRLCD23 阿维纳什·马达苏 瓦苏德夫·拉尔 多模态视觉监控对语言有益吗? 2637-2642 2023 CVPR研讨会 https://doi.org/10.1109/CVPRW59228.2023.00263 conf/cvpr/2023w公司 db/conf/cvpr/cvprw2023.html#MadasuL23 阿维纳什·马达苏 埃斯特尔·阿夫拉洛 加布里埃拉·本·梅莱赫·斯坦 邵延曾 格达斯·贝尔塔修斯 瓦苏德夫·拉尔 使用多语言知识转移改进视频检索。 669-684 2023 ECIR(1) https://doi.org/10.1007/978-3-031-28244-7_42 conf/ecir/2023-1 db/conf/ecir/ecir2023-1.html#MadasuASTBL23 Tiep Le公司 瓦苏德夫·拉尔 菲利普·霍华德 COCO-Counterfactals:自动构建的图像-文本对反事实示例。 2023 NeurIPS公司 http://papers.nips.cc/paper_files/paper/2023/hash/e14e4cb8266184ceb234973dfe07faed-Abstract-Datasets_and_Barkets.html conf/nips/2023 db/conf/nips/neurips2023.html#LeLH23 杰里·唐 孟都 Vy A.Vo公司 瓦苏德夫·拉尔 亚历山大·胡特 基于多模态变换器的大脑编码模型可以跨语言和视觉进行转换。 2023 NeurIPS公司 http://papers.nips.cc/paper_files/paper/2023/hash/5ebbbac62b968254093023f1c95015d3-Abstract-Conference.html conf/nips/2023 db/conf/nips/neurips2023.html#TangDVLH23
阿维纳什·马达苏 瓦苏德夫·拉尔 多模态视觉监控对语言有益吗? 2023 abs/2302.05016 CoRR公司 https://doi.org/10.48550/arXiv.2302.05016 db/journals/cor/corr2302.html#abs-2302-05016数据库
加迪·辛格 乔沙·巴赫 特蒂亚娜·格林伯格 纳吉卜·哈基姆 菲利普·霍华德 瓦苏德夫·拉尔 泽夫·里夫林 Thrill-K体系结构:解决基于知识的理解问题。 2023 abs/2303.12084 CoRR公司 https://doi.org/10.48550/arXiv.2303.12084 数据库/期刊/corr/corr2303.html#abs-2303-12084
菲利普·霍华德 王俊林 瓦苏德夫·拉尔 加迪·辛格 叶金彩0001 Swabha Swayamdipta公司 神经比较:比较知识的神经符号提炼。 2023 abs/2305.04978 CoRR公司 https://doi.org/10.48550/arXiv.2305.04978 数据库/期刊/corr/corr2305.html#abs-2305-04978
加布里埃拉·本·梅莱赫·斯坦 戴安娜·沃夫克 斯科蒂·福克斯 亚历克斯·雷登 威尔·萨克斯顿 让·俞(Jean Yu) 埃斯特尔·阿夫拉洛 邵延曾 法比奥·诺纳托 马蒂亚斯·米勒0011 瓦苏德夫·拉尔 LDM3D:三维潜在扩散模型。 2023 abs/2305.10853 CoRR公司 https://doi.org/10.48550/arXiv.2305.10853 数据库/期刊/corr/corr2305.html#abs-2305-10853
杰里·唐 孟都 Vy A.Vo公司 瓦苏德夫·拉尔 亚历山大·胡特 基于多模态变换器的大脑编码模型可以跨语言和视觉进行转换。 2023 abs/2305.12248 CoRR公司 https://doi.org/10.48550/arXiv.2305.12248 数据库/期刊/corr/corr2305.html#abs-2305-12248
肖旭0005 贝莉 吴晨飞 邵延曾 阿纳希塔·比万迪瓦拉 沙查尔·罗森曼 瓦苏德夫·拉尔 万向车 南区 ManagerTower:汇集统一模式专家对视觉语言表征学习的见解。 2023 abs/2306.00103 CoRR公司 https://doi.org/10.48550/arXiv.2306.00103 数据库/期刊/corr/corr2306.html#abs-2306-00103
阿维纳什·马达苏 瓦苏德夫·拉尔 ICSVR:研究视频检索模型中的合成和语义理解。 2023 腹肌/2306.16533 CoRR公司 https://doi.org/10.48550/arXiv.2306.16533 db/journals/corr/corr2306.html#abs-2306-16533
Tiep Le公司 瓦苏德夫·拉尔 菲利普·霍华德 COCO-Counterfactals:自动构建的图像-文本对反事实示例。 2023 abs/2309.14356 CoRR公司 https://doi.org/10.48550/arXiv.2309.14356 数据库/期刊/corr/corr2309.html#abs-2309-14356
菲利普·霍华德 阿维纳什·马达苏 Tiep Le公司 古斯塔沃·A·卢扬·莫雷诺 瓦苏德夫·拉尔 用反事实例子探讨视觉语言模型中的交叉偏见。 2023 abs/2310.02988 CoRR公司 https://doi.org/10.48550/arXiv.2310.02988 db/journals/corr/corr2310.html#abs-2310-02988
阿维纳什·马达苏 Anahita比旺迪瓦拉 瓦苏德夫·拉尔 视频理解任务中视觉语言模型的零拍能力分析。 2023 abs/2310.04914 CoRR公司 https://doi.org/10.48550/arXiv.2310.04914 db/journals/corr/corr2310.html#abs-230-04914
加布里埃拉·本·梅莱赫·斯坦 戴安娜·沃夫克 埃斯特尔·阿夫拉洛 邵延曾 蔡志鹏 迈克尔·保利奇 瓦苏德夫·拉尔 LDM3D-VR:3D VR的潜在扩散模型。 2023 abs/2311.03226 CoRR公司 https://doi.org/10.48550/arXiv.2311.03226 db/journals/corr/corr2311.html#abs-2311-03226
沙查尔·罗森曼 瓦苏德夫·拉尔 菲利普·霍华德 NeuroPrompts:一个自适应框架,用于优化文本到图像生成的提示。 2023 abs/2311.12229 CoRR公司 https://doi.org/10.48550/arXiv.2311.12229 db/journals/corr/corr2311.html#abs-2311-12229
菲利普·霍华德 阿维纳什·马达苏 Tiep Le公司 古斯塔沃·A·卢扬·莫雷诺 阿纳希塔·比万迪瓦拉 瓦苏德夫·拉尔 用反事实的例子探讨和缓解视觉语言模型中的交叉社会偏见。 2023 腹肌/231200825 CoRR公司 https://doi.org/10.44850/arXiv.2312.00825网址 db/journals/corr/corr2312.html#abs-2312-00825
加迪·辛格 乔沙·巴赫 特蒂亚娜·格林伯格 纳吉卜·哈基姆 菲利普·瑞恩·霍华德 瓦苏德夫·拉尔 泽夫·里夫林 Thrill-K体系结构:解决基于知识的理解问题。 404至412 2022 AGI公司 https://doi.org/10.1007/978-3-031-19907-3_39 conf/agi/2022 db/conf/agi/agi2022.html#歌手BGHHLR22 菲利普·霍华德 雅顿·马 瓦苏德夫·拉尔 安娜·保拉·西姆斯 丹尼尔·科拉特 奥伦·佩雷格 莫西·瓦瑟布拉特 加迪·辛格 使用知识图增强的变换器进行跨域方面提取。 780-790 2022 CIKM公司 https://doi.org/10.1145/3511808.3557275 conf/cikm/2022 db/conf/cikm/cikm2022.html#HowardMLSKPWS22 埃斯特尔·阿夫拉洛 孟都 邵延曾 刘永飞 吴晨飞 南区 瓦苏德夫·拉尔 VL-InterpreT:解释视觉语言变形金刚的交互式可视化工具。 21374-21383 2022 CVPR公司 https://doi.org/10.109/CVPR52688.2022.02072 conf/cvpr/2022 db/conf/cvpr/cvpr2022.html#AflaloDTLWDL22 菲利普·霍华德 加迪·辛格 瓦苏德夫·拉尔 叶金彩0001 Swabha Swayamdipta公司 神经反事实:超越最小编辑反事实,实现更丰富的数据增强。 5056-5072 2022 EMNLP(调查结果) https://doi.org/10.18653/v1/2022.findings-emnlp.371 https://aclantology.org/2022.findings-emnlp.371 conf/emnlp/2022f db/conf/emnlp/emnlp2022f.html#HowardSLCS22 刘永飞 吴晨飞 邵延曾 瓦苏德夫·拉尔 何旭明0001 南区 KD-VLP:使用对象知识提取改进端到端的视觉和语言预训练。 1589-1600 2022 NAACL-HLT(调查结果) https://doi.org/10.18653/v1/2022.findings-naacl.119 https://aclantology.org/2022.findings-naacl.119 conf/naacl/2022f db/conf/naacl/naacl2022f.html#LiuWTL0D22 阿亚尔·克莱因 奥伦·佩雷格 丹尼尔·科拉特 瓦苏德夫·拉尔 莫西·瓦瑟布拉特 伊多·达甘 基于Opinion的跨域方面术语提取的关系旋转。 104至112 2022 WASSA@ACL https://doi.org/10.18653/v1/2022.wassa-1.11 https://aclantology.org/2022.wassa-1.11 conf/wassa/2022 db/conf/wassa/wassa2022.html#KleinPKLWD22
埃斯特尔·阿夫拉洛 孟都 邵延曾 刘永飞 吴晨飞 南区 瓦苏德夫·拉尔 VL InterpreT:一种用于解释视觉语言转换器的交互式可视化工具。 2022 abs/2203.17247 CoRR公司 https://doi.org/10.48550/arXiv.2203.17247 db/journals/corr/corr2203.html#abs-2203-17247
肖旭0005 吴晨飞 沙查尔·罗森曼 瓦苏德夫·拉尔 南区 桥塔:在视觉语言表征学习中构建编码器之间的桥梁。 2022 abs/2206.08657 CoRR公司 https://doi.org/10.48550/arXiv.2206.08657 db/journals/corr/corr2206.html#abs-2206-08657
阿维纳什·马达苏 埃斯特尔·阿夫拉洛 加布里埃拉·本·梅莱赫·斯坦 邵延曾 格达斯·贝尔塔修斯 瓦苏德夫·拉尔 使用多语言知识传输改进视频检索。 2022 abs/2208.11553 CoRR公司 https://doi.org/10.48550/arXiv.2208.11553 db/journals/corr/corr2208.html#abs-2208-11553
菲利普·霍华德 雅顿·马 瓦苏德夫·拉尔 安娜·保拉·西姆斯 丹尼尔·科拉特 奥伦·佩雷格 莫西·瓦瑟布拉特 加迪·辛格 使用知识图增强的变换器进行跨域方面提取。 2022 abs/2210.10144 CoRR公司 https://doi.org/10.48550/arXiv.2210.10144 db/journals/corr/corr2210.html#abs-2201-10144
菲利普·霍华德 加迪·辛格 瓦苏德夫·拉尔 叶金彩0001 Swabha Swayamdipta公司 神经反事实:超越最小编辑反事实,实现更丰富的数据增强。 2022 abs/2210.12365 CoRR公司 https://doi.org/10.44850/arXiv.2210.12365 db/journals/corr/corr2210.html#abs-220-12365
瓦苏德夫·拉尔 索马克·阿迪蒂亚 杨叶洲 帕斯奎尔·米内尔维尼 桑迪亚·曼纳斯瓦米 第一次神经网络知识注入研讨会(KINN)。 4882-4883 2021 CIKM公司 https://doi.org/10.1145/3459637.3482035 conf/cikm/2021 db/conf/cikm/cikm2021.html#LalAYMM21 瓦苏德夫·拉尔 雅顿·马 埃斯特尔·阿夫拉洛 菲利普·霍华德 安娜·保拉·西姆斯 丹尼尔·科拉特 奥伦·佩雷格 加迪·辛格 莫西·瓦瑟布拉特 解释:一个解释变形金刚的交互式可视化工具。 135-142 2021 EACL(系统演示) https://doi.org/10.18653/v1/2021.eacl-demos.17 https://aclantology.org/2021.eacl-demos.17/ conf/eacl/2021-d db/conf/eacl/eacl2021-d.html#LalMAHSKPSW21
刘永飞 吴晨飞 邵延曾 瓦苏德夫·拉尔 何旭明0001 南区 KD-VLP:使用对象知识提取改进端到端的视觉和语言预训练。 2021 abs/2109.10504 CoRR公司 https://arxiv.org/abs/2109.10504 数据库/期刊/corr/corr2109.html#abs-2109-10504
索马克·阿迪蒂亚 埃斯特尔·阿夫拉洛 乔沙·巴赫 奇塔·巴拉尔 格达斯·贝尔塔修斯 阿纳希塔·比万迪瓦拉 蔡志鹏 阿格尼特·查特吉 万向车 叶金彩0001 大卫·科布利 伊多·达甘 孟都 南区 斯科蒂·福克斯 德鲁巴·戈什 Tejas Gokhale公司 特蒂亚娜·格林伯格 亚尼夫·古维茨 Hannaneh Hajishirzi公司 纳吉卜·哈基姆 何旭明0001 武藏欣克 菲利普·霍华德菲利普·瑞恩·霍华德 亚历山大·胡特亚历山大·胡特 阿亚尔·克莱因 丹尼尔·科拉特 Tiep Le公司 贝莉 刘永飞 古斯塔沃·A·卢扬·莫雷诺 雅顿·马 阿维纳什·马达苏 桑迪亚·曼纳斯瓦米 帕斯奎尔·米内尔维尼 马蒂亚斯·米勒0011 法比奥·诺纳托 马修·奥尔森马修·莱尔·奥尔森 赛亚克·保罗 迈克尔·保利奇 奥伦·佩雷格 亚历克斯·雷登 泽夫·里夫林 沙查尔·罗森曼 威尔·萨克斯顿 路德维希·施密特 安娜·保拉·西姆斯 加迪·辛格 加布里埃拉·本·梅莱赫·斯坦 Swabha Swayamdipta公司 杰里·唐 邵延曾 Vy A.Vo公司 王俊林 莫西·瓦瑟布拉特 戴安娜·沃夫克 吴晨飞 肖旭0005 杨叶洲 拉安娜·叶赫兹克尔Raanan Y.Yehezkel Rohekar先生 让·俞(Jean Yu)