NeuroPrompts:一个自适应框架，用于优化文本到图像生成的提示。

瓦苏德夫·拉尔沙查尔·罗森曼瓦苏德夫·拉尔菲利普·霍华德 NeuroPrompts:一个自适应框架，用于优化文本到图像生成的提示。 159-167 2024 EACL（演示） https://aclantology.org/2024.eacl-demo.17 conf/eacl/2024d db/conf/eacl/eacl2024d.html#RosenmanLH24

阿格尼特·查特吉加布里埃拉·本·梅莱赫·斯坦埃斯特尔·阿夫拉洛沙亚克·保罗德鲁巴·戈什 Tejas Gokhale公司路德维希·施密特 Hannaneh Hajishirzi公司瓦苏德夫·拉尔奇塔·巴拉尔杨叶洲正确操作：改进文本到图像模型中的空间一致性。 2024 腹肌/2404.01197 CoRR公司 https://doi.org/10.48550/arXiv.2404.01197 数据库/期刊/corr/corr2404.html#abs-2404-01197

武藏欣克马修·奥尔森大卫·科布利邵延曾瓦苏德夫·拉尔 LLaVA-Gemma：使用紧凑语言模型加速多模态基础模型。 2024 abs/2404.01331 CoRR公司 https://doi.org/10.48550/arXiv.2404.01331 数据库/期刊/corr/corr2404.html#abs-2404-01331

加布里埃拉·本·梅莱赫·斯坦 Raanan Y.Yehezkel Rohekar先生亚尼夫·古维茨马修·莱尔·奥尔森阿纳希塔·比万迪瓦拉埃斯特尔·阿夫拉洛吴晨飞南区邵延曾瓦苏德夫·拉尔 LVLM-Intreplet：一个用于大型可视语言模型的可解释工具。 2024 abs/2404.03118 CoRR公司 https://doi.org/10.44850/arXiv.2404.03118 数据库/期刊/corr/corr2404.html#abs-2404-03118

阿维纳什·马达苏埃斯特尔·阿夫拉洛加布里埃拉·本·梅莱赫·斯坦沙查尔·罗森曼邵延曾格达斯·贝尔塔修斯瓦苏德夫·拉尔 MuMUR：多语言多模式通用检索。 5 2023 六月 26 Inf.Retr.（信息回收）。J。 1 https://doi.org/10.1007/s10791-023-09422-5 db/journals/ir/ir26.html#MadasuASRTBL23

肖旭0005 吴晨飞沙查尔·罗森曼瓦苏德夫·拉尔万向车南区 BridgePower:在视觉语言表征学习中构建编码器之间的桥梁。 10637-10647 2023 AAAI公司 https://doi.org/10.1609/aaai.v37i9.26263 conf/aaai/2023 db/conf/aaai/aaai2023.html#0005WRLCD23 肖旭0005 贝莉吴晨飞邵延曾阿纳希塔·比万迪瓦拉沙查尔·罗森曼瓦苏德夫·拉尔万向车南区 ManagerTower：汇集统一模式专家对视觉语言表征学习的见解。 14507-14525 2023 ACL（1） https://doi.org/10.18653/v1/2023.acl-long.811 https://aclantology.org/2023.acl-long.811 conf/acl/2023-1 db/conf/acl/acl2023-1.html#0005LWTBRLCD23 阿维纳什·马达苏瓦苏德夫·拉尔多模态视觉监控对语言有益吗？ 2637-2642 2023 CVPR研讨会 https://doi.org/10.1109/CVPRW59228.2023.00263 conf/cvpr/2023w公司 db/conf/cvpr/cvprw2023.html#MadasuL23 阿维纳什·马达苏埃斯特尔·阿夫拉洛加布里埃拉·本·梅莱赫·斯坦邵延曾格达斯·贝尔塔修斯瓦苏德夫·拉尔使用多语言知识转移改进视频检索。 669-684 2023 ECIR（1） https://doi.org/10.1007/978-3-031-28244-7_42 conf/ecir/2023-1 db/conf/ecir/ecir2023-1.html#MadasuASTBL23 Tiep Le公司瓦苏德夫·拉尔菲利普·霍华德 COCO-Counterfactals:自动构建的图像-文本对反事实示例。 2023 NeurIPS公司 http://papers.nips.cc/paper_files/paper/2023/hash/e14e4cb8266184ceb234973dfe07faed-Abstract-Datasets_and_Barkets.html conf/nips/2023 db/conf/nips/neurips2023.html#LeLH23 杰里·唐孟都 Vy A.Vo公司瓦苏德夫·拉尔亚历山大·胡特基于多模态变换器的大脑编码模型可以跨语言和视觉进行转换。 2023 NeurIPS公司 http://papers.nips.cc/paper_files/paper/2023/hash/5ebbbac62b968254093023f1c95015d3-Abstract-Conference.html conf/nips/2023 db/conf/nips/neurips2023.html#TangDVLH23

阿维纳什·马达苏瓦苏德夫·拉尔多模态视觉监控对语言有益吗？ 2023 abs/2302.05016 CoRR公司 https://doi.org/10.48550/arXiv.2302.05016 db/journals/cor/corr2302.html#abs-2302-05016数据库

加迪·辛格乔沙·巴赫特蒂亚娜·格林伯格纳吉卜·哈基姆菲利普·霍华德瓦苏德夫·拉尔泽夫·里夫林 Thrill-K体系结构：解决基于知识的理解问题。 2023 abs/2303.12084 CoRR公司 https://doi.org/10.48550/arXiv.2303.12084 数据库/期刊/corr/corr2303.html#abs-2303-12084

菲利普·霍华德王俊林瓦苏德夫·拉尔加迪·辛格叶金彩0001 Swabha Swayamdipta公司神经比较：比较知识的神经符号提炼。 2023 abs/2305.04978 CoRR公司 https://doi.org/10.48550/arXiv.2305.04978 数据库/期刊/corr/corr2305.html#abs-2305-04978

加布里埃拉·本·梅莱赫·斯坦戴安娜·沃夫克斯科蒂·福克斯亚历克斯·雷登威尔·萨克斯顿让·俞（Jean Yu）埃斯特尔·阿夫拉洛邵延曾法比奥·诺纳托马蒂亚斯·米勒0011 瓦苏德夫·拉尔 LDM3D：三维潜在扩散模型。 2023 abs/2305.10853 CoRR公司 https://doi.org/10.48550/arXiv.2305.10853 数据库/期刊/corr/corr2305.html#abs-2305-10853

杰里·唐孟都 Vy A.Vo公司瓦苏德夫·拉尔亚历山大·胡特基于多模态变换器的大脑编码模型可以跨语言和视觉进行转换。 2023 abs/2305.12248 CoRR公司 https://doi.org/10.48550/arXiv.2305.12248 数据库/期刊/corr/corr2305.html#abs-2305-12248

肖旭0005 贝莉吴晨飞邵延曾阿纳希塔·比万迪瓦拉沙查尔·罗森曼瓦苏德夫·拉尔万向车南区 ManagerTower：汇集统一模式专家对视觉语言表征学习的见解。 2023 abs/2306.00103 CoRR公司 https://doi.org/10.48550/arXiv.2306.00103 数据库/期刊/corr/corr2306.html#abs-2306-00103

阿维纳什·马达苏瓦苏德夫·拉尔 ICSVR：研究视频检索模型中的合成和语义理解。 2023 腹肌/2306.16533 CoRR公司 https://doi.org/10.48550/arXiv.2306.16533 db/journals/corr/corr2306.html#abs-2306-16533

Tiep Le公司瓦苏德夫·拉尔菲利普·霍华德 COCO-Counterfactals:自动构建的图像-文本对反事实示例。 2023 abs/2309.14356 CoRR公司 https://doi.org/10.48550/arXiv.2309.14356 数据库/期刊/corr/corr2309.html#abs-2309-14356

菲利普·霍华德阿维纳什·马达苏 Tiep Le公司古斯塔沃·A·卢扬·莫雷诺瓦苏德夫·拉尔用反事实例子探讨视觉语言模型中的交叉偏见。 2023 abs/2310.02988 CoRR公司 https://doi.org/10.48550/arXiv.2310.02988 db/journals/corr/corr2310.html#abs-2310-02988

阿维纳什·马达苏 Anahita比旺迪瓦拉瓦苏德夫·拉尔视频理解任务中视觉语言模型的零拍能力分析。 2023 abs/2310.04914 CoRR公司 https://doi.org/10.48550/arXiv.2310.04914 db/journals/corr/corr2310.html#abs-230-04914

加布里埃拉·本·梅莱赫·斯坦戴安娜·沃夫克埃斯特尔·阿夫拉洛邵延曾蔡志鹏迈克尔·保利奇瓦苏德夫·拉尔 LDM3D-VR：3D VR的潜在扩散模型。 2023 abs/2311.03226 CoRR公司 https://doi.org/10.48550/arXiv.2311.03226 db/journals/corr/corr2311.html#abs-2311-03226

沙查尔·罗森曼瓦苏德夫·拉尔菲利普·霍华德 NeuroPrompts:一个自适应框架，用于优化文本到图像生成的提示。 2023 abs/2311.12229 CoRR公司 https://doi.org/10.48550/arXiv.2311.12229 db/journals/corr/corr2311.html#abs-2311-12229

菲利普·霍华德阿维纳什·马达苏 Tiep Le公司古斯塔沃·A·卢扬·莫雷诺阿纳希塔·比万迪瓦拉瓦苏德夫·拉尔用反事实的例子探讨和缓解视觉语言模型中的交叉社会偏见。 2023 腹肌/231200825 CoRR公司 https://doi.org/10.44850/arXiv.2312.00825网址 db/journals/corr/corr2312.html#abs-2312-00825

加迪·辛格乔沙·巴赫特蒂亚娜·格林伯格纳吉卜·哈基姆菲利普·瑞恩·霍华德瓦苏德夫·拉尔泽夫·里夫林 Thrill-K体系结构：解决基于知识的理解问题。 404至412 2022 AGI公司 https://doi.org/10.1007/978-3-031-19907-3_39 conf/agi/2022 db/conf/agi/agi2022.html#歌手BGHHLR22 菲利普·霍华德雅顿·马瓦苏德夫·拉尔安娜·保拉·西姆斯丹尼尔·科拉特奥伦·佩雷格莫西·瓦瑟布拉特加迪·辛格使用知识图增强的变换器进行跨域方面提取。 780-790 2022 CIKM公司 https://doi.org/10.1145/3511808.3557275 conf/cikm/2022 db/conf/cikm/cikm2022.html#HowardMLSKPWS22 埃斯特尔·阿夫拉洛孟都邵延曾刘永飞吴晨飞南区瓦苏德夫·拉尔 VL-InterpreT：解释视觉语言变形金刚的交互式可视化工具。 21374-21383 2022 CVPR公司 https://doi.org/10.109/CVPR52688.2022.02072 conf/cvpr/2022 db/conf/cvpr/cvpr2022.html#AflaloDTLWDL22 菲利普·霍华德加迪·辛格瓦苏德夫·拉尔叶金彩0001 Swabha Swayamdipta公司神经反事实：超越最小编辑反事实，实现更丰富的数据增强。 5056-5072 2022 EMNLP（调查结果） https://doi.org/10.18653/v1/2022.findings-emnlp.371 https://aclantology.org/2022.findings-emnlp.371 conf/emnlp/2022f db/conf/emnlp/emnlp2022f.html#HowardSLCS22 刘永飞吴晨飞邵延曾瓦苏德夫·拉尔何旭明0001 南区 KD-VLP：使用对象知识提取改进端到端的视觉和语言预训练。 1589-1600 2022 NAACL-HLT（调查结果） https://doi.org/10.18653/v1/2022.findings-naacl.119 https://aclantology.org/2022.findings-naacl.119 conf/naacl/2022f db/conf/naacl/naacl2022f.html#LiuWTL0D22 阿亚尔·克莱因奥伦·佩雷格丹尼尔·科拉特瓦苏德夫·拉尔莫西·瓦瑟布拉特伊多·达甘基于Opinion的跨域方面术语提取的关系旋转。 104至112 2022 WASSA@ACL https://doi.org/10.18653/v1/2022.wassa-1.11 https://aclantology.org/2022.wassa-1.11 conf/wassa/2022 db/conf/wassa/wassa2022.html#KleinPKLWD22

埃斯特尔·阿夫拉洛孟都邵延曾刘永飞吴晨飞南区瓦苏德夫·拉尔 VL InterpreT：一种用于解释视觉语言转换器的交互式可视化工具。 2022 abs/2203.17247 CoRR公司 https://doi.org/10.48550/arXiv.2203.17247 db/journals/corr/corr2203.html#abs-2203-17247

肖旭0005 吴晨飞沙查尔·罗森曼瓦苏德夫·拉尔南区桥塔：在视觉语言表征学习中构建编码器之间的桥梁。 2022 abs/2206.08657 CoRR公司 https://doi.org/10.48550/arXiv.2206.08657 db/journals/corr/corr2206.html#abs-2206-08657

阿维纳什·马达苏埃斯特尔·阿夫拉洛加布里埃拉·本·梅莱赫·斯坦邵延曾格达斯·贝尔塔修斯瓦苏德夫·拉尔使用多语言知识传输改进视频检索。 2022 abs/2208.11553 CoRR公司 https://doi.org/10.48550/arXiv.2208.11553 db/journals/corr/corr2208.html#abs-2208-11553

菲利普·霍华德雅顿·马瓦苏德夫·拉尔安娜·保拉·西姆斯丹尼尔·科拉特奥伦·佩雷格莫西·瓦瑟布拉特加迪·辛格使用知识图增强的变换器进行跨域方面提取。 2022 abs/2210.10144 CoRR公司 https://doi.org/10.48550/arXiv.2210.10144 db/journals/corr/corr2210.html#abs-2201-10144

菲利普·霍华德加迪·辛格瓦苏德夫·拉尔叶金彩0001 Swabha Swayamdipta公司神经反事实：超越最小编辑反事实，实现更丰富的数据增强。 2022 abs/2210.12365 CoRR公司 https://doi.org/10.44850/arXiv.2210.12365 db/journals/corr/corr2210.html#abs-220-12365

瓦苏德夫·拉尔索马克·阿迪蒂亚杨叶洲帕斯奎尔·米内尔维尼桑迪亚·曼纳斯瓦米第一次神经网络知识注入研讨会（KINN）。 4882-4883 2021 CIKM公司 https://doi.org/10.1145/3459637.3482035 conf/cikm/2021 db/conf/cikm/cikm2021.html#LalAYMM21 瓦苏德夫·拉尔雅顿·马埃斯特尔·阿夫拉洛菲利普·霍华德安娜·保拉·西姆斯丹尼尔·科拉特奥伦·佩雷格加迪·辛格莫西·瓦瑟布拉特解释：一个解释变形金刚的交互式可视化工具。 135-142 2021 EACL（系统演示） https://doi.org/10.18653/v1/2021.eacl-demos.17 https://aclantology.org/2021.eacl-demos.17/ conf/eacl/2021-d db/conf/eacl/eacl2021-d.html#LalMAHSKPSW21

刘永飞吴晨飞邵延曾瓦苏德夫·拉尔何旭明0001 南区 KD-VLP：使用对象知识提取改进端到端的视觉和语言预训练。 2021 abs/2109.10504 CoRR公司 https://arxiv.org/abs/2109.10504 数据库/期刊/corr/corr2109.html#abs-2109-10504

索马克·阿迪蒂亚埃斯特尔·阿夫拉洛乔沙·巴赫奇塔·巴拉尔格达斯·贝尔塔修斯阿纳希塔·比万迪瓦拉蔡志鹏阿格尼特·查特吉万向车叶金彩0001 大卫·科布利伊多·达甘孟都南区斯科蒂·福克斯德鲁巴·戈什 Tejas Gokhale公司特蒂亚娜·格林伯格亚尼夫·古维茨 Hannaneh Hajishirzi公司纳吉卜·哈基姆何旭明0001 武藏欣克菲利普·霍华德菲利普·瑞恩·霍华德亚历山大·胡特亚历山大·胡特阿亚尔·克莱因丹尼尔·科拉特 Tiep Le公司贝莉刘永飞古斯塔沃·A·卢扬·莫雷诺雅顿·马阿维纳什·马达苏桑迪亚·曼纳斯瓦米帕斯奎尔·米内尔维尼马蒂亚斯·米勒0011 法比奥·诺纳托马修·奥尔森马修·莱尔·奥尔森赛亚克·保罗迈克尔·保利奇奥伦·佩雷格亚历克斯·雷登泽夫·里夫林沙查尔·罗森曼威尔·萨克斯顿路德维希·施密特安娜·保拉·西姆斯加迪·辛格加布里埃拉·本·梅莱赫·斯坦 Swabha Swayamdipta公司杰里·唐邵延曾 Vy A.Vo公司王俊林莫西·瓦瑟布拉特戴安娜·沃夫克吴晨飞肖旭0005 杨叶洲拉安娜·叶赫兹克尔Raanan Y.Yehezkel Rohekar先生让·俞（Jean Yu）