关于AllenNLP
最近的论文
评估用于代码生成的库的上下文学习 Arkil Patel、Siva Reddy、Dzmitry Bahdanau、Pradeep Dasigi NAACL公司 • 2024 当代大型语言模型(LLM)具有高度的代码生成和理解能力。 一个特别有前途的领域是他们能够解释来自不熟悉库的代码模块,以解决用户指示的任务。 最近的工作… BTR:高效检索增强语言模型的二进制令牌表示 曹庆庆、苏文敏、王毅忠、汉娜妮·哈吉什尔兹 ICLR公司 • 2024 检索增强解决了大型语言模型中的许多关键问题,如幻觉、陈腐和隐私泄漏。 然而,由于要处理大量的… MathVista:在视觉环境中评估基础模型的数学推理 潘璐、Hritik Bansal、Tony Xia、Jiacheng Liu、Chun-yue Li、Hannaneh Hajishirzi、Hao Cheng、Kai-Wei Chang、Michel Galley、Jianfeng Gao ICLR公司 • 2024 大型语言模型(LLM)和大型多模态模型(LMM)在许多任务和领域中表现出令人印象深刻的问题解决能力,但它们在视觉环境中的数学推理能力尚未得到系统研究。 为了弥合这一差距,我们… 自我RAG:通过自我反思学习检索、生成和批判 Akari Asai、Zeqiu Wu、Yizhong Wang、Avirup Sil、Hannaneh Hajishirzi ICLR公司 • 2024 尽管大型语言模型(LLM)具有非凡的功能,但由于它们仅依赖于所封装的参数知识,因此它们通常会产生包含事实不准确的响应。 检索增强生成(RAG),一种特殊的方法… SILO语言模型:隔离非参数数据存储中的法律风险 Sewon Min、Suchin Gururangan、Eric Wallace、Hannaneh Hajishirzi、Noah A.Smith、Luke Zettlemoyer ICLR公司 • 2024 针对受版权保护或其他限制的数据训练语言模型(LM)的合法性正处于激烈的辩论中。 然而,如我们所示,如果只对低风险文本(例如,盗版书籍或政府……)进行培训,模型性能会显著下降…