Breaking Language Barriers with a LEAP: Learning Strategies for Polyglot LLMs

Nambi, Akshay; Balloli, Vaibhav; Ranjit, Mercy; Ganu, Tanuja; Ahuja, Kabir; Sitaram, Sunayana; Bali, Kalika

计算机科学>计算与语言

arXiv:2305.17740（cs）

【于2023年5月28日提交】

标题：用LEAP打破语言障碍：Polyglot LLM的学习策略

作者：阿克沙伊·南比,瓦比哈夫·巴洛利,仁慈的兰吉特,塔努贾·加努,卡比尔·阿胡加,Sunayana Sitaram公司,卡利卡-巴厘岛

查看PDF

摘要：大型语言模型（LLM）处于全球众多领域转换的前沿。然而，对于非拉丁语脚本和低资源语言，它们的包容性和有效性仍然有限。本文解决了增强LLM多语言性能的迫切挑战，特别关注生成模型。通过使用流行的问答（QA）数据集对多种语言进行系统调查和评估，我们提出了新的技术，可以在多语言环境中释放LLM的真正潜力。我们的方法包括三个关键战略，它们显著提高了多语言能力。首先，通过精心优化为多语言LLM量身定制的提示，我们释放了它们的潜在能力，从而大大提高了跨语言的性能。其次，我们引入了一种新的混合方法，该方法将GPT生成与多语言嵌入协同起来，并在关键任务（如QA和检索）上实现了显著的多语言性能改进。最后，为了进一步提高多语言LLM的性能，我们引入了一种新的学习算法，该算法可以动态选择最佳提示策略、LLM模型和每个查询的嵌入。这种动态适应最大限度地提高了语言间LLM的效率，优于最佳的静态和随机策略。我们的研究结果表明，在多种语言的多语言理解和生成方面取得了显著进步。

学科：	计算与语言（cs.CL）; 人工智能（cs.AI）
引用为：	arXiv:2305.17740【cs.CL】
	（或 arXiv:2305.17740v1【cs.CL】对于此版本）
	https://doi.org/10.48550/arXiv.2305.17740

提交历史记录

发件人：Akshay Nambi[查看电子邮件]
[第1版]2023年5月28日，星期日14:48:38 UTC（712 KB）

计算机科学>计算与语言

标题：用LEAP打破语言障碍：Polyglot LLM的学习策略

提交历史记录

访问纸张：

参考文献和引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目

计算机科学>计算与语言

标题：用LEAP打破语言障碍：Polyglot LLM的学习策略

提交历史记录

访问纸张：

参考文献和引文

BibTeX格式的引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目