The Larger the Better? Improved LLM Code-Generation via Budget Reallocation

Hassid, Michael; Remez, Tal; Gehring, Jonas; Schwartz, Roy; Adi, Yossi

计算机科学>软件工程

arXiv:2404.00725（cs）

【于2024年3月31日提交】

职务：越大越好？通过预算重新分配改进LLM代码生成

作者：迈克尔·哈西德,塔尔·雷米兹,乔纳斯·格林,罗伊·施瓦茨,约西·阿迪

查看PDF HTML（实验性）

摘要：人们普遍认为大型语言模型（LLM）优于小型语言模型。然而，更大的模型在推理过程中也需要更多的时间和计算。这就引出了一个问题：当两种模型在相同的预算下运行时会发生什么？（例如，计算、运行时）。为了解决这个问题，我们分析了各种大小的代码生成LLM，并进行了比较，例如运行一次70B模型，与从13B模型生成五个输出并选择一个输出进行比较。我们的研究结果表明，在标准的单元测试设置中，重复使用较小的模型可以产生一致的改进，在五项任务中可以获得高达15%的收益。另一方面，在单元测试不可用的情况下，从较小模型中选择基于等级的候选者会低于从较大模型中选择单个输出的性能。我们的结果突出了使用较小模型而不是较大模型的潜力，以及研究对LLM输出进行排名的方法的重要性。

学科：	软件工程（cs.SE）; 人工智能；计算与语言（cs.CL）；机器学习（cs.LG）
引用为：	arXiv:2404.00725[cs.SE]
	（或 arXiv:2404.00725v1[cs.SE]对于此版本）
	https://doi.org/10.48550/arXiv.2404.00725

提交历史记录

发件人：Yossi Adi[查看电子邮件]
[第1版]2024年3月31日星期日15:55:49 UTC（1030 KB）

计算机科学>软件工程

职务：越大越好？通过预算重新分配改进LLM代码生成

提交历史记录

访问纸张：

参考文献和引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐程序和搜索工具

arXivLabs：与社区合作者合作的实验项目

计算机科学>软件工程

职务：越大越好？通过预算重新分配改进LLM代码生成

提交历史记录

访问纸张：

参考文献和引文

BibTeX格式的引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐程序和搜索工具

arXivLabs：与社区合作者合作的实验项目