WizardCoder: Empowering Code Large Language Models with Evol-Instruct

Luo, Ziyang; Xu, Can; Zhao, Pu; Sun, Qingfeng; Geng, Xiubo; Hu, Wenxiang; Tao, Chongyang; Ma, Jing; Lin, Qingwei; Jiang, Daxin

计算机科学>计算与语言

arXiv公司：2306.08568（cs）

【于2023年6月14日提交】

标题：WizardCoder：使用进化构造增强代码大型语言模型

作者：紫阳罗,残旭（Can Xu）,Pu Zhao先生,太阳清风,耿秀波,胡文祥,崇阳陶,Jing Ma公司,林庆伟,大新江

查看PDF

摘要：代码大型语言模型（Code LLM），例如StarCoder，在与代码相关的任务中表现出了卓越的性能。然而，大多数现有模型仅在大量原始代码数据上进行预处理，而没有进行指令微调。本文介绍了WizardCoder，它通过将Evol-Instruct方法应用于代码领域，使代码LLM能够进行复杂的指令微调。通过对四个著名的代码生成基准测试（即HumanEval、HumanEval+、MBPP和DS-1000）的综合实验，我们揭示了我们模型的卓越功能。它远远超过了所有其他开源代码LLM。此外，在HumanEval和HumanEval+上，我们的模型甚至优于最大的封闭LLM，Anthropic的Claude和谷歌的Bard。我们的代码、模型权重和数据在此https URL

评论：	大型语言模型、代码生成、代码LLM
学科：	计算与语言（cs.CL）; 人工智能（cs.AI）
引用为：	arXiv公司：2306.08568【cs.CL】
	（或 arXiv:2306.08568v1【cs.CL】对于此版本）
	https://doi.org/10.48550/arXiv.2306.08568

提交历史记录

发件人：Can Xu[查看电子邮件]
[第1版]2023年6月14日星期三15:18:48 UTC（2672 KB）

全文链接：

访问纸张：

查看许可证

当前浏览上下文：

完。氯

<上一版本 | 下一个>

新的 | 最近的 |2023-06

更改为浏览方式：

反恐精英
完。人工智能

参考文献和引文

导出BibTeX引文

计算机科学>计算与语言

标题：WizardCoder：使用进化构造增强代码大型语言模型

提交历史记录

访问纸张：

参考文献和引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目

计算机科学>计算与语言

标题：WizardCoder：使用进化构造增强代码大型语言模型

提交历史记录

访问纸张：

参考文献和引文

BibTeX格式的引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目