LLM360: Towards Fully Transparent Open-Source LLMs

Liu, Zhengzhong; Qiao, Aurick; Neiswanger, Willie; Wang, Hongyi; Tan, Bowen; Tao, Tianhua; Li, Junbo; Wang, Yuqi; Sun, Suqi; Pangarkar, Omkar; Fan, Richard; Gu, Yi; Miller, Victor; Zhuang, Yonghao; He, Guowei; Li, Haonan; Koto, Fajri; Tang, Liping; Ranjan, Nikhil; Shen, Zhiqiang; Ren, Xuguang; Iriondo, Roberto; Mu, Cun; Hu, Zhiting; Schulze, Mark; Nakov, Preslav; Baldwin, Tim; Xing, Eric P.

计算机科学>计算与语言

arXiv:2312.06550（cs）

【于2023年12月11日提交】

标题：LLM360：走向完全透明的开放源代码LLM

摘要：最近，开源大型语言模型（LLM）的激增，如LLaMA、Falcon和Mistral，为人工智能从业者和研究人员提供了多种选择。然而，大多数LLM只发布了部分工件，例如最终模型权重或推理代码，并且技术报告越来越将其范围限制在高级设计选择和表面统计。这些选择降低了LLM培训的透明度，迫使团队重新发现培训过程中的许多细节，从而阻碍了该领域的进展。我们介绍LLM360，这是一个完全开源LLM的倡议，它提倡向社区提供所有培训代码和数据、模型检查点和中间结果。LLM360的目标是通过使端到端LLM培训过程透明且人人可复制，支持开放式协作AI研究。作为LLM360的第一步，我们发布了两个7B参数的LLM，即Amber和CrystalCoder，它们经过了从头开始的预训练，包括它们的训练代码、数据、中间检查点和分析（位于此https URL). 我们致力于通过这一开源努力不断推动LLM的发展。更多大规模和更强的模型正在进行中，并将在未来发布。

学科：	计算与语言（cs.CL）; 人工智能；机器学习（cs.LG）
引用为：	arXiv:2312.06550【cs.CL】
	（或 arXiv:2312.06550v1【cs.CL】对于此版本）
	https://doi.org/10.48550/arXiv.2312.06550

提交历史记录

发件人：Willie Neiswanger[查看电子邮件]
[第1版]2023年12月11日星期一17:39:00 UTC（9845 KB）

计算机科学>计算与语言

标题：LLM360：走向完全透明的开放源代码LLM

提交历史记录

访问纸张：

参考文献和引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目

计算机科学>计算与语言

标题：LLM360：走向完全透明的开放源代码LLM

提交历史记录

访问纸张：

参考文献和引文

BibTeX格式的引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目