开放语言模型:OLMo
最先进、真正开放的LLM和框架
OLMo和框架包括:
完整的预培训数据: 该模型基于AI2 多尔马 数据集,具有用于语言模型预训练的3万亿令牌开放语料库,包括生成训练数据的代码。 培训代码和模型权重: OLMo框架包括四个7B级模型变体的完整模型权重,每个变体都经过至少2T的训练。 推理代码、训练指标和训练日志均已提供。 评价: 我们发布了开发中使用的评估套件,在Catwalk项目的保护下,在培训过程中每1000个步骤和评估代码中,每个模型有500多个检查点。
OLMo为研究人员和开发人员提供了什么
更精确: 通过对模型背后的训练数据的全面了解,研究人员将能够更快地工作,不再需要依赖模型性能的定性假设 减少碳排放: 通过开放完整的培训和评估生态系统,它从根本上减少了开发冗余,这对人工智能的脱碳至关重要 持久效果: 将模型及其数据集保持在开放状态,而不是在API背后,这使研究人员能够从以前的模型和工作中学习和构建。