提高人工智能模型和产品的性能。

OverflowAPI是一种基于订阅的API服务,它提供对Stack Overflow的公共数据集的连续访问,以训练和微调大型语言模型。

成为合作伙伴

世界领先的AI公司与Stack Overflow合作。

了解我们如何通过创新的、对社会负责的人工智能解决方案,共同为开发人员赋权:

谷歌云

堆栈溢出和谷歌云合作伙伴通过Stack Overflow平台、谷歌云控制台和Duet AI将Generative AI带给数百万开发者。

阅读公告
开放人工智能

堆栈溢出和OpenAI合作伙伴加强世界上最流行的大型语言模型。

阅读公告

加入我们,创造一个对社会负责的人工智能新时代。

我们认为,人工智能模型和产品必须提供适当的属性,并为创建和管理为其提供燃料的数据的社区贡献价值。进一步了解我们对社会责任AI的定义以及我们需要合作伙伴作出的承诺。

阅读博客

获取商业用例的高质量技术内容。

只有42%的开发人员相信AI工具的准确性。1利用Stack Overflow的数据集提高准确性、产品差异化和个性化。

58M+人工生成的问题和答案,以及来自用户和主持人的反馈信号。
一流的技术专长和经验,用自然语言表达,是LLM培训的理想选择。
包括与编码、建议、调试、解释、测试、审查、头脑风暴和故障排除相关的各种任务。
持续获取新创建的最新技术知识。

使用专门且精确的数据提高模型性能。

根据内部和独立测试,对堆栈溢出数据进行微调,可显著提高模型性能。

图1。“完美”答案的百分比(内部测试)

基于专有的1000个问答评估集,其中包含从Stack Exchange和Prosus AI Assistant技术问答中创建的基本事实答案(用户评分最高)。

14.13%
指令微调
MPT 30B型
31.52%
烟囱溢流训练微调
MPT 30B型
37.38%
代码已微调
代码Llama-2 34B指令微调
55.30%
堆栈溢出微调
代码Llama-2 34B
叠前溢流培训/微调
叠后溢流培训/微调

图2.'InCoder车型

InCoder发现堆栈溢出数据改进了HumanEval基准测试和MBPP(主要是基本Python编程)性能。
基线
使用堆栈溢出数据
HumanEval公司通过@1
5
9
MBPP公司通过@1
6.1
9.8