新技术走向主流意味着什么?
Git于2005年首次发布,在我们创建GitHub时,它仍然是一个新的开源版本控制系统。今天,Git是现代开发人员体验的基本元素,93%的开发人员使用它在各地构建和部署软件.
2023年,GitHub的数据突显出另一项技术如何迅速开始重塑开发人员体验:人工智能。去年,越来越多的开发人员开始使用人工智能,同时也在尝试构建人工智能驱动的应用程序。Git从根本上改变了当今的开发者体验,现在AI正在为软件开发的下一步做准备。
在GitHub,我们知道开发人员喜欢边做边学,开源帮助开发人员更快地采用新技术,将其集成到工作流中,并构建下一步。开源还为几乎所有现代软件提供了动力,其中包括大部分数字经济。随着我们探索技术如何成为主流,GitHub继续在弥合实验和开源技术广泛采用之间的差距方面发挥着关键作用,开源技术是我们软件生态系统的基础。
在今年的报告中,我们将研究围绕AI、云和Git的开源活动如何改变了开发人员的体验,并越来越在开发人员和组织中产生影响。
我们揭示了三大趋势:
- 开发人员正在大量使用生成性人工智能进行构建。我们看到越来越多的开发人员尝试使用OpenAI和其他AI参与者的基础模型,2023年,开源生成性AI项目甚至进入了最受欢迎的开源项目前十名。几乎所有的开发人员(92%)都在使用或试验AI编码工具,我们希望开源开发人员在GitHub上推动下一波AI创新。
- 开发人员正在大规模运行云计算应用程序。我们看到,使用基于Git的基础设施作为代码(IaC)工作流的声明性语言有所增加,云部署更加标准化,开发人员使用Dockerfiles和容器、IaC以及其他云主动技术的速度急剧增加。
- 2023年,首次开源贡献者数量最多。我们继续看到商业支持的开源项目在首次贡献者和总体贡献者中占据最大份额,但今年,我们也看到生成性人工智能项目进入了首次贡献者最受欢迎的前10个项目。我们还看到GitHub上的私人项目显著增长,同比增长38%,占GitHub上所有活动的80%以上。
凯尔·戴格尔
首席运营官//GitHub
💡哦,如果你是一个视觉学习者,我们会为你介绍。👇
在全球范围内,开发人员正在使用GitHub构建软件,并以前所未有的数量进行协作,这涉及公共和私人项目。这不仅证明了Git在当今开发人员体验中的基本价值,也展示了使用GitHub构建软件的全球开发人员社区。
在过去一年中,美国拥有2020万开发人员,开发人员增长率达到21%,继续是全球最大的开发人员社区。但自2013年以来,我们继续看到其他社区在该平台上实现了更多增长,我们希望这种增长能够继续下去。GitHub上开发者的全球分布显示了哪些地区拥有最多的开发者。
亚太、非洲、南美和欧洲的开发商社区逐年扩大,其中印度、巴西和日本处于领先地位。
预测未来五年前十大开发商社区
为了了解哪些开发商社区在未来五年内将实现最大的增长,我们根据当前的增长率进行了预测。根据这一标准,我们预计到2027年,印度将取代美国成为GitHub最大的开发商社区。
亚太地区发展最快的开发者社区
在印度、日本和新加坡的经济中心的推动下,我们继续看到亚太地区的大幅增长。
|
#个开发人员 |
同比增长 |
01新加坡 |
>100万开发者 |
39% |
02印度 |
>1320万开发商 |
36% |
03香港特别行政区 |
>160万开发者 |
35% |
04越南 |
>150万开发商 |
34% |
05印度尼西亚 |
>290万开发者 |
31% |
06日本 |
>280万开发商 |
31% |
07菲律宾 |
>130万开发商 |
31% |
08泰国 |
>857000名开发者 |
25% |
09韩国 |
>190万开发者 |
22% |
10澳大利亚 |
>140万开发者 |
21% |
表1:2023年开发商总数的增长,比2022年增长%。
印度的开发者社区继续保持着巨大的同比增长。
在去年的八月份,我们预测印度的总开发人口将超过美国。这仍在发生的轨道上。印度的开发者人数同比增长36%,2023年有350万新开发者加入GitHub。
作为联合国支持的一部分数字公共产品联盟,印度一直在建设数字公共基础设施通过开放材料——从软件代码到人工智能模型——来改进数字支付和电子商务系统。这里有一个开源软件(OSS)项目列表印度开发者已经在GitHub上构建并正在为之做出贡献。
新加坡今年在亚太地区的开发商人数增长最快,开发商占总人口比例居全球首位。
这个新加坡国立大学计算机学院将GitHub纳入其课程,而该国的高增长也可能归因于该国在东南亚的监管重要性。
我们还可能看到日本开发商持续增长由于其技术和创业投资.
非洲发展最快的开发者社区
随着世界上人口增长最快和开发商数量不断增加,非洲地区已识别成为科技公司有希望的中心。(例如,在肯尼亚,小学和中学必须进行编程教学。)
|
#个开发人员 |
同比增长 |
01尼日利亚 |
>868K开发者 |
45% |
02加纳 |
>152K名开发者 |
41% |
03肯尼亚 |
>296000名开发者 |
41% |
04摩洛哥 |
>446000名开发者 |
35% |
05埃塞俄比亚 |
>94K名开发者 |
32% |
06南非 |
>539K开发人员 |
30% |
表2:2023年开发商总数的增长,比2022年增长%。
尼日利亚是开放源码软件采用和技术投资的热点,年增长率为45%-这是全球增幅最大的-反映了这一点。还有至少200个收藏尼日利亚开发商在GitHub上的项目,可以在“非洲制造“集合。
南美洲发展最快的开发商社区
南美洲的开发商增长率与亚太和非洲一些增长最快的开发商社区不相上下。
|
#个开发人员 |
同比增长 |
01阿根廷 |
>925K开发者 |
33% |
02玻利维亚 |
>105K开发者 |
33% |
03哥伦比亚 |
>872K开发者 |
31% |
04巴西 |
>430万开发者 |
30% |
05智利 |
>437000名开发者 |
26% |
表3:2023年开发商总数的增长,比2022年增长%。
2023年,巴西的开发商人数是该地区最多的,并继续以两位数的速度增长,同比增长30%。以下继续巴西私人和公共组织的投资。请查看OSS项目列表巴西开发商在GitHub上制作并正在为之做出贡献。
我们还看到阿根廷和哥伦比亚的持续增长,这两个国家在过去几年里成为了组织的热门投资目标。
欧洲发展最快的开发者社区
整个欧洲的社区继续看到其总体开发人员人数的增加,但由于南美洲、非洲和亚太地区社区的增长速度超过了他们,他们的发展现在更接近于美国的总体发展。
|
#的开发人员 |
同比增长 |
01西班牙 |
>150万开发商 |
25% |
02葡萄牙 |
>41万开发人员 |
24% |
03波兰 |
>120万开发商 |
24% |
04德国 |
>290万开发者 |
22% |
05意大利 |
>110万开发人员 |
22% |
06法国 |
>230万开发商 |
22% |
07英国 |
>340万开发者 |
21% |
表4:2023年开发商总数的增长,比2022年增长%。
值得注意的是,法国的增长与政府推动吸引更多科技初创企业.我们还看到西班牙和意大利的增长也在上升,这说明这两个地区为支持其国内技术市场所做的努力。
2023年生成性人工智能的爆炸性增长
虽然生成性人工智能在2023年的新闻头条上大放异彩,但它对GitHub上的开发人员来说并不完全陌生。事实上,在过去几年里,我们已经看到GitHub上出现了几个生成性人工智能项目,还有许多其他以人工智能为中心的项目。
但GitHub 2023年的数据反映了这些人工智能项目是如何从更专业的工作和研究发展到更主流的采用的,开发者越来越多地使用预先训练的模型和API来构建生成的人工智能应用程序。
就在过去一年的一半,我们看到2023年生成性人工智能项目的数量是2022年的两倍多。我们知道这只是冰山一角。
随着越来越多的开发人员尝试这些新技术,我们期望他们推动软件开发中的人工智能创新,并继续将该技术快速发展的能力带入主流。
开发人员越来越多地尝试人工智能模型。在过去的几年中,我们看到开发人员使用机器学习库构建项目,例如张量流,喷灯,我们现在看到更多的开发人员在试验AI模型和LLM,例如ChatGPT API.
保持聪明:我们预计企业和组织也会利用预先训练好的人工智能模型,尤其是随着越来越多的开发人员熟悉使用这些模型进行构建。
开源人工智能创新是多样的,顶级人工智能项目由个人开发者拥有。分析GitHub上前20个开源生成性人工智能项目,其中一些顶级项目为个人所有。这表明,GitHub上的开源项目将继续推动创新,并向我们展示行业的下一步发展,社区将围绕最令人兴奋的进步进行建设。
生成性人工智能正在推动全球生成性人工免疫项目个人贡献者的大幅增长,同比增长148%,生成性人工神经项目总数同比增长248%。值得注意的是,美国、印度和日本在开发社区中领先,其他地区包括香港(SAR)、英国和巴西紧随其后。
💡学习生成性人工智能的开发人员数量的大幅增加将影响企业。随着越来越多的开发人员熟悉构建生成性AI驱动的应用程序,我们希望不断增长的人才库能够支持那些寻求开发自己的AI驱动产品和服务的企业。
底线是:在过去的一年中,我们看到在基础模型(如ChatGPT)之上构建的应用程序呈指数级增长,因为开发人员使用这些LLM开发用户界面工具,如API、机器人、助手、移动应用程序和插件。全球的开发人员正在帮助为主流应用奠定基础,而实验正在帮助组织建立人才库。
最流行的编程语言
自2019年云计算开发出现大幅增长以来,IaC在开源领域继续增长2023年,Shell和Hashicorp配置语言(HCL)再次成为开放源码项目中的顶级语言,这表明操作和IaC工作在开放源码领域越来越突出。
- HCL的采用率同比增长了36%,这表明开发人员正在为其应用程序使用基础设施。
- HCL的增加表明,开发人员越来越多地使用声明性语言来决定他们如何利用云部署。
JavaScript再次成为第一大流行语言,我们继续看到一些熟悉的语言,如Python和Java,仍然是前五大语言之一。
TypeScript越来越受欢迎。今年,TypeScript首次超越Java,成为GitHub上OSS项目中第三大最受欢迎的语言,用户群增长了37%。TypeScript是一款集语言、类型检查器、编译器和语言服务于一体的软件,于2012年推出,标志着渐进类型的诞生,它允许开发人员在代码中采用不同级别的静态和动态类型。了解有关Typescript的更多信息>
数据分析和操作的流行语言和框架显著增加。T-SQL和TeX等受人尊敬的语言在2023年有所增长,这突出了数据科学家、数学家和分析师如何越来越多地参与开源平台和工具。
底线是:编程语言不再局限于传统软件开发领域。
与GitHub中使用的所有最流行的语言相比,我们发现与2023年创建的项目中使用的最流行语言具有惊人的平等性。一些显著的异常值包括Kotlin、Rust、Go和Lua,它们在GitHub上的新项目中有较大的增长。
Rust和Lua都以其内存安全性和效率而著称,它们都可以用于系统和嵌入式系统编程,这可以归功于它们的增长。Go最近的增长是由云计算项目推动的,如Kubernetes和Prometheus。
开发商活动是新技术采用的领头羊
2023年初,我们庆祝了超过1亿开发人员使用GitHub-自去年以来,我们看到GitHub上的所有全球开发人员帐户增长了近26%。比以往更多的开发人员跨时区协作并构建软件。在私人和公共存储库中的开发人员活动强调了哪些技术正在被广泛采用,以及哪些技术正准备被广泛采用。
开发人员正在自动化更多的工作流。在过去一年中,开发人员用了169%多的GitHub Actions分钟来自动化公共项目中的任务,开发CI/CD管道等等。
GitHub贡献的80%以上是对私有存储库的贡献这意味着对私人项目的捐款超过42亿,对公共和开源项目的捐款则超过3.1亿。这些数字显示了通过免费、Team和GitHub Enterprise帐户跨公共、开源和私有存储库发生的活动的规模。丰富的私人活动表明了内部源代码的价值,以及基于Git的协作不仅有利于开源的质量,也有利于专有代码的质量。
事实上,最近GitHub赞助的所有开发人员调查表示他们的公司至少采用了一些内部资源实践,超过一半的公司表示他们的组织中有一种积极的内部资源文化。
GitHub是开发人员操作和扩展云计算应用程序的地方2023年,430万公共和私有存储库使用了Dockerfiles,超过100万公共存储库使用Dockerffiles创建容器。在过去几年中,我们在Terraform和其他云主动技术中看到了越来越多的使用。越来越多的IaC实践也表明开发人员正在为云部署带来更多的标准化。
生成性人工智能进入GitHub行动。AI在开发人员社区中的早期采用和协作能力在300多项人工智能驱动的GitHub操作和30多个GPT支持的GitHub操作GitHub市场。开发人员不仅继续尝试人工智能,还通过GitHub Marketplace将其应用到开发人员体验的更多部分及其工作流中。
底线是:开发人员尝试新技术,并在公共和私有存储库中共享他们的学习成果。这项相互依赖的工作显示了容器化、自动化和CI/CD在开源社区和公司中打包和运送代码的价值。
开源的安全状态
今年,我们看到开发人员、OSS社区和公司都通过自动警报、工具和主动安全措施更快地响应安全事件,这有助于开发人员更快地获得更好的安全结果。我们还看到GitHub上共享了负责任的AI工具和研究。
更多的开发人员正在使用自动化来保护依赖关系2023年,开源开发人员合并自动化程度提高60%依赖者拉入请求对于易受攻击的包,这比2022年更突出了共享社区对开源和安全的执着。由于GitHub上的免费工具,如Dependabot、代码扫描和秘密扫描,开源社区的开发人员正在修复更多易受攻击的包,并解决代码中的更多漏洞。
更多的开源维护者正在保护他们的分支。受保护的分支为维护人员提供了更多方法来确保其项目的安全,我们已经看到超过60%的最受欢迎的开源项目 使用它们.大规模管理这些规则应该会变得更加容易自从我们今年早些时候在GA上发布GitHub上的存储库规则以来.
开发人员正在GitHub上共享负责任的AI工具在实验生成人工智能的时代,我们看到了人工智能信任和安全工具的发展趋势。开发人员正在创建和共享工具负责的AI,人工智能中的公平,负责任的机器学习、和伦理人工智能.
乔治敦大学安全与新兴技术中心也正在确定哪些国家和机构是值得信赖的人工智能研究并分享GitHub上的研究代码.
底线是:为了帮助OSS社区和项目保持更安全,我们投资了使Dependabot、受保护的分支、CodeQL和秘密扫描对公共项目免费可用。2023年的新采用指标显示了这些投资是如何成功地帮助更多开源项目提高其整体安全性的。我们还看到了在软件开发人员和机构研究人员之间创建和共享负责任的AI工具的兴趣。
开源的状态
2023年,开发商GitHub对开源项目的总贡献为3.01亿美元其中包括一些热门项目,如乳臭虫生成人工智能项目,如稳定扩散、和LangChain公司.
商业支持的项目继续吸引一些最开放源码的贡献,但2023年是生成性人工智能项目首次进入GitHub十大最受欢迎的项目。说到生成人工智能,几乎三分之一的开源项目至少有一位明星拥有一位使用GitHub Copilot的维护人员。
商业支持的项目继续领先2023年,贡献者总数中最大的项目得到了压倒性的商业支持。这是去年以来的持续趋势微软/vscode,颤振/颤振、和上一页/下一页js2023年再次跻身前十名。
生成性人工智能在开源和公共项目中快速增长2023年,我们看到了基于AI的生成性OSS项目,比如langchain-ai/langchain和AUTOMATIC111/稳定扩散webui,根据GitHub上的贡献者数量上升至顶级项目。更多的开发人员正在使用预先培训的AI模型构建LLM应用程序,并根据用户需求定制AI应用程序。
开源维护者正在采用生成性人工智能。几乎三分之一至少有一颗星的开源项目都有一个使用GitHub Copilot的维护人员。如下所示我们的计划为开源维护人员免费提供GitHub Copilot并显示了开源中生成性人工智能的日益采用。
开发人员看到了组合包和容器化的好处如前所述,2023年有430万个存储库使用了Docker。另一方面,Linux发行版NixOS/nixpkgs在过去的两年里,一直是贡献者列出的开源项目榜首。
首次贡献者继续支持商业支持的项目去年,我们发现,与其他项目相比,受欢迎的、商业支持的项目吸引了更多的首次贡献者。2023年,微软、谷歌、Meta和Vercel支持了一些首次贡献者中最受欢迎的开源项目。
但是社区驱动的开源项目包括家庭助理/核心到AUTOMATIC111/稳定扩散webui,langchain-ai/langchain、和重要重力/自动重力首次投稿人的活动也大幅增加。这表明,基础模型的开放实验增加了生成性人工智能的可访问性,为新的创新和更多的协作打开了大门。
2023年,首次为开源项目捐款的人数最多。新的开发人员通过诸如免费代码营,首次捐款、和GitHub教育。我们还看到许多开发人员参与在线开源教育项目,其中包括谷歌和国际商用机器公司.
底线是:开发人员正在为开源生成性人工智能项目做出贡献,开源维护人员正在采用生成性人工智编码工具,公司继续依赖开源软件。这些都表明,开发人员在开放环境中学习并分享他们的新技术实验,可以提升整个全球开发人员网络,无论他们是在公共或私有存储库中工作。
把这个带上
正如Git已经成为当今开发人员体验的基础一样,我们现在看到了AI主流出现的证据。仅在过去一年中,就有92%的开发人员报告称在工作内外使用了基于AI的编码工具。在过去的一年里,GitHub上托管的各种开源项目中的AI实验也出现了爆炸性的激增。
我们留给您三个收获:
- GitHub是生成性人工智能的开发平台。2023年,生成性人工智能从一个专业领域发展成为主流技术,开源活动的激增反映了这一点。随着越来越多的开发人员构建和试验生成性人工智能,他们正在使用GitHub进行协作和集体学习。
- 开发人员正在GitHub上大规模运行云计算应用程序。2019年,我们开始看到在开放源代码中使用基于容器的技术的开发人员数量大幅增加,2023年,开发人员越来越多地使用基于Git的IaC工作流、容器编排和其他云计算技术的速度急剧增加。如此大量的活动表明,开发人员正在使用GitHub标准化他们如何将软件部署到云中。
- GitHub是开源社区、开发人员和公司构建软件的地方。2023年,我们看到私人仓库数量增加了38%,占GitHub所有活动的81%以上。但我们看到开源社区的持续增长,他们正在使用GitHub来构建下一步并推动行业向前发展。随着数据显示新的开源开发人员的增加以及开放社区中可能出现的快速创新步伐,很明显,开源从未如此强大。
方法
本报告利用了从2022年10月1日至2023年9月30日从GitHub获取的匿名用户和产品数据。我们通过683个存储库主题术语定义GitHub上的AI项目你可以从我们2023年进行的研究中了解更多信息(准确地说是第25页)我们还通过我们称之为“Mona Rank”的指标来评估开放源码项目,该指标是对项目的社区规模和受欢迎程度的基于等级的分析。
更多数据可在GitHub创新图-GitHub为对GitHub软件开发状况感到好奇的组织和个人提供的研究工具。
有关完整的方法,请联系按@github.com.
词汇表
- 2023:本报告中的一年是距离上次Octoverse发布的最后365天,范围从2022年10月1日到2023年9月30日。
- 开发商:开发人员是GitHub上的个人非垃圾邮件用户帐户。
- 公共项目:GitHub上公开供其他人贡献、派生、克隆或参与的任何项目。
- 开源项目和社区:开源项目是具有开源许可证的公共存储库。
- 位置:地理信息基于个人用户和组织配置文件的最后已知网络位置。我们只研究匿名和聚合的位置数据,从不研究地理区域和国家以外的位置数据。
- 组织机构:组织帐户代表GitHub上可以付费或免费、大小不同的人群。
- 项目和存储库:我们可以互换使用存储库和项目,但也认识到大型项目有时可以跨越多个存储库。