GitHub标头
所有系统运行
Git操作 ? 操作
API请求 ? 操作
Webhooks(网钩) ? 操作
访问www.githubstatus.com了解更多信息 操作
问题 ? 操作
Pull请求 ? 操作
行动 ? 操作
包装 ? 操作
? 操作
代码空间 ? 操作
副驾驶员 操作
操作
性能下降
部分停运
重大停运
维护
过去的事件
七月27,2024

今天没有报告任何事件。

七月26,2024

未报告任何事件。

七月25,2024
断然的-此事件已得到解决。
七月25,21:05联合技术公司
调查-我们目前正在调查这个问题。
七月25,21:04联合技术公司
断然的-2024年7月25日15:30到19:10 UTC之间,审核日志服务的写入性能下降。在此期间,审核日志读取未受影响,但客户当前审核日志数据的可用性可能会出现延迟。此次事件没有造成数据丢失。

该问题被隔离到Audit Log数据存储中的单个分区。在重新启动主分区时,我们观察到立即恢复,随后成功写入的次数增加。7月26日00:40 UTC左右,积压的日志消息已全部处理完毕。

我们正在与数据存储团队合作,确保缓解措施到位,以防止未来的影响。此外,我们将调查是否有我们可以采取的行动,以减少未来的影响和缓解时间。

七月25,19:20联合技术公司
更新-我们已经应用了修复程序,正在恢复。(澄清点:影响仅限于审核日志事件,而不是所有类别的事件。)
七月25,19:16联合技术公司
调查-我们目前正在调查这个问题。
七月25,18:44联合技术公司
七月24,2024

未报告任何事件。

七月23,2024
断然的-此事件已得到解决。
七月23,22:38联合技术公司
更新-我们已经缓解了Copilot Chat在某些地区返回故障的问题。所有Copilot Chat用户的功能都已恢复。

七月23,22:25联合技术公司
更新-我们看到一些地区用户的Copilot Chat出现了故障。我们看到大约20%的Copilot聊天请求失败。
七月23,21:52联合技术公司
调查-我们目前正在调查这个问题。
七月23,21:40联合技术公司
七月22,2024

未报告任何事件。

七月21,2024

未报告任何事件。

七月20,2024

未报告任何事件。

七月19,2024
断然的-此事件已得到解决。
七月19,04:47联合技术公司
更新-代码空间仍在完全恢复,但我们可以看到问题的发展趋势是积极的。如果受到影响,请停止并启动代码空间:https://docs.github.com/en/codespaces/developing-in-a-codespace/stopting-and-starting-a-codespace?tool=webui
七月19,03:54联合技术公司
更新-我们仍在调查代码空间的问题。一些用户此时可能无法连接到其代码空间。我们将向您更新缓解进度。
七月19,03:17联合技术公司
更新-我们正在调查代码空间的问题。一些用户此时可能无法连接到其代码空间。我们将向您通报缓解进展情况。
七月19,02:43联合技术公司
调查-我们正在调查有关代码空间性能降低的报告
七月19,02:10联合技术公司
断然的-从2024年7月18日22:38 UTC开始,上游提供商的网络问题导致Actions、Copilot和Pages服务的体验降低。

多达50%的Actions工作流作业处于排队状态,包括Pages部署。用户也无法启用Actions或注册自托管跑步者。这是由美国中部地区无法访问的后端资源导致的。该资源已配置为进行地理复制,但复制配置阻止了在一个区域不可用时的恢复能力。通过在一个区域不可用时允许成功的请求,更新复制配置减轻了影响。截至7月19日00:12 UTC,用户看到Actions作业和Pages的完全恢复有所改进。标准托管跑步者和自托管Actions工作流在协调世界时2:10时运行正常,大型托管跑步者在2:38时完全恢复。

Copilot请求也受到影响,多达2%的Copilot-Chat请求和0.5%的Copilit Completions请求会导致错误。聊天请求在20分钟后被路由到其他地区,而完成请求需要45分钟才能重新路由。

我们已经确定了检测方面的改进,以减少与所有受影响的待命团队接洽的时间,并改进了我们的复制配置和故障切换工作流,以更好地适应不健康的依赖关系,减少故障切换时间并减轻客户影响。

七月19,02:38联合技术公司
更新-操作正常。
七月19,02:38联合技术公司
更新-我们一直在针对大修采取缓解措施。对于较大的跑步者,客户可能仍然会遇到跑步开始延迟。
七月19,02:25联合技术公司
更新-我们已经采取了缓解措施来解决停机问题。客户可能仍会遇到运行启动延迟。
七月19,01:50联合技术公司
更新-我们正在取得进展,将故障转移到另一个地区以缓解停机。
七月19,01:04联合技术公司
更新-我们继续通过故障转移到其他地区来缓解停机。
七月19,00:30联合技术公司
更新-页面运行正常。
七月19,00:24联合技术公司
更新-我们正在通过故障转移到不同区域来缓解停机。
七月18,23:57联合技术公司
更新-页面性能下降。我们正在继续调查。
七月18,23:23联合技术公司
更新-客户在执行某些操作时可能会遇到延迟或失败。我们继续调查。
七月18,23:22联合技术公司
调查-我们正在调查Actions性能降低的报告
七月18,22:47联合技术公司
七月18,2024
七月17,2024
断然的-此事件已得到解决。
七月17,18:13联合技术公司
调查-我们正在调查有关代码空间性能降低的报告
七月17,17:56联合技术公司
断然的-2024年7月17日,在16:15:31 UTC和17:06:53 UTC之间,各种GitHub服务降级,包括Login、GraphQL API、Issues、Pages和Packages。平均而言,github.com和API请求的错误率为0.3%,Packages请求的错误率为3.0%。这起事件是由两起无关事件引发的:

-计划中的内部功能测试事件导致我们的数据库负载过重,中断了GitHub的服务。
-部署网络配置更改以支持GitHub数据中心的容量扩展。

我们在16:17 UTC中止了测试事件,从而部分解决了该事件,并在16:49 UTC回滚了网络配置更改,从而完全解决了该问题。

我们已暂停GitHub数据中心内所有计划的容量扩展活动,直到我们稳定了此事件的根本原因。此外,我们正在重新检查我们的负载测试实践,以便可以在更安全的环境中进行,并对导致问题的功能进行架构更改。

七月17,17:06联合技术公司
更新-Git Operations运行正常。
七月17,17:06联合技术公司
更新-页面运行正常。
七月17,17:06联合技术公司
更新-程序包运行正常。
七月17,17:06联合技术公司
更新-我们正在继续调查多个服务的问题报告。我们将继续让用户了解最新进展。
七月17,16:47联合技术公司
更新-包的性能降低。我们正在继续调查。
七月17,16:47联合技术公司
更新-问题运行正常。
七月17,16:46联合技术公司
更新-页面性能下降。我们正在继续调查。
七月17,16:30联合技术公司
更新-问题出现性能降级。我们正在继续调查。
七月17,16:28联合技术公司
更新-我们正在调查有关服务问题的报告:Git、操作、规则和权限、SSH身份验证和授权。。我们将继续让用户了解缓解措施的最新进展。
七月17,16:24联合技术公司
调查-我们正在调查Git Operations性能下降的报告
七月17,16:21联合技术公司
七月16,2024
断然的-此事件已得到解决。
七月16,03:07联合技术公司
更新-Copilot聊天是错误率正在提高,我们正在继续监测系统健康状况。
七月16,02:56联合技术公司
更新-副驾驶聊天出现错误率上升。我们已经确定了根本原因,并正在进行补救。
七月16,02:10联合技术公司
更新-副驾驶聊天出现错误率上升,我们目前正在调查此问题。
七月16,01:35联合技术公司
调查-我们目前正在调查这个问题。
七月16,00:53联合技术公司
七月15,2024

未报告任何事件。

七月14,2024

未报告任何事件。

七月13,2024
断然的-2024年7月13日00:01至19:27 UTC期间,Copilot服务降级。在此期间,副驾驶代码完成错误率达到峰值1.16%,副驾驶聊天错误率达到高峰63%。在01:00至02:00 UTC之间,我们能够重新路由聊天流量,使错误率低于6%。在影响期间,客户可能会在请求期间看到延迟响应、错误或超时。在此事件中,GitHub代码扫描自动修复作业也被延迟。

资源清理作业由计划Azure OpenAI(AOAI)服务7月13日凌晨针对被认为只包含未使用资源的资源组。此资源组无意中包含了仍在使用的关键资源,这些资源随后被删除。清除作业在删除资源组中的所有资源之前已停止。剩余的资源足够GitHub在重建资源时减轻负担。

我们正在与AOAI合作,确保缓解措施到位,以防止未来的影响。此外,我们将改进流量重路由过程,以减少未来缓解的时间。

七月13,19:27联合技术公司
更新-副驾驶正常工作。
七月13,19:26联合技术公司
更新-我们的上游提供商将继续恢复,我们预计随着取得更多进展,服务将恢复正常。我们将在20:00 UTC之前提供另一个更新。
七月13,18:01联合技术公司
更新-我们的上游提供商正在恢复中取得良好进展,我们正在验证服务是否接近正常运行。我们将在UTC 18:00之前提供另一个更新。
七月13,16:09联合技术公司
更新-我们的上游供应商正在逐步恢复服务。我们将在23:00 UTC提供另一个更新。
七月13,11:18联合技术公司
更新-我们将继续等待上游供应商的全面恢复。我们将在11:00 UTC提供另一个更新
七月13,03:50联合技术公司
更新-Copilot聊天请求的错误率稳定在10%以下。我们正在继续与上游供应商进行调查。
七月13,03:20联合技术公司
更新-副驾驶性能下降。我们正在继续调查。
七月13,02:20联合技术公司
更新-我们对Copilot聊天应用了一些缓解措施,将错误减少到所有聊天请求的10%以下。我们正在继续与上游供应商调查该问题。
七月13,02:19联合技术公司
更新-Copilot聊天性能下降,影响了高达60%的聊天请求。我们正在继续与上游供应商一起调查这一问题。
七月13,01:32联合技术公司
更新-Copilot聊天当前性能下降,影响了多达60%的聊天请求。我们正在调查这个问题。
七月13,00:49联合技术公司
更新-Copilot的可用性降低。我们正在继续调查。
七月13,00:29联合技术公司
更新-Copilot API聊天遇到后端服务严重故障
七月13,00:18联合技术公司
调查-我们正在调查Copilot性能下降的报告
七月13,00:18联合技术公司