GitHub 全球核心服务中断事件全过程
2025年7月28日,GitHub发生大规模服务中断,影响全球数百万依赖该平台的开发者和组织。此次事件波及API请求、问题跟踪和拉取请求等核心功能,暴露出全球软件开发所依赖的云端协作工具的脆弱性。中断始于协调世界时7月28日22:40,GitHub状态页面随即报告这些核心功能性能下降。
从独立开发者到企业团队,全球用户均遭遇代码仓库访问、代码变更提交和项目管理等问题。此次中断正值关键时期——GitHub支撑着从开源项目到科技巨头专有软件管道的各类业务。根据事件时间线,GitHub工程团队在收到报告后立即展开调查,并于协调世界时22:42确认问题存在,开始排查潜在原因。
初步更新显示部分服务性能下降,团队认为网络问题可能是主要原因。随着时间进入7月29日,情况持续恶化。协调世界时23:18的更新指出性能仍在下降,至午夜时分,缓解工作聚焦于基础设施相关问题。虽然影响显著但有限——高峰期约4%的请求出现错误,导致间歇性故障而非完全瘫痪。这种部分中断仍引发广泛不满,社交媒体上充斥着关于部署延迟和工作流中断的讨论。
北美、欧洲和亚洲等地区的开发者在高峰时段均报告了服务降级,凸显GitHub作为全球技术生态系统支柱的地位。例如,使用GitHub持续集成与部署(CI/CD)管道的团队遭遇瓶颈,可能影响产品发布和更新进度。
问题解决与后续措施GitHub响应迅速,协调世界时7月29日00:51,团队通报了正在实施的缓解措施,强调仅小部分流量受影响。解决进度随后加快:01:52部署修复方案,监测显示所有受影响区域开始恢复。问题跟踪功能于02:03恢复正常,拉取请求功能于02:05恢复,02:06宣布完全解决,GitHub承诺将尽快发布详细根本原因分析。
此次事件让人想起GitHub过往的中断经历,提醒用户即使拥有强大基础设施,平台仍可能出现偶发故障。自2018年被微软收购以来,GitHub托管着超过1亿个代码仓库,为谷歌和NASA等企业提供协作编码支持。此次持续约三个半小时的中断虽影响全球用户,但在多数时区的核心工作时间前得以解决。
专家建议与平台状态事件后续,专家建议通过工具多样化或实施本地备份来降低此类风险。GitHub尚未公布根本原因,但事件报告指出网络问题是关键因素。建议用户访问地区状态页面(如欧洲eu.githubstatus.com、澳大利亚au.githubstatus.com和美国us.githubstatus.com)获取本地化更新。截至2025年7月29日,平台未报告新问题,已恢复正常运营。