全球20%互联网“瘫痪”3小时！Cloudflare史诗级宕机，ChatGPT、X无一幸免

首页 ›今日热点 ›科技财经

收藏分享邀请

摘要

整顿 | 郑丽媛出品 | CSDN（ID：CSDNnews）在许多人还认为只是自己 Wi-Fi 出题目时，一场席卷全球的收集年夜面积故障，寂静让半个互联网陷入了稀有的杂乱：X（原 Twitter）打不开、ChatGPT 无法响应、连监控宕机的 D

整顿 | 郑丽媛

出品 | CSDN（ID：CSDNnews）

在许多人还认为只是自己 Wi-Fi 出题目时，一场席卷全球的收集年夜面积故障，寂静让半个互联网陷入了稀有的杂乱：

X（原 Twitter）打不开、ChatGPT 无法响应、连监控宕机的 Downdetector 自己都挂了……而这场风暴的中心，正是谁人几乎包裹了全球五分之一互联网的基础办法服务商：Cloudflare。

一觉醒来，互联网“碎了一地”：从社交媒体到游戏服务器周全瓦解

按照媒体报道，Cloudflare 故障在美东时间早上 6:20（北京时间 19:20）左右开始，开始爆出来的是年夜量应用访问耽误、白屏、无法登录等题目。

受影响的名单长到令人咋舌——不仅有 X、ChatGPT，这场瓦解还几乎超过了社交收集、临盆力工具、流媒体、在线游戏、交通服务等全部类别：

● X：报错信息表现“内部服务器毛病源于 Cloudflare 的异常”；

● ChatGPT：弹出提醒 “请解除对 cloudflare.com challenge 的拦截后继续访问”；

● Canva（在线设计工具）、Indeed（雇用平台）、Uber（打车软件）、Spotify（音乐播放平台）均出现访问异常；

● 《英雄联盟》服务器出现毗连题目；

● Archive of Our Own（AO3）短暂无法访问；

● 年夜量媒体网站也全体挂失落，包括但不限于Axios、The Information和Politico。

甚至，连人们用来确认网站是否挂失落的 Downdetector 自己都无法正常加载——这无疑是本次变乱最为戏剧性的一幕。

数不清的用户在社交媒体上不断发出抱怨，有人甚至调侃：“这已经不只是网站挂了，是我的一天也跟着宕机了。”

为什么 Cloudflare 一挂，互联网就跟着“抖三抖”？

要明确这场变乱有多严峻，先得知道 Cloudflare 是什么。

简朴来说，Cloudflare 是目前全球最年夜的互联网安全与 CDN（内容分发收集）提供商之一，它负责的事情重要包括：

● WAF、防火墙、DDoS 防护

● 验证访问者是否为人类（Bot Mitigation）

● CDN 加速

● 边缘收集与 Zero Trust 服务

● 网站流量代理与高级缓存

Cloudflare 官方称，全球 20% 的网站都在利用它的服务。换句话说：互联网的很年夜一部门流量，都要颠末 Cloudflare 的基础办法，而它一旦出题目，成千上万个网站就会同时“受牵连”。

正因如此，收集服务监测机构 NetBlocks 负责人 Alp Toker 才会说这次变乱表现 Cloudflare 基础办法遭受了“灾难级的停止”：“令人震惊的是，这几年为了回避 DDoS 攻击，互联网越来越多的服务都把 Cloudflare 作为前置层，这同时也让它成为了全部互联网的最年夜单点故障之一。”

原形曝光：一个“变得太年夜 ”的设置文件，引发连锁瓦解

故障爆发后，Cloudflare 很快进行了技术不雅察。

Cloudflare 官方谈话人 Jackie Dutton 表现，这次宕机源于一个用于管理威逼流量的主动生成设置文件：“该文件的体积超出了预期，引发了处理流量的软件体系瓦解，从而影响了 Cloudflare 多项焦点服务。”

听起来是“小题目”？但在 Cloudflare 这种体量下，小题目可以刹时变成“超级多米诺骨牌”。

在后续的技能复盘中，Cloudflare 解释这个“体积变年夜的文件”源于一次数据库权限变更：在一次 ClickHouse 权限的变更中，团队原本盼望“让全部效户都能准确看到自己有权访问的数据表元数据”。而这个本该是通例的权限完善，却引发了一场蝴蝶效应。

据相识，Cloudflare 的“呆板人管理（Bot Management）”体系，必要依靠一份不断更新的“特征设置文件”。这份特征文件每几分钟更新一次，并主动同步至全部收集，使其可以也许应对互联网流量的变革。但题目来了：由于底层 ClickHouse 查询行为的权限变更，导致生成的文件中出现了年夜量反复的“特征”行。