2025年6月13日,AWS、Google Cloud 和 Cloudflare 幾乎同時遭遇服務(wù)中斷,引發(fā)全球范圍的社交媒體熱議?!斑@三家公司管理著近90%的互聯(lián)網(wǎng)活動和應(yīng)用程序,怎么可能同時宕機(jī)?”一位軟件工程師的質(zhì)疑,迅速成為行業(yè)共鳴。

這次事件并非局部問題。谷歌云明確表示,這是一場全球性影響的事故。據(jù)其狀態(tài)頁通報,由于身份和訪問管理服務(wù)(IAM)出現(xiàn)問題,GCP 多項(xiàng)產(chǎn)品受到波及,涵蓋 Gmail、Google Docs、Drive、Meet、Voice 等關(guān)鍵服務(wù),Google Workspace 亦不同程度受影響。這意味著,不僅是云端應(yīng)用,連企業(yè)協(xié)作與通信基礎(chǔ)設(shè)施也遭遇嚴(yán)重阻斷。與此同時,并未有任何關(guān)于 DNS 或 BGP 的異常報告,互聯(lián)網(wǎng)主干運(yùn)行正常,指向此次問題源自云平臺控制層的系統(tǒng)性故障。

?
?

AWS 和 Cloudflare:狀態(tài)“正常”,但用戶“感知異?!?/span>

?
AWS 在其健康儀表盤上并未顯示異常,但用戶在美國東部地區(qū)普遍報告出現(xiàn)訪問緩慢、服務(wù)不可用等問題。AWS 回應(yīng)稱服務(wù)整體正常,強(qiáng)調(diào)官方狀態(tài)頁面是“唯一可信信息來源”。Cloudflare 則在聲明中承認(rèn)多個服務(wù)出現(xiàn)間歇性故障,包括 Access、WARP、Workers KV、Stream、AI Gateway 等。公司指出,受影響服務(wù)在緩存重試期間仍可能出現(xiàn)間歇性錯誤,團(tuán)隊正在評估并持續(xù)修復(fù)。

到了美國東部時間下午5點(diǎn),谷歌表示已在 us-central1 和其他美國區(qū)域?qū)嵤┚徑獯胧㈤_始觀察到恢復(fù)跡象,預(yù)計服務(wù)將在一小時內(nèi)全面回歸。

?

去中心化的云世界,依然有“單點(diǎn)風(fēng)險”

?
從市場與用戶側(cè)的視角看,這次事件揭示了一個耐人尋味的事實(shí):盡管企業(yè)早已進(jìn)入多云架構(gòu)與邊緣計算時代,但關(guān)鍵控制節(jié)點(diǎn)的集中性依賴仍舊存在。當(dāng) IAM 或平臺控制層服務(wù)中斷,現(xiàn)代云原生應(yīng)用的“自恢復(fù)能力”將瞬間失效。更令人擔(dān)憂的是,多個云廠商幾乎同時出問題,難免引發(fā)關(guān)于“底層依賴是否存在共震鏈條”的疑問。

在企業(yè)紛紛追求 DevOps、自主可觀測與 AI Ops 的當(dāng)下,“只信官方儀表板”顯然已不能滿足運(yùn)維團(tuán)隊對高頻變動、異地可用性與真實(shí)用戶體驗(yàn)的感知需求。

?

?

在不可控的“云波動”中,聽云撥測如何提供確定性的答案?

?

從6月13日的集體宕機(jī)事件可以看出,無論是谷歌云IAM系統(tǒng)的失效,還是Cloudflare邊緣服務(wù)的間歇性中斷,又或是AWS狀態(tài)頁“無事發(fā)生”背后用戶真實(shí)感知的反常,都指向了一個核心問題——企業(yè)無法通過云廠商的自有狀態(tài)視角,獲取真正的服務(wù)可用性狀況。

在這類突發(fā)事件中,基調(diào)聽云Network 撥測產(chǎn)品體系提供了一套“模擬用戶真實(shí)訪問路徑 + 多云環(huán)境主動感知”的解決方案,讓企業(yè)在混亂之中獲得真正的“外部視角”和“用戶視角”。

?

我們通過全球200+運(yùn)營商/地域節(jié)點(diǎn),在美國、歐洲、亞太等區(qū)域持續(xù)撥測多家云平臺和業(yè)務(wù)應(yīng)用,可有效完成以下任務(wù):

?

  • 發(fā)現(xiàn)異常更早:

    在官方狀態(tài)頁更新前,通過 API 接口、登錄鏈路、CDN 加速路徑的探測,快速識別服務(wù)是否“功能性不可用”;

  • 明確是“你掛了”,還是“云掛了”:

    支持按地區(qū)/鏈路分布式對比,清晰判斷問題是否出在自身業(yè)務(wù)系統(tǒng)、目標(biāo)云平臺,還是某段網(wǎng)絡(luò)路徑;

  • 支持多協(xié)議多場景監(jiān)控:

    不僅支持 HTTP、Ping、DNS、TCP 等基礎(chǔ)協(xié)議,還可模擬用戶交互(如登錄、上傳、支付等業(yè)務(wù)關(guān)鍵路徑);

  • 實(shí)時熱力圖與告警聯(lián)動:

    通過撥測地圖與自定義 SLA 閾值策略,實(shí)時展示全球服務(wù)抖動態(tài)勢,并聯(lián)動 APM/RUM 產(chǎn)品完成故障定位;

  • 支持多云/跨云平臺統(tǒng)一監(jiān)控視圖:

    幫助企業(yè)建立 AWS/GCP/Cloudflare/Azure 等平臺在各地的質(zhì)量對比基線,支撐流量切換或多云容災(zāi)策略。

簡而言之,在官方“報喜不報憂”的世界里,基調(diào)聽云撥測可以做企業(yè)真正的“預(yù)警哨兵”,提前感知風(fēng)險,快速做出決策,為全球業(yè)務(wù)連續(xù)性提供保障。

?

預(yù)告:基調(diào)聽云即將推出針對手機(jī)廠商的全球用戶體驗(yàn)相關(guān)分析報告,以真實(shí)撥測數(shù)據(jù)揭示云廠商服務(wù)質(zhì)量波動,敬請關(guān)注。

?

推薦閱讀

  • 近日,基調(diào)聽云榮獲2023數(shù)字化創(chuàng)新突破技術(shù)獎項(xiàng),這是對我們在智能可觀測性領(lǐng)域持續(xù)創(chuàng)新和技術(shù)提升的認(rèn)可。自基調(diào)聽云智能可觀測性平臺發(fā)布上線以來,我們一直致力于為廣大用戶提供更加智能、穩(wěn)定、高效的運(yùn)維服務(wù),并不斷優(yōu)化底層技術(shù)能力以加強(qiáng)客戶體驗(yàn)。

    2023-08-21

  • 全面數(shù)字化時代已經(jīng)到來,企業(yè)數(shù)字化發(fā)展不僅要注重產(chǎn)出也要注重成果,基調(diào)聽云已全身心投入數(shù)字經(jīng)濟(jì)新藍(lán)海建設(shè)中,積極發(fā)揮數(shù)字時代下產(chǎn)品及平臺的“融匯”、“融通”、“融智”的核心優(yōu)勢,攜手金融行業(yè)及等更多行業(yè)玩轉(zhuǎn)數(shù)字時代

    2022-08-23