2000多名工程師提前三個月籌備 華為“雲”上的春節“保衛戰”

副標題:

來源:深圳新聞網 | 2022-01-27 09:47:50
深圳新聞網 | 2022-01-27 09:47:50
原標題:
正在加載

讀創/深圳商報記者 陳姝

搶火車票、搶機票、雲聚餐、雲拜年、搶紅包、刷彈幕……隨著數字技術發展,各種“雲”上應用逐漸成為春節的新年俗。數倍激增的流量洪峰需要穩定可靠的技術保障,這些都離不開雲服務的支持。記者近日獲悉,為了應對今年春節期間各大平臺激增的流量,華為雲投入2000多名工程師,從去年11月就開始籌備,打響了一場數字世界的“春節保衛戰”。

圖:華為雲位於貴安的一個數據中心

圖:華為雲位於貴安的一個數據中心

業務高峰持續近一個月

對雲服務商來説,春節保障有哪些難點?據華為雲SRE專家張智介紹 ,一方面,春節將迎來數倍激增的流量洪峰,各個平臺都將面臨突入好幾倍的流量壓力,如何保證平臺流暢穩定的體驗?另一方面,雲上的幾百萬台服務器,幾億行代碼,遍佈了幾十個站點,如何處理軟硬體的突發問題,雲廠商需要具備不中斷、不延遲等服務能力。

張智説,華為雲覆蓋醫療、教育、數字交通、音視頻等眾多行業,每個行業流量高峰點不一樣。如交通行業的高峰期是在春節前幾天。而網上搶紅包,親朋好友視頻拜年,網絡收看春晚等均集中在除夕夜前幾小時爆發,流量洪峰是平常資源容量的10倍甚至更多。據預測,今年春節期間,視頻直播類流量同比增長6.5倍,某視頻APP彈幕流量增長15倍,華為手機應用市場流量增長10倍。“春節前後都是我們的業務高峰,要持續近一個月的時間,需要做好充分的準備”。

提前三個月籌備

準備工作一般提前三個月就會展開。為了今年春節,華為雲從去年11月5日開始籌備,識別了112個重點保障場景,覆蓋音視頻、社交、高速、文旅、酒店、物流、汽車、教育等各行業的重點業務。

華為云云資源運營負責人劉青介紹 ,華為雲流量精算師前期會對容量做三維一體的評估,包括重要客戶的用戶畫像,通過歷史資源消耗的趨勢,分析其行為習慣,判斷春節期間可能會面臨哪些資源的使用高峰。同時,AI算法基於概率統計模型和神經網絡模型,模擬資源消耗趨勢,“還會結合具體情景,比如説春節、元旦等重要時間點,選擇調優算法,做多輪模型演練,從而做到精準預測,等到春節流量洪峰來的時候,保證讓客戶平穩地在華為雲上使用這些資源和服務”。

圖:華為雲監控作戰指揮中心

圖:華為雲監控作戰指揮中心

一年以來,華為雲已經進行了2000多次實戰演練,涉及2000多名技術工程師、220多個雲服務,覆蓋容災、冗余、過載、數據備份、誤操作等多種場景。值得一提的是,華為雲還設置了“紅藍軍對抗演練”,華為雲SRE專家石勝兵説:“‘藍軍’與‘紅軍’間是沒有溝通,考題全部保密,什麼時候觸發這個考題,由總策劃來決策,演練完全突發”。他説,在某次演練,總指揮臨時決策,將演練從晚上9點提前到淩晨5點,就是為了校驗IT系統能不能及時叫醒SRE工程師,馬上上線接入系統,一方面鍛鍊隊伍,一方面也是考驗專業素質。

數百人除夕夜值守

據介紹,今年春節期間,華為雲SRE(站點可靠性工程師)團隊會有數百人犧牲休息時間進行值守保障,實時監控64萬多個指標,保障全網200多個站點。

華為雲SRE負責人安宇説,今年除夕,保障高峰是從當天晚飯前到正月初一零點後。當晚,位於全國五個城市的華為雲春節保障的百人團隊會全部就位,在辦公區域或作戰室待命。每隔半個小時巡檢流量情況,一旦流量跟預期有較大出入的時候,會提出警告。流量高峰結束以後,在淩晨1點多還做一個復盤,為元宵節的保障做參考。除了雲系統自愈修復外,華為雲SRE工程師實行7×24小時排班制,時刻準備著對異常問題進行界定和修復。今年春節,華為雲預計將攔截外部攻擊數億次,監測平臺數據每秒新增100萬條。

不僅是春節,華為雲SRE團隊也在應對社交平臺熱搜事件、電商節日、突發情況等日常節點時,通過風險挖掘評估,容量保障等措施保障了各種數字平臺的平穩運行。

最新數據顯示,華為雲已上線220多個雲服務、210多個解決方案,聚合全球超過3萬家合作夥伴,發展260萬開發者,雲市場上架應用超過6100個。在中國,華為雲服務了80%的50強互聯網客戶,根據2021年4月Gartner研究報告,華為雲全球IaaS市場排名上升至中國第二、全球前五。

編輯:李雪菲 責任編輯:
點擊收起全文
掃一掃 分享到微信
|
熱點推薦
正在閱讀:2000多名工程師提前三個月籌備 華為“雲”上的春節“保衛戰”
掃一掃 分享到微信
手機看
掃一掃 手機繼續看
A- A+