2024-01-22|閱讀時間 ‧ 約 24 分鐘

2024-01-22 Drill test的重要性

在企業IT環境,系統和數據的備份的重要性相信是不用解說,亦不用懷疑的。

但很時時候,企業忽略的並不是備份,而是Drill test的重要性。

近年備份方案已日漸成熟,由以前備份到磁帶發展到現在備份上雲端也仍然有不少公司選用。而備份密度主要根據業務的特性決定,但90%的企業也不外乎在3-2-1 備份策略,即保有3份備份,儲存於2種不同的儲存媒介,並且有1份是儲存於異地的。

https://www.easeus.com/knowledge-center/3-2-1-backup-rule.html



以上策略有效避免了火警燒數據中心造成同地備份的一拼消失、2種儲存媒介可以避免火警外,也可以避免強磁場或其他物理攻擊的同時影響。至於3份備份,筆者覺得是至少要有,以防個別媒體的損壞造成兩份備份無法有效互相覆蓋。

策略有了,也不是甚麼複雜的設定,大多的管理員也會遵循或委託相關的服務供應商在部署方案時一拼設定。只是,之後會繼續做的定時演練,卻是很多公司沒有實行的。

筆者在過後後多年的審計和服務提供,最常遇到的就是客戶雖然訂立好了一年要做多少次Drill test並交管理層批淮。但是結果到出事後,卻發現系統並無相關的Drill test紀錄,或是在審計時發現並無法交付Drill test report。

最主要問題,是很多人都認為Backup的可靠性,而對於Drill test掉以輕心。而且做一次Drill test也要花些工夫(儘管我覺得其實也不算太花費時間),可能要選定演練的數據或系統,要提取數據並還原,然後再做檢查。

但當有起事上來時,如果備份無法提供應有的功能,則每晚進行的備份還而成為了自欺欺人的功夫。這不單對於災難回復沒有發揮應有功能,更令本來爭分奪秒的回復計劃白花了更多時間在處理備份的問題。

筆者過往的經驗也看過在回復時發現「復活」的數據和系統很多古怪問題,還要花更多額外時間或聘請顧問(筆者當時也是這個角色)去了解發生甚麼事情並提供救援。

去年,香港有一件新聞是關於因Ransomware 而令該機構的系統全面癱瘓的。在不支付贖金給駭客的前提下,備份和還原就是最好的選項。但注意到該機構好像在3天後仍然還沒有將全部系統復原過來,而且還是重要的電郵系統。猜想應該是備份上面出了一些問題,致令在72小時也沒法將電郵系統完全回復。

近年有很多企業接受雲端備份作為其中一個媒介選項,有些甚至已經發展到雙雲端互相備份,以防雲端儲存出事也有另一雲端的備份。而且雲端備份直接充當了異地備份的角色,也避免了定期換碟換帶,要自行攜帶離開公司等工序。受益於網絡寬帶的發展,加上備份方案的業界對雲儲存媒介提供更受善的支援,令亦雲端備份更受青睞。筆者去年也有客戶直接在雲上部署模疑環境進行Drill test,其效果亦令人驚喜。

分享至
成為作者繼續創作的動力吧!
© 2024 vocus All rights reserved.