Azure - Site Recovery service(VMware)

閱讀時間約 12 分鐘
Business Continuity and Disaster Recovery (BCDR) 的策略中,包含有Site Recovery serviceBackup service兩種服務來達到“企業資訊環境的永續”與“災難復原”。
Site Recovery 將在物理機和虛擬機 (VM) 上運行的工作負載從primary複製到secondary location。當primary發生outage 時,可以fail over到secondary location,並從那裡訪問應用程序。在primary再次運行後,您可以 fail back回去。可以達到
  • 跨Azure regions的Azure VMs複寫
  • On-premises VMs, Azure Stack VMs, and physical servers之間的複寫.
在原廠教材中可以看到有這三種複寫架構
  • VMware to Azure” disaster recovery architecture
  • “Hyper-V to Azure” disaster recovery architecture
  • “Azure VM to Azure” disaster recovery architecture
------------------------------------------------------------------------------
此篇文章介紹使用VMware to Azure disaster recovery architecture - Classic,複寫on-premises VMware到Azure。

Configuration server machine

一台部屬於on-premises的機器。建議部署在VMware VM,可以下載OVF 模板來進行部署,裡面會包含元件有:
  • configure server: 作為on-premises和 Azure 之間的通信的角色,
  • process server : 預設會安裝於configuration server,接收要同步的資料後,優化儲存(caching),壓縮(compression),加密(encryption),再傳送到Azure Storage,也會安裝Mobility Service在要同步的VMs裡。可以執行automatic discovery來認機器,當VM數量增加時,也可以另外新增其他process server 來處理更大量的同步資料,舒緩資料流交通。
  • master target server : 預設安裝於configuration server,用來處理當需要從azure failback回來的任務,也可以設置多台來處理大量的工作。
於下圖可以看出在on-premises中部屬configuration server與process server的結合,process server會自動安裝部屬Mobility Service在左方要同步的機器(Replicated machines)上,也可以手動部屬,用來抓取記憶體中的資料,在左方還有Master target用於failback,中間透過設置網路Data Channel來同步資料到Azure。

Outbound network connectivity

部屬完on-premises個元件後,接著就要設置到Azure的通道,需要設定『外出』(Outbound)的防火牆設定。
使用 URL-based 的防火牆proxy 來控制 outbound connectivity,允許這些存取URLs
  • *.blob.core.windows.net
  • login.microsoftonline.com
  • *.hypervrecoverymanager.windowsazure.com
  • *.servicebus.windows.net

Replication process

複寫(replication)是block-level的,可以通過internet訪問到Azure storage public endpoints,有別於透過public IP也可以設定site-to-site VPN。在同步前一樣要先有一個初始化(Initial)目前狀態的動作,接著才去同步差異、累進的資料,而資料會先送往在Azure的cache storage account內,資料與recover point 會存放在Azure Managed Disk(Azure Site Recovery seed disk),recover point。而在on-premises的 VM上是透過Mobility Service,預設會有replication policy :
  • RPO threshold : 這個設定不會影響複寫,而是監控"故障移轉時的資料損失(RPO)"是否到達設置的告警值。
  • Recovery point retention : 指的是recovery points保留多久,代表可以回到多久以前的資料,預設為24hr,premium storage最大可以設置24hr,standard storage則可以設定為72hr。
  • App-consistent snapshots : snapshot的頻率可以為1 到 12小時,預設為每4小時,這個snaptshot是標準的Azure blob snapshots,在VM上要啟動VSS snapshot來達到這個功能,VSS snapshot是一個基於時間點一致性的點(bookmarks)。
如下圖,在左方的on-premises端:
  • configuration server 要開啟 port HTTPS 443 inbound接收來自上方VMs的存取,並同時開啟port HTTPS 443 outbound,存取Azure。
  • process server 則是開啟port HTTPS 9443 inbound(可以修改),接收來自VM的複寫資料,並同時開啟port 443 outbound將資料再送往Azure storage

Resynchronization process

有時VM與PS之間或PS與 Azure 之間可能存在網絡連接問題。為避免數據完整性問題並最大限度地降低數據傳輸成本,Site Recovery 會執行Resynchronization。另外在機器被強制關閉或做一些調整(例如磁盤大小配置更改)也能執行。
Resynchronization僅將增量數據發送到 Azure。通過計算VM和存儲在 Azure 中的數據之間的數據checksums,最大限度地減少本地和 Azure 之間的數據傳輸。
默認情況下,重新同步計劃在離峰時段自動運行。也可以手動重新同步 VM。為此,登入Azure portal, 選擇 VM > Resynchronize.。

Multi-VM consistency

當有多台虛擬機需要被一起複寫,當在故障轉移時可以共享crash-consistent 與 app-consistent的 recovery points時,可以將它們聚集到一個replication group中。注意會影響效能,應該僅用於運行需要跨所有機器保持一致性的工作負載的虛擬機。

關於一致性Consistency

當執行故障移轉時,能夠根據snapshot的restore point,在目標環境做還原,來處理根據是否需要操作系統和 VM 上運行的應用程序是一致的,來選擇snapshot的類型
  • Crash-consistent(預設) :不包含記憶體內的資料,所以不保證OS與app的資料一致,預設每五分鐘創建一個Crash-consistent的restore point。
  • App-consistent :包含Crash-consistent的所有內容加上記憶體內正在進行的交易。需要使用磁碟區陰影複製服務(Volume Shadow Copy Service, VSS):
1) Azure Site Recovery uses Copy Only backup (VSS_BT_COPY)   method which does not change Microsoft SQL's transaction log backup time and sequence number

2) When a snapshot is initiated, VSS perform a copy-on-write (COW) operation on the volume.

3) Before it performs the COW, VSS informs every app on the machine that it needs to flush its memory-resident data to disk.

4) VSS then allows the backup/disaster recovery app (in this case Site Recovery) to read the snapshot data and proceed.
補充:VSS_BACKUP_TYPE列舉出要使用VSS writer/requester coordination的備份種類有哪些,請參考: VSS_BACKUP_TYPE

關於Failover and Failback

設置完replication之後,可以運行DR Drill 演練備援功能,可以根據需要運行failover和failback。
可以為單台機器,或創建recovery plans同時對多個 VM 進行故障轉移。recovery plans比單機故障轉移的優勢包括: 可以通過在recovery plans中包含應用程序中的所有 VM 來達到對app-dependencies進行建模。也可以添加scripts,Azure runbooksk 來手動操作。
Failover發動後將服務切到Azure VM後,就可以從Azure 訪問服務,當on-premises再次可用時,可以將服務再次Failback回來。為了執行failback,需要設置故障恢復基礎設施,包括:
  • Temporary process server:要從Azure 進行故障回复,需要在 Azure VM 設置一個暫時的PS處理來自 Azure 的複寫。故障恢復完成後可以刪除此 VM。
  • VPN connection:要進行故障回复,您需要從 Azure 網絡到本地站點的 VPN 連接(或 ExpressRoute)。
  • Separate master target server:預設就與CS一起安裝在on-premises來處理failback的需求,如果需要failback大量的volumns,可以另外設置一個單獨master server。
  • Failback policy:當建立on-premises 到 Azure 的replication policy時,預設也同時建立了failbackpolicy。
資料整理自: Azure disaster recovery
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
你可能也想看
Google News 追蹤
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
11/20日NVDA即將公布最新一期的財報, 今天Sell Side的分析師, 開始調高目標價, 市場的股價也開始反應, 未來一週NVDA將重新回到美股市場的焦點, 今天我們要分析NVDA Sell Side怎麼看待這次NVDA的財報預測, 以及實際上Buy Side的倉位及操作, 從
Thumbnail
Hi 大家好,我是Ethan😊 相近大家都知道保濕是皮膚保養中最基本,也是最重要的一步。無論是在畫室裡長時間對著畫布,還是在旅途中面對各種氣候變化,保持皮膚的水分平衡對我來說至關重要。保濕化妝水不僅能迅速為皮膚補水,還能提升後續保養品的吸收效率。 曾經,我的保養程序簡單到只包括清潔和隨意上乳液
Thumbnail
今年兩場關於Cloud的演講,我主要針對使用PaaS服務作為一個議題,會有PaaS應用的議題,主要來自自己觀察企業運用雲端資源模式,也來自於實務經驗,發現採用PaaS服務,可以比使用IaaS服務的費用下降了30~40 %。雲概念越來越普及,但是企業要怎樣用雲的資源幫助企業轉型,或許還在一個模糊的階段
Thumbnail
在雲端建立AKS後,運行後有許多Container會被外部服務呼叫使用。但我們知道當我們佈署到AKS,如果要被外面服務呼叫,就要在YAML將Type設定成Loadbalance,一旦這樣設定,就會變成每個Container就會多出一個對外的IP,Container變多了,對外IP就會擴增很快,也不好
Thumbnail
隨著雲端概念越來越普及,Azure 作為一個雲端平台,已逐漸演變成為一個高度複雜的架構。早期的 Azure 概念是讓使用者在雲端上開啟所需的資源並建立相關的服務,同時也不需要自行建構機房等基礎設施,因此具有相當的優勢。但是隨著時間的推移,雲端的應用也越來越廣泛,因此 Azure 也提供了許多指導方式
Thumbnail
如果想看官方文件的話~ 請看 使用 Azure 監視器監視虛擬機器,我是有看沒有懂啦~ 以下,我直接以我能了解的方式,進行實作。 一般而言,從「概觀」功能下的「監視」~可以看到一些主機的運行狀況。
Thumbnail
承上篇,繼續往下走吧! 來說明一下 PHP 兩個會用到的套件安裝,一個是 ionCube,另一個為 memcached ●PHP 套件 ionCube 安裝 先以下列指令,在帳戶內建立一個 tmp 資料夾備用,執行時留意是在帳號剛登入主機的位置喔!
Thumbnail
這是一篇推坑 Cloudways 的文章,如果你覺得網站速度很慢,不妨試試速度也很快的 Cloudways! 我過去的網站是架在 SiteGround 上,它是目前所有 Hosting 中,速度快、使用方便,但費用相對比較貴的服務...
Thumbnail
如何取得 azure devops  專案的 git repo 下載到 local  visual studio 開發? 登入azure devops azure devops/login/Repos/Files/project/clone copy to your vs  
Thumbnail
軟體與雲端巨人微軟,正式發布了他們 2020 年第三季的財報(公司會計年度為 2021 年 Q1,本文內統一稱為 2020 Q3),交出了相當不錯的成績,無論是營收或者是獲利,都超過了分析師的期望值。在這疫情持續延燒的七八九月,微軟的成績單能夠給我們怎麼樣的訊息呢?
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
11/20日NVDA即將公布最新一期的財報, 今天Sell Side的分析師, 開始調高目標價, 市場的股價也開始反應, 未來一週NVDA將重新回到美股市場的焦點, 今天我們要分析NVDA Sell Side怎麼看待這次NVDA的財報預測, 以及實際上Buy Side的倉位及操作, 從
Thumbnail
Hi 大家好,我是Ethan😊 相近大家都知道保濕是皮膚保養中最基本,也是最重要的一步。無論是在畫室裡長時間對著畫布,還是在旅途中面對各種氣候變化,保持皮膚的水分平衡對我來說至關重要。保濕化妝水不僅能迅速為皮膚補水,還能提升後續保養品的吸收效率。 曾經,我的保養程序簡單到只包括清潔和隨意上乳液
Thumbnail
今年兩場關於Cloud的演講,我主要針對使用PaaS服務作為一個議題,會有PaaS應用的議題,主要來自自己觀察企業運用雲端資源模式,也來自於實務經驗,發現採用PaaS服務,可以比使用IaaS服務的費用下降了30~40 %。雲概念越來越普及,但是企業要怎樣用雲的資源幫助企業轉型,或許還在一個模糊的階段
Thumbnail
在雲端建立AKS後,運行後有許多Container會被外部服務呼叫使用。但我們知道當我們佈署到AKS,如果要被外面服務呼叫,就要在YAML將Type設定成Loadbalance,一旦這樣設定,就會變成每個Container就會多出一個對外的IP,Container變多了,對外IP就會擴增很快,也不好
Thumbnail
隨著雲端概念越來越普及,Azure 作為一個雲端平台,已逐漸演變成為一個高度複雜的架構。早期的 Azure 概念是讓使用者在雲端上開啟所需的資源並建立相關的服務,同時也不需要自行建構機房等基礎設施,因此具有相當的優勢。但是隨著時間的推移,雲端的應用也越來越廣泛,因此 Azure 也提供了許多指導方式
Thumbnail
如果想看官方文件的話~ 請看 使用 Azure 監視器監視虛擬機器,我是有看沒有懂啦~ 以下,我直接以我能了解的方式,進行實作。 一般而言,從「概觀」功能下的「監視」~可以看到一些主機的運行狀況。
Thumbnail
承上篇,繼續往下走吧! 來說明一下 PHP 兩個會用到的套件安裝,一個是 ionCube,另一個為 memcached ●PHP 套件 ionCube 安裝 先以下列指令,在帳戶內建立一個 tmp 資料夾備用,執行時留意是在帳號剛登入主機的位置喔!
Thumbnail
這是一篇推坑 Cloudways 的文章,如果你覺得網站速度很慢,不妨試試速度也很快的 Cloudways! 我過去的網站是架在 SiteGround 上,它是目前所有 Hosting 中,速度快、使用方便,但費用相對比較貴的服務...
Thumbnail
如何取得 azure devops  專案的 git repo 下載到 local  visual studio 開發? 登入azure devops azure devops/login/Repos/Files/project/clone copy to your vs  
Thumbnail
軟體與雲端巨人微軟,正式發布了他們 2020 年第三季的財報(公司會計年度為 2021 年 Q1,本文內統一稱為 2020 Q3),交出了相當不錯的成績,無論是營收或者是獲利,都超過了分析師的期望值。在這疫情持續延燒的七八九月,微軟的成績單能夠給我們怎麼樣的訊息呢?