Azure - Site Recovery service(VMware)

更新於 發佈於 閱讀時間約 12 分鐘

Business Continuity and Disaster Recovery (BCDR) 的策略中,包含有Site Recovery serviceBackup service兩種服務來達到“企業資訊環境的永續”與“災難復原”。

Site Recovery 將在物理機和虛擬機 (VM) 上運行的工作負載從primary複製到secondary location。當primary發生outage 時,可以fail over到secondary location,並從那裡訪問應用程序。在primary再次運行後,您可以 fail back回去。可以達到

  • 跨Azure regions的Azure VMs複寫
  • On-premises VMs, Azure Stack VMs, and physical servers之間的複寫.

在原廠教材中可以看到有這三種複寫架構

  • VMware to Azure” disaster recovery architecture
  • “Hyper-V to Azure” disaster recovery architecture
  • “Azure VM to Azure” disaster recovery architecture

------------------------------------------------------------------------------

此篇文章介紹使用VMware to Azure disaster recovery architecture - Classic,複寫on-premises VMware到Azure。



Configuration server machine

一台部屬於on-premises的機器。建議部署在VMware VM,可以下載OVF 模板來進行部署,裡面會包含元件有:

  • configure server: 作為on-premises和 Azure 之間的通信的角色,
  • process server : 預設會安裝於configuration server,接收要同步的資料後,優化儲存(caching),壓縮(compression),加密(encryption),再傳送到Azure Storage,也會安裝Mobility Service在要同步的VMs裡。可以執行automatic discovery來認機器,當VM數量增加時,也可以另外新增其他process server 來處理更大量的同步資料,舒緩資料流交通。
  • master target server : 預設安裝於configuration server,用來處理當需要從azure failback回來的任務,也可以設置多台來處理大量的工作。


於下圖可以看出在on-premises中部屬configuration server與process server的結合,process server會自動安裝部屬Mobility Service在左方要同步的機器(Replicated machines)上,也可以手動部屬,用來抓取記憶體中的資料,在左方還有Master target用於failback,中間透過設置網路Data Channel來同步資料到Azure。

raw-image

Outbound network connectivity

部屬完on-premises個元件後,接著就要設置到Azure的通道,需要設定『外出』(Outbound)的防火牆設定。

raw-image
  • *.blob.core.windows.net
  • login.microsoftonline.com
  • *.hypervrecoverymanager.windowsazure.com
  • *.servicebus.windows.net


Replication process

複寫(replication)是block-level的,可以通過internet訪問到Azure storage public endpoints,有別於透過public IP也可以設定site-to-site VPN。在同步前一樣要先有一個初始化(Initial)目前狀態的動作,接著才去同步差異、累進的資料,而資料會先送往在Azure的cache storage account內,資料與recover point 會存放在Azure Managed Disk(Azure Site Recovery seed disk),recover point。而在on-premises的 VM上是透過Mobility Service,預設會有replication policy :

  • RPO threshold : 這個設定不會影響複寫,而是監控"故障移轉時的資料損失(RPO)"是否到達設置的告警值。
  • Recovery point retention : 指的是recovery points保留多久,代表可以回到多久以前的資料,預設為24hr,premium storage最大可以設置24hr,standard storage則可以設定為72hr。
  • App-consistent snapshots : snapshot的頻率可以為1 到 12小時,預設為每4小時,這個snaptshot是標準的Azure blob snapshots,在VM上要啟動VSS snapshot來達到這個功能,VSS snapshot是一個基於時間點一致性的點(bookmarks)。

如下圖,在左方的on-premises端:

  • configuration server 要開啟 port HTTPS 443 inbound接收來自上方VMs的存取,並同時開啟port HTTPS 443 outbound,存取Azure。
  • process server 則是開啟port HTTPS 9443 inbound(可以修改),接收來自VM的複寫資料,並同時開啟port 443 outbound將資料再送往Azure storage
raw-image

Resynchronization process

有時VM與PS之間或PS與 Azure 之間可能存在網絡連接問題。為避免數據完整性問題並最大限度地降低數據傳輸成本,Site Recovery 會執行Resynchronization。另外在機器被強制關閉或做一些調整(例如磁盤大小配置更改)也能執行。

Resynchronization僅將增量數據發送到 Azure。通過計算VM和存儲在 Azure 中的數據之間的數據checksums,最大限度地減少本地和 Azure 之間的數據傳輸。

默認情況下,重新同步計劃在離峰時段自動運行。也可以手動重新同步 VM。為此,登入Azure portal, 選擇 VM > Resynchronize.。


Multi-VM consistency

當有多台虛擬機需要被一起複寫,當在故障轉移時可以共享crash-consistent 與 app-consistent的 recovery points時,可以將它們聚集到一個replication group中。注意會影響效能,應該僅用於運行需要跨所有機器保持一致性的工作負載的虛擬機。


關於一致性Consistency

當執行故障移轉時,能夠根據snapshot的restore point,在目標環境做還原,來處理根據是否需要操作系統和 VM 上運行的應用程序是一致的,來選擇snapshot的類型

  • Crash-consistent(預設) :不包含記憶體內的資料,所以不保證OS與app的資料一致,預設每五分鐘創建一個Crash-consistent的restore point。
  • App-consistent :包含Crash-consistent的所有內容加上記憶體內正在進行的交易。需要使用磁碟區陰影複製服務(Volume Shadow Copy Service, VSS):

1) Azure Site Recovery uses Copy Only backup (VSS_BT_COPY)   method which does not change Microsoft SQL's transaction log backup time and sequence number

2) When a snapshot is initiated, VSS perform a copy-on-write (COW) operation on the volume.

3) Before it performs the COW, VSS informs every app on the machine that it needs to flush its memory-resident data to disk.

4) VSS then allows the backup/disaster recovery app (in this case Site Recovery) to read the snapshot data and proceed.

補充:VSS_BACKUP_TYPE列舉出要使用VSS writer/requester coordination的備份種類有哪些,請參考: VSS_BACKUP_TYPE


關於Failover and Failback

設置完replication之後,可以運行DR Drill 演練備援功能,可以根據需要運行failover和failback。

可以為單台機器,或創建recovery plans同時對多個 VM 進行故障轉移。recovery plans比單機故障轉移的優勢包括: 可以通過在recovery plans中包含應用程序中的所有 VM 來達到對app-dependencies進行建模。也可以添加scripts,Azure runbooksk 來手動操作。

Failover發動後將服務切到Azure VM後,就可以從Azure 訪問服務,當on-premises再次可用時,可以將服務再次Failback回來。為了執行failback,需要設置故障恢復基礎設施,包括:

  • Temporary process server:要從Azure 進行故障回复,需要在 Azure VM 設置一個暫時的PS處理來自 Azure 的複寫。故障恢復完成後可以刪除此 VM。
  • VPN connection:要進行故障回复,您需要從 Azure 網絡到本地站點的 VPN 連接(或 ExpressRoute)。
  • Separate master target server:預設就與CS一起安裝在on-premises來處理failback的需求,如果需要failback大量的volumns,可以另外設置一個單獨master server。
  • Failback policy:當建立on-premises 到 Azure 的replication policy時,預設也同時建立了failbackpolicy。


資料整理自: Azure disaster recovery

留言
avatar-img
留言分享你的想法!
avatar-img
工程師Kxodia的技術報告的沙龍
4會員
13內容數
2022/04/08
今天新安裝一台11024的Oracle RAC DB 在AIX的環境 並要更新PSU到 root> /oracle/11.2.0/grid/OPatch/opatch auto /source/oracle/30501155 -ocmrf /tmp/ocm.f zizhoho@gmail.com
2022/04/08
今天新安裝一台11024的Oracle RAC DB 在AIX的環境 並要更新PSU到 root> /oracle/11.2.0/grid/OPatch/opatch auto /source/oracle/30501155 -ocmrf /tmp/ocm.f zizhoho@gmail.com
2022/03/31
今天在第一個節點發現有wait event read by other session 與DB file sequential read幾乎佔據了80% 的DB time。 研究一下這是兩個session引發的問題,以session執行的動作又有不同的現象 查一下buffer裝啥囉~ 持續調查!
2022/03/31
今天在第一個節點發現有wait event read by other session 與DB file sequential read幾乎佔據了80% 的DB time。 研究一下這是兩個session引發的問題,以session執行的動作又有不同的現象 查一下buffer裝啥囉~ 持續調查!
2022/03/14
今天要將oracle goldengate 的extract 從classic 轉成integrated mode. 真是簡單的任務阿~ 趕緊做完下班囉~ 結果! 裡面有如何轉換的步驟,排錯的方式就是將Extract 重新打開讓他跑一下,追上就好了,但! 如果這樣就好我還寫個屁? 下班!
Thumbnail
2022/03/14
今天要將oracle goldengate 的extract 從classic 轉成integrated mode. 真是簡單的任務阿~ 趕緊做完下班囉~ 結果! 裡面有如何轉換的步驟,排錯的方式就是將Extract 重新打開讓他跑一下,追上就好了,但! 如果這樣就好我還寫個屁? 下班!
Thumbnail
看更多
你可能也想看
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
重點摘要: 6 月繼續維持基準利率不變,強調維持高利率主因為關稅 點陣圖表現略為鷹派,收斂 2026、2027 年降息預期 SEP 連續 2 季下修 GDP、上修通膨預測值 --- 1.繼續維持利率不變,強調需要維持高利率是因為關稅: 聯準會 (Fed) 召開 6 月利率會議
Thumbnail
重點摘要: 6 月繼續維持基準利率不變,強調維持高利率主因為關稅 點陣圖表現略為鷹派,收斂 2026、2027 年降息預期 SEP 連續 2 季下修 GDP、上修通膨預測值 --- 1.繼續維持利率不變,強調需要維持高利率是因為關稅: 聯準會 (Fed) 召開 6 月利率會議
Thumbnail
新系統建構時,可考慮採購建置VM機器,DB機器,備份機器以及網路設備等硬體機器。
Thumbnail
新系統建構時,可考慮採購建置VM機器,DB機器,備份機器以及網路設備等硬體機器。
Thumbnail
在著陸區(Landing Zone)在規劃時,在上一篇文章[1]的網路架構分享是以Shared VPC為例,但是在現實生活中,總是有各種前人留下的歷史共業或公司規範、作業考量而不能使用Shared VPC來集中管理雲端環境的網路架構。 因此分享常見的網路架構設計和設計架構時參考的因素!
Thumbnail
在著陸區(Landing Zone)在規劃時,在上一篇文章[1]的網路架構分享是以Shared VPC為例,但是在現實生活中,總是有各種前人留下的歷史共業或公司規範、作業考量而不能使用Shared VPC來集中管理雲端環境的網路架構。 因此分享常見的網路架構設計和設計架構時參考的因素!
Thumbnail
1.首先 這是 “AWS 上的工作負載發現” 的解決方案,我嘗試了一下,覺得很方便,所以介紹一下~ https://aws.amazon.com/tw/solutions/implementations/workload-discovery-on-aws/ 2. 部署 官方提供 CloudF
Thumbnail
1.首先 這是 “AWS 上的工作負載發現” 的解決方案,我嘗試了一下,覺得很方便,所以介紹一下~ https://aws.amazon.com/tw/solutions/implementations/workload-discovery-on-aws/ 2. 部署 官方提供 CloudF
Thumbnail
先說,我並非專業人士~ 只是分享建立的過程與經驗,不要問我問題~ 我可能、應該無法解答,哈哈哈。 另,這只是一份 草稿? 操作簡述~ 容我不很詳細的抓畫面了! 我之後 "應該" 會拍影片說明整個過程,真的有拍的話,再補上影片網址。
Thumbnail
先說,我並非專業人士~ 只是分享建立的過程與經驗,不要問我問題~ 我可能、應該無法解答,哈哈哈。 另,這只是一份 草稿? 操作簡述~ 容我不很詳細的抓畫面了! 我之後 "應該" 會拍影片說明整個過程,真的有拍的話,再補上影片網址。
Thumbnail
如果nextcloud使用一陣子了,想把nextcloud做備份要如何做呢?請繼續往下閱讀。 備份Nextcloud相關資料 開啓維護模式 老樣子,切換到root帳戶 開啓終端機後用vim文字編輯器開啓config.php檔,如下指令 開啓config.php檔後,添加'maintenance' =
Thumbnail
如果nextcloud使用一陣子了,想把nextcloud做備份要如何做呢?請繼續往下閱讀。 備份Nextcloud相關資料 開啓維護模式 老樣子,切換到root帳戶 開啓終端機後用vim文字編輯器開啓config.php檔,如下指令 開啓config.php檔後,添加'maintenance' =
Thumbnail
資料庫複製 不知道大家有沒有聽過負載均衡或者水平擴展呢?在網站佈署中我們會透過這些技術把網站架在多台 server 上,以避免萬一某台 server 掛掉,讓網頁服務仍能維持運作,或者去分擔負載 MongoDB 這邊有一個叫資料庫複製的技術,建立多個相同的 MongoDB service 在不同的
Thumbnail
資料庫複製 不知道大家有沒有聽過負載均衡或者水平擴展呢?在網站佈署中我們會透過這些技術把網站架在多台 server 上,以避免萬一某台 server 掛掉,讓網頁服務仍能維持運作,或者去分擔負載 MongoDB 這邊有一個叫資料庫複製的技術,建立多個相同的 MongoDB service 在不同的
Thumbnail
今天主要的內容,將會使用 GCP 的主機,設立一個免費額度的 VM 主機,並且簡單的調教他,主要的目標是如果服務死掉時,至少還可以連線到 VM 主機,將該服務重啟或關閉,而不是服務死掉, VM 主機也跟著死掉了。
Thumbnail
今天主要的內容,將會使用 GCP 的主機,設立一個免費額度的 VM 主機,並且簡單的調教他,主要的目標是如果服務死掉時,至少還可以連線到 VM 主機,將該服務重啟或關閉,而不是服務死掉, VM 主機也跟著死掉了。
Thumbnail
使用Azure Backup Service將資料備份到雲端Microsoft Azure平臺,本文摘要說明 Azure 備份架構、元件。
Thumbnail
使用Azure Backup Service將資料備份到雲端Microsoft Azure平臺,本文摘要說明 Azure 備份架構、元件。
Thumbnail
本文介紹了使用Azure Site Recovery service - Classic 在本地 VMware 和 Azure 之間部署災難恢復複製(disaster recovery replication )、故障轉移(failover)和恢復(recovery)時使用的架構和流程。
Thumbnail
本文介紹了使用Azure Site Recovery service - Classic 在本地 VMware 和 Azure 之間部署災難恢復複製(disaster recovery replication )、故障轉移(failover)和恢復(recovery)時使用的架構和流程。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News