服務器異地容災 - 解決方案
服務器異地容災 - 備份并不是一個新名詞,隨著企業(yè)規(guī)模的擴展,用戶早已認識到保證信息系統(tǒng)的安全不間斷工作成為各個行業(yè)信息化建設的重要關注點。而且近年來頻繁出現(xiàn)的自然災害或者突發(fā)事件也讓人們越來越多的注意到,原有意識中的數(shù)據(jù)備份已經無法滿足關鍵業(yè)務對系統(tǒng)的可用性、實時性、安全性的需要。這時,異地容災解決方案的出現(xiàn)則可通過在不同地點建立備份系統(tǒng),從而進一步提高數(shù)據(jù)抵抗各種可能安全因素的容災能力。
針對這一應用需求,市場上紛紛推出基于SAN的異地容災軟、硬件產品,希望能夠為用戶提供整套以SAN網(wǎng)絡環(huán)境和異地實時備份為基礎的,高效、可靠的異地容災解決方案,并且能夠為用戶提供支持各種操作系統(tǒng)平臺、數(shù)據(jù)庫應用和網(wǎng)絡應用的系統(tǒng)容災服務。
異地容災系統(tǒng)優(yōu)勢與技術解析
而這種異地容災系統(tǒng)的優(yōu)勢,其主要體現(xiàn)在:
- 存儲集中化:通常采取在線即時備份,不但可提高管理員的工作效率,同時降低對復雜設備的需求。
- 管理集中化:大多數(shù)異地容災方案都采用使用戶能夠實現(xiàn)實時管理和整體系統(tǒng)的策略,網(wǎng)絡管理員可利用瀏覽器對數(shù)據(jù)存儲進行管理,免于完成大量的重復工作。
- 互操作性強:在異地容災方案中,可以實現(xiàn)對異構的不同存儲環(huán)境集成,既可以利用現(xiàn)有的存儲設備,同時又支持NAS、IPSAN和FCSAN等多種存儲架構。
而在技術層面,雖然各廠商的異地容災方案不盡相同,但大多采用了如下的一些主流技術:
- 數(shù)據(jù)鏡像復制技術:就是把一個系統(tǒng)完全地復制下來,包括數(shù)據(jù)內容、格式等。通常要求兩個系統(tǒng)的存儲子系統(tǒng)是完全一樣的,因為只有這樣才能確保鏡像后的系統(tǒng)也一樣。并且在當前系統(tǒng)出現(xiàn)故障時,鏡像后的系統(tǒng)可及時接替原來系統(tǒng)的工作,繼續(xù)保持系統(tǒng)運行。
- 虛擬存儲技術:它的關鍵優(yōu)勢就在于允許異構系統(tǒng)和應用程序共享存儲設備,并且用戶將不再需要在每個分公司的服務器上都連接一臺磁帶設備。
- 快照技術:是對于需要備份的系統(tǒng)數(shù)據(jù)保留一個或多個不同時期的版本。雖然是保留在本地,但異地系統(tǒng)備份卻可通過這些不同時間點的快照達到容災的目的。通過快照技術,用戶可以從一個現(xiàn)存的邏輯卷向另一個只讀的邏輯卷拷貝某一個時間點的系統(tǒng)數(shù)據(jù)。備份進程或其他類似的應用程序就可以利用這個不變的系統(tǒng)映像,而不去用數(shù)據(jù)時刻變化的實時系統(tǒng)。除此之外,用戶使用這種方法進行備份更無須暫停服務。
實際上,計算機被竊、火災等意外事件是時常發(fā)生的,如果企事業(yè)單位不能有效的進行數(shù)據(jù)的災難備份,事故發(fā)生后導致的嚴重后果是難以想象的,僅僅實現(xiàn)本地的集中備份, 其安全性還遠遠不夠,如何在有限的預算下部署具有異地容災能力的備份方案,將是企事業(yè)單位面臨的新的挑戰(zhàn)。煜企智能提供的服務器數(shù)據(jù)異地容災解決方案,首先可以實現(xiàn)在局域網(wǎng)內基于磁盤的集中備份,當數(shù)據(jù)集中備份存儲到局域網(wǎng)內的備份服務器上后,再通過實時同步功能,將已備份數(shù)據(jù)通過互聯(lián)網(wǎng)、VPN 或專線等傳輸?shù)竭h程的數(shù)據(jù)中心或公有云平臺,實現(xiàn)數(shù)據(jù)的異地容災。方案可應用于解決因地震、水災、火災、盜竊等事故可能造成的公司數(shù)據(jù)丟失的問題,提供關鍵數(shù)據(jù)的本地及異地備份,同時該方案可應用于集團公司中各地分支機構之間重要數(shù)據(jù)的互備。
方案特點:
部署簡單
- 可與企事業(yè)單位現(xiàn)有IT網(wǎng)絡無縫融合,在實現(xiàn)D2D2R異地容災方案時,不再需要建設或升級企事業(yè)單位的IT網(wǎng)絡,僅僅只需要進行軟件部署,實施周期短。
技術領先
- 異地數(shù)據(jù)傳輸采用層疊增量實時同步技術,在數(shù)據(jù)傳輸前壓縮,節(jié)省網(wǎng)絡帶寬和傳輸時間,并使用AES高級加密算法加密傳輸?shù)臄?shù)據(jù)流,確保數(shù)據(jù)在網(wǎng)絡傳輸時的安全性。
管理便捷
- 基于異地備份系統(tǒng)的強大可管理性,整個方案只需要在一個管理平臺即可將本地集中備份和異地實時同步進行統(tǒng)一管理。
成本可控
- 整個方案可使用企事業(yè)單位現(xiàn)有IT網(wǎng)絡和硬件,方案部署初始成本低,并且整個方案完全采用軟件技術,不需要人工參與,從而避免實施異地容災時維護成本高的風險。
服務器異地容災 - 類型
從其對系統(tǒng)的保護程度來分,可以將容災系統(tǒng)分為:數(shù)據(jù)容災和應用容災。
數(shù)據(jù)容災就是指建立一個異地的數(shù)據(jù)系統(tǒng),該系統(tǒng)是本地關鍵應用數(shù)據(jù)的一個實時復制。
應用容災是在數(shù)據(jù)容災的基礎上,在異地建立一套完整的與本地生產系統(tǒng)相當?shù)膫浞輵孟到y(tǒng)(可以是互為備份),在災難情況下,遠程系統(tǒng)迅速接管業(yè)務運行。數(shù)據(jù)容災是抗御災難的保障,而應用容災則是容災系統(tǒng)建設的目標。
一、數(shù)據(jù)容災
所謂數(shù)據(jù)容災,就是指建立一個異地的數(shù)據(jù)系統(tǒng),該系統(tǒng)是本地關鍵應用數(shù)據(jù)的一個可用復制。在本地數(shù)據(jù)及整個應用系統(tǒng)出現(xiàn)災難時,系統(tǒng)至少在異地保存有一份可用的關鍵業(yè)務的數(shù)據(jù)。該數(shù)據(jù)可以是與本地生產數(shù)據(jù)的完全實時復制,也可以比本地數(shù)據(jù)略微落后,但一定是可用的。采用的主要技術是數(shù)據(jù)備份和數(shù)據(jù)復制技術。
數(shù)據(jù)容災技術,又稱為異地數(shù)據(jù)復制技術,按照其實現(xiàn)的技術方式來說,主要可以分為同步傳輸方式和非同步非同步傳輸方式(各廠商在技術用語上可能有所不同),另外,也有如“半同步”這樣的方式。半同步傳輸方式基本與同步傳輸方式相同,只是在Read占 I/O比重比較大時,相對同步傳輸方式,可以略微提高I/O的速度。而根據(jù)容災的距離,數(shù)據(jù)容災又可以分成遠程數(shù)據(jù)容災和近程數(shù)據(jù)容災方式。下面,我們將主要按同步傳輸方式和非同步非同步傳輸方式對數(shù)據(jù)容災展開討論,其中也會涉及到遠程容災和近程容災的概念,并作相應的分析。
二、應用容災
所謂應用容災,是在數(shù)據(jù)容災的基礎上,在異地建立一套完整的與本地生產系統(tǒng)相當?shù)膫浞輵孟到y(tǒng) (可以是互為備份)。建立這樣一個系統(tǒng)是相對比較復雜的,不僅需要一份可用的數(shù)據(jù)復制,還要有包括網(wǎng)路、主機、應用、甚至IP等資源,以及各資源之間的良好協(xié)調。主要的技術包括負載均衡、集群技術。數(shù)據(jù)容災是應用容災的技術,應用容災是數(shù)據(jù)容災的目標。
在選擇容災系統(tǒng)的構造時,還要建立多層次的廣域網(wǎng)路故障切換機制。本地的高可用系統(tǒng)指在多個伺服器運行一個或多種應用的情況下,應確保任意伺服器出現(xiàn)任何故障時,其運行的應用不能中斷,應用程式和系統(tǒng)應能迅速切換到其它伺服器上運行,即本地系統(tǒng)集群和熱備份。
在遠程的容災系統(tǒng)中,要實現(xiàn)完整的應用容災,既要包含本地系統(tǒng)的安全機制、遠程的數(shù)據(jù)復制機制,還應具有廣域網(wǎng)范圍的遠程故障切換能力和故障診斷能力。也就是說,一旦故障發(fā)生,系統(tǒng)要有強大的故障診斷和切換策略制訂機制,確??焖俚姆磻脱杆俚臉I(yè)務接管。實際上,廣域網(wǎng)范圍的高可用能力與本地系統(tǒng)的高可用能力應形成一個整體,實現(xiàn)多級的故障切換和恢復機制,確保系統(tǒng)在各個范圍的可靠和安全。
服務器異地容災 - 等級
參照國際災難備份行業(yè)的通行災難備份等級劃分原則,根據(jù)異地數(shù)據(jù)的多寡,異地數(shù)據(jù)與生產數(shù)據(jù)的差異程度,以及災難恢復環(huán)境的完備程度,將災難備份系統(tǒng)從低到高劃分為如下四個等級:
第0級:沒有備援中心
這一級容災備份,實際上沒有災難恢復能力,它只在本地進行數(shù)據(jù)備份,并且被備份的數(shù)據(jù)只在本地保存,沒有送往異地。
第1級:本地磁帶備份,異地保存
在本地將關鍵數(shù)據(jù)備份,然后送到異地保存。災難發(fā)生后,按預定數(shù)據(jù)恢復程式恢復系統(tǒng)和數(shù)據(jù)。這種方案成本低、易于配置。但當數(shù)據(jù)量增大時,存在存儲介質難管理的問題,并且當災難發(fā)生時存在大量數(shù)據(jù)難以及時恢復的問題。為了解決此問題,災難發(fā)生時,先恢復關鍵數(shù)據(jù),后恢復非關鍵數(shù)據(jù)。
第2級:熱備份站點備份
在異地建立一個熱備份點,通過網(wǎng)路進行數(shù)據(jù)備份。也就是通過網(wǎng)路以同步或非同步方式,把主站點的數(shù)據(jù)備份到備份站點,備份站點一般只備份數(shù)據(jù),不承擔業(yè)務。當出現(xiàn)災難時,備份站點接替主站點的業(yè)務,從而維護業(yè)務運行的連續(xù)性。
第3級:活動備援中心
在相隔較遠的地方分別建立兩個數(shù)據(jù)中心,它們都處于工作狀態(tài),并進行相互數(shù)據(jù)備份。當某個數(shù)據(jù)中心發(fā)生災難時,另一個數(shù)據(jù)中心接替其工作任務。這種級別的備份根據(jù)實際要求和投入資金的多少,又可分為兩種:①兩個數(shù)據(jù)中心之間只限于關鍵數(shù)據(jù)的相互備份;②兩個數(shù)據(jù)中心之間互為鏡像,即零數(shù)據(jù)丟失等。零數(shù)據(jù)丟失是目前要求最高的一種容災備份方式,它要求不管什么災難發(fā)生,系統(tǒng)都能保證數(shù)據(jù)的安全。所以,它需要配置復雜的管理軟體和專用的硬體設備,需要投資相對而言是最大的,但恢復速度也是最快的。
不同等級的災難備份系統(tǒng),其投資差異非常巨大,企業(yè)需要根據(jù)實際情況,主要是遭受嚴重災難后的損失情況,以及發(fā)生災難的幾率,建立滿足企業(yè)需求的災難備份系統(tǒng)。
建立模型、制度及管理流程
- 按照容災能力的高低,目前數(shù)據(jù)容災可分為多個層次,按國際標準SHARE 78定義的容災系統(tǒng)有七個層次:從最簡單的僅在本地進行磁帶備份,到將備份的磁帶存儲在異地,再到建立應用系統(tǒng)實時切換的異地備份系統(tǒng); 恢復時間也可以從幾天到小時級再到分鐘級、秒級或0數(shù)據(jù)丟失等。
- 無論是采用哪種容災方案,數(shù)據(jù)備份還是最基礎的,沒有備份的數(shù)據(jù),任何容災方案都是沒有現(xiàn)實意義的。當然,光有備份也是不夠的,容災也必不可少。在建立容災系統(tǒng)的過程中,建設容災系統(tǒng)模型、容災演習制度以及容災系統(tǒng)管理流程都非常重要。而容災系統(tǒng)主要是從業(yè)務連續(xù)能力、應用系統(tǒng)連續(xù)能力、網(wǎng)路連續(xù)能力三個方面來保證業(yè)務應用系統(tǒng)的正常運行的。
- 對于數(shù)據(jù)級容災,可以采用定期拷貝的方式,如磁帶備份、數(shù)據(jù)快照、廉價存儲等。定期拷貝是在業(yè)務運行過程中某一時刻對生產數(shù)據(jù)的保護,這種保護一般在業(yè)務正常運行時生成,主要預防業(yè)務因生產數(shù)據(jù)的邏輯故障而造成的停頓。當產生的數(shù)據(jù)因人為誤操作而損壞時,可以利用該定期拷貝將業(yè)務狀態(tài)恢復到損壞發(fā)生前的某一時刻(即執(zhí)行定期拷貝時)的業(yè)務狀態(tài)。在業(yè)務恢復過程中,輔以其他手段(如手工錄入等),補充自定期拷貝生成時至業(yè)務中斷時這一段時間內業(yè)務運行產生的數(shù)據(jù)。
- 對于應用級容災,可以采用連續(xù)復制的方式,如應用分發(fā)、資料庫復制、文件系統(tǒng)復制、邏輯卷復制、智能存儲等。連續(xù)復制是對業(yè)務狀態(tài)數(shù)據(jù)進行持續(xù)不斷的復制,主要是預防業(yè)務系統(tǒng)遭遇嚴重故障而造成生產系統(tǒng)長時間無法修復,利用該復制作為恢復生產的基礎。在進行業(yè)務恢復時,利用復制結果可以恢復系統(tǒng)中斷現(xiàn)場的生產數(shù)據(jù),從而恢復業(yè)務。
- 容災演習是對容災項目建設是否成功的檢驗標準,也是對容災維護管理流程和文檔檢測的重要手段。通過演習可以及時發(fā)現(xiàn)問題,并確保各相關部門的配合和人員的操作準確無誤。容災演習的主要工作內容包括:對業(yè)務影響的評估、核查恢復規(guī)劃、制定回退計劃、觸發(fā)演習場景、執(zhí)行恢復規(guī)劃、總結報告、維護等。
- 容災系統(tǒng)管理流程的建立也至關重要,容災項目的實現(xiàn)過程是人員、流程、技術相輔相成的過程,容災管理流程的建立是容災系統(tǒng)成功運作的保證。通過固化的流程,指導維護人員按照實現(xiàn)規(guī)定的步驟進行系統(tǒng)切換和演習工作,才能保證容災技術的最終實現(xiàn)。
相關案例:
煜企智能在網(wǎng)絡安全和虛擬化、系統(tǒng)集成、弱電系統(tǒng)、系統(tǒng)集成、機房建設中擁有豐富的案例,您有任何想法和需求,隨時致電煜企智能獲得咨詢和支持。
微信掃碼 | 加入我們