對于每一個企業來講,數據備份都是必不可少的一項關鍵性工作,它直接決定著企業能夠應對什么樣的數據威脅以及相應解決方案的靈活度和有效性。但是在 IT 飛速發展的今天,每一個企業的應用系統在不斷增加,數據類型在不斷的多樣化,數據的量級也在不斷的擴展。在這種形勢下,如何能把備份系統規劃的科學合理并且高效化是作為 IT 建設者必須考慮的問題。本文通過大量的調研分析總結抽象出備份系統規劃時必須考慮的幾個關鍵性問題,并針對每一個問題進行分析和論述,提出解決思路。希望能給企業進行備份系統建設、改造或者升級的項目帶來一些啟示和幫助。
1. 如何確定備份對象及備份策略
近些年來,企業的數據逐漸呈現多元化格局,從數據的模型層面可以分為結構化數據、半結構化數據、非結構化數據。從企業 IT 功能層面又可以將常見數據列為如下幾類:
1、關系型數據庫中保存的二維表數據。
2、非關系型數據庫中的文檔、 JSON 、鍵值等類型數據。
3、以文字方式記錄的文本、 PDF 、 XML 等文件形式的數據。
4、以二進制方式記錄形成的圖片、網頁等數據。
5、以視頻流方式記錄形成的媒體類數據。
作為企業來講,確定備份哪些數據對象,需要從數據重要性、數據量、數據特點等若干方面去評估。從企業業務角度評估的話,那么數據庫保存的數據一定是最重要的,尤其是關系型數據庫里面的二維表數據。其次需要根據行業特點以及具體的業務系統重要性來評估非結構化數據的重要性。比如對于金融行業來講,記錄業務過程的一些影像類數據可能在業務審核過程中經常被調出查閱,這些數據雖然沒有結構化數據那么重要但是也是業務環節當中必不可少的元素,其重要性相對業務視頻類以及安防類視頻數據會高很多。但是如果是媒體行業的話,那么視頻類數據的重要性恰恰是支撐其業務的核心數據,其重要程度不言而喻。那么如何來決定哪些數據需要備份,以什么樣的策略備份?
首先,我們需要確定數據的重要性程度。本文通過結果導向的思路從以下維度來分析企業數據的重要性,最終決定哪些數據需要備份,哪些數據可以不備份,哪些數據需要根據企業的實際投資戰略情況來決定。首先我們假定一個結果,那就是某個應用系統的某類型數據由于硬件故障或者其他原因導致數據丟失掉了。那么就看企業對該結果的容忍程度,假設不能容忍,那么就沒什么好商量的了,肯定要做備份。接下來,最重要的事情是我們如何定義數據備份的策略,包括備份的頻度、備份的模式、歸檔的檔期等等一系列備份作業元素。這部分內容需要考慮到數據本身的量級、數據的具體類型、極端條件下對數據恢復時間及數據丟失量的容忍程度、數據備份系統以及備份介質本身的性能特性、業務發展的規模及趨勢判斷等等。本文從以下幾個原則來進行評估:
數據庫的備份既要有全量備份也要有歸檔日志的備份,全量備份可以根據數據量及重要程度以天為單位進行頻度調整;歸檔備份可以根據數據庫恢復區空間預留、歸檔增長趨勢、數據恢復時間要求、業務系統歸檔特點等多方面來進行以小時為單位的頻度調整和作業發起調用。
文件類型數據可以根據具體數據量來選擇是否利用傳統的文件復制方式來實現其備份,對于數據量大的情況可以采用存儲快照方式進行卷級別的復制代替以文件為單位的掃描復制方式。
系統備份作業的分布以及備份時間需要結合具體的備份窗口來進行合理調整,關鍵業務系統的備份作業不能影響到正常的業務,需要有強制的約束條件來約束備份作業時間跨度。尤其是全量備份,隨著業務不斷發展,數據量會與日俱增,如果對備份作業不進行任何調整,那么很有可能原有備份作業會超越備份窗口影響到業務性能。
根據具體的數據類型和業務重要性對所有備份作業進行分級管理。有些數據需要持續備份,有些數據可能只需要在特殊變更日進行備份即可,例如虛擬化的 VMDK 文件數據,完全沒有必要進行持續備份,只需要在變更后進行備份即可。
以上是對備份對象的確定以及如何把握具體的備份策略的分析和描述,具體細節及關鍵方法在接下來的章節會有詳細的剖析和介紹。
所謂備份系統中的一些關鍵對象包括:備份軟件、備份介質、備份管理服務器、備份作業服務器、備份路徑等。這些關鍵元素共同組成了一個完成的備份系統。
備份軟件:常用的備份軟件包括 IBM TSM 、 EMC Networker 、 SYMANTIC NBU 等。
備份介質:常用的備份介質包括帶庫、 EMC DATADomain 、常規存儲等。
備份管理服務器:對備份作業進行配置調度并且保存備份元數據的集中管理節點。
備份作業服務器:具體執行備份作業的備份服務器。
備份路徑:每一個備份作業從客戶端采集數據到備份介質的整個路徑。
一般的企業可能只需要進行本地備份即可,但是對于某些行業尤其是金融行業,備份要求比較高,需要采用主數據中心和備數據中心聯動的高可用備份架構。
整體架構從上到下分為三層:備份客戶端層、備份控制層以及數據存儲層。中間通過網絡(以太網絡或者是光纖網絡)相連接。紅色線表示控制信息流向,藍色線表示備份過程中的數據流向。
備份客戶端層,圖中最上面的部分既是。備份客戶端是我們要備份的數據對象存放的服務器,例如數據庫服務器、虛擬化平臺的 VCenter 、 NAS 服務器等。一般需要備份軟件的客戶端 AGENT 安裝到備份對象服務器上實現備份目標與備份服務器的通訊。
備份控制層,圖中中間的部分既是。主要包括備份主服務器和備份作業服務器,主服務器根據配置好的調度策略以及整體架構中的備份元素發送作業調度指令,并且將存儲片的元數據存儲到主服務器上的數據庫當中。然后作業服務器可以通過與客戶端的交互完成具體備份作業。元數據是具體備份片的索引信息、而真正的備份片數據會通過作業服務器送入備份介質當中,當我們對數據進行恢復時,首先需要對備份數據的元數據分析才能知道具體的數據備份位置及組合信息等,然后才能通過元數據的組織和具體備份片的恢復完成一個業務數據的完整恢復。
數據存儲層,圖中對下面的部分即是。實際上就是備份數據最終要存儲的地方,可以通過光纖網絡或者以太網絡實現其與備份控制層的連接。傳統模式一般會是光纖網絡和虛擬帶庫的組合模式,其優點在于備份速度和容量的性價比上。但是近些年來隨著以太網技術的發展,利用高速網絡實現的備份數據傳輸同樣可以保障其備份速度,同時具備更好的靈活性。所以近些年來利用萬兆以太網和 DDBoast 組合的方式也越來越多。
整個備份系統的高可用性是由每一個部分服務的高可用配置來保障的,主要包括備份控制層、備份存儲介質層以及跨數據中心級別的高可用架構配置。下面我們分別來做剖析:
主備份服務器是整個備份系統的集中控制節點,其保存的元數據也是備份得以恢復的關鍵數據,因此為了保障主服務器的不間斷工作,需要保障主服務器為主備或者更高級別的高可用架構,元數據為所有本地主服務器共享,如圖中所示的 HA 模式。
作業服務器是所有備份作業的執行者,必須將其組成一個備份作業服務器池,由這個備份作業服務器池向客戶端提供統一備份作業服務才能保障備份作業的不間斷性以及備份作業并發執行的性能,備份作業可以分布在不同的作業服務器節點上進行作業,如圖中所示的負載均衡資源池模式。
從備份存儲介質層面上來看,為了保障備份作業無中斷目標,我們需要將兩個或者多個存儲介質設備綁定為一個虛擬的存儲介質池,當存儲介質發生故障時可以自動切換存儲介質設備,至少可以手動切換存儲介質設備。
容災角度來看,如圖所示:兩個備份域之間備份介質可以通過光纖網絡層或者是以太網絡實現數據的異步復制,這樣可以保障真正的備份數據可以跨地域實現數據保護,但是光有這些數據我們無法實施數據恢復,因為數據恢復過程中最主要的是要根據元數據記錄的備份片索引及結構目錄找到真正的數據備份片實現完整的數據恢復。所以主備份服務器也要實現跨域界別的元數據復制。
對于存儲在傳統 NAS 文件系統上的文件類數據,如果用通用的備份方法只能通過文件復制的方式來實現其全量和增量備份。但是隨著日積月累的非結構化數據增長,這類數據可能會從 TB 級別發展到 10TB 甚至 PB 級別。這類數據存儲組織的方式是文件系統的樹目錄形式,隨著數據的增加,其目錄的深度和規模也會呈現劇增趨勢。備份軟件在掃描文件目錄的時候會變得非常非常慢,最終導致備份作業慢到超過備份窗口的程度。
如果從業務管理層面來解決該問題的話,那么就是要讓備份作業在一定時間段內保持在合理的數據量范圍之內,也就是說要形成合理的多級數據緩存,根據數據使用頻度建立多級轉儲以及歸檔體系。保障使用頻度高的數據在日常備份作業范圍內,合理歸檔使用頻率非常低的歷史數據。拿金融行業的票據、信貸類系統來說,我們可以將合理業務周期內的非結構化數據存在在一級緩存當中,保障業務復核階段的數據讀??;將業務周期外的非結構化數據轉儲到二級 NAS 平臺上,保障近期內可能使用到的業務場景;將較長周期之前的數據定義為離線數據,歸檔到歸檔存儲設備當中。備份僅僅涉及到歸檔之前的數據。這樣既可以保障數據存取的性能,又能保障備份作業的長期穩定性,最終保障備份系統整體的安全穩定。
通過 3.1 章節對問題的原因分析,我們知道導致備份無法進行的原因在于備份軟件對于龐大文件系統目錄的掃描時間過長。那么順著這個思路,如果我們在備份的時候能避免去掃描整個文件系統目錄,而是通過別的方式來完成備份,就可以解決這個問題。通過調查研究我們發現目有兩種方法可以實現:
1) 傳統 NAS 的快照方式。對于傳統的 NAS 存儲來講,快照是非常普遍的功能,通過 NAS 本身的快照復制,我們可以不用掃描文件系統目錄,僅僅基于某一個時刻點的快照,進行卷級別的復制實現全量備份;通過塊兒級別的對比實現增量備份,因為 NAS 設備底層還是基于塊兒設備實現的。當然這種技術需要對存儲本身的快照功能有非常強的依賴性。
2) 分布式 NAS 存儲的日志記錄方式。某些基于分布式技術實現的 NAS 存儲可以對外提供日志操作的接口,也就是說對文件數據的增加和更新會記錄到存儲本身的底層日志當中,那么我們僅僅需要調用日志比對的接口就可以快速找到更新的目錄和文件,僅僅需要掃描更新的部分做增量的復制來完成備份。
以上的兩種技術方案需要我們在做備份規劃之前的選型階段對不同的備份軟件及存儲介質等進行深度調研和分析,盡可能科學合理組合實現以上解決方案。