【服務器數(shù)據(jù)恢復】服務器raid5硬盤掉線,上層應用不可用的數(shù)據(jù)恢復案例

服務器數(shù)據(jù)故障:
某公司服務器8塊硬盤組成raid5磁盤陣列,其中有2塊硬盤故障指示燈報警,其他硬盤指示燈正常,上層應用不可用。

1、服務器數(shù)據(jù)恢復工程師拿到故障服務器所有硬盤后對出現(xiàn)物理故障的2塊硬盤進行物理修復并鏡像備份里面的數(shù)據(jù),同時找到2塊硬盤故障原因:磁頭損壞和邏輯故障。對其他完好硬盤做完整鏡像備份。
2、服務器數(shù)據(jù)恢復工程師基于鏡像文件對硬盤數(shù)據(jù)進行底層分析,查詢55AA標志。下圖中特別標注“05”的位置,這個標志表示這是一個擴展分區(qū),不是正常分區(qū),因此排除這個分區(qū)。

3、繼續(xù)向下查找,發(fā)現(xiàn)了一個滿足“55AA”標志,又在“0x01C6”位置的數(shù)值所指向的下一個扇區(qū)是分區(qū)頭部的分區(qū),也就是下圖中的位置:

這個盤就是服務器內(nèi)的第一塊硬盤。GPT分區(qū)所在扇區(qū)起始于172032扇區(qū),因此初步確定LUN的起始扇區(qū)是172032扇區(qū)。
4、Raid5磁盤陣列中每個條帶組中包含一個校驗區(qū),校驗區(qū)的大小和一個正常條帶的大小是相同的。經(jīng)過分析,故障服務器磁盤陣列中的條帶大小是1024扇區(qū)。
5、根據(jù)已經(jīng)分析出來的1024扇區(qū)的條帶大小、扇區(qū)起始位置、校驗區(qū)走向確定故障服務器上所有硬盤在raid陣列中的盤序。

6、根據(jù)分析出來的raid信息(盤序等)重組raid5陣列。完成raid5重組后校驗數(shù)據(jù)完整性,檢查上層應用是否可用,確認無誤后由用戶驗證數(shù)據(jù)。
7、數(shù)據(jù)驗證沒有問題后,在用戶服務器上使用新硬盤替換損壞硬盤重建raid陣列,將恢復出來的數(shù)據(jù)遷移到用戶服務器上,本次數(shù)據(jù)恢復成功。
服務器數(shù)據(jù)安全Tips:
1、服務器發(fā)生故障后,切忌對服務器進行操作;也不要隨意取出硬盤,以免弄亂盤序。
2、如果需要取出硬盤,標記好硬盤的順序之后再取出。
3、服務器陣列癱瘓后應該立即斷電,不要做同步或強制上線操作,防止數(shù)據(jù)進一步破壞。
