服務器數據恢復環境:
華為OceanStor某型號存儲,存儲內有一組由24塊硬盤組建的raid5陣列,配置1塊熱備盤。
服務器故障:
該存儲raid5陣列中有一塊硬盤離線,熱備盤自動激活并開始同步數據,在熱備盤同步數據的過程中,raid5陣列中另一塊硬盤離線,上層應用崩潰,數據丟失。
服務器數據恢復過程:
1、將該存儲中所有硬盤編號后取出,硬件工程師對所有硬盤進行硬件故障檢測,經過檢測發現raid5中只有1塊硬盤存在硬件故障,其他硬盤可正常讀取。將完好硬盤以只讀方式進行全盤鏡像,鏡像完成后按照編號將所有磁盤還原到原存儲中,后續的數據分析和數據恢復操作都基于鏡像文件進行,避免對原始磁盤數據造成二次破壞。
由于本案例所使用的raid控制器對磁盤檢測策略比較嚴格,通常會將無物理故障但性能不穩定的硬盤識別為壞盤并踢出raid陣列。之前硬件工程師只檢測到一塊硬盤有物理故障,另外一塊掉線盤應該是因為讀寫不穩定被踢出陣列掉線。
2.、基于鏡像文件分析每塊硬盤的底層數據,獲取到條帶大小、數據走向、盤序、熱備盤、數據庫的分布規律等raid相關信息。根據獲取到的raid5相關信息虛擬重組raid5陣列。
3、在重組raid5陣列的過程中發現有一塊硬盤在相同條帶上的數據與其他硬盤的明顯不同,該硬盤進行條帶校驗后確認該硬盤被同步破壞。
4、重組raid5陣列后,數據恢復工程師分析lun在raid5陣列中的分配情況及數據塊map。將map提取出來后通過北亞企安自研數據恢復程序解析&恢復lun數據。
5、北亞企安數據恢復工程師編寫文件系統解析程序對虛擬重組出來的raid5陣列中的文件系統進行解析,導出數據庫文件后交由數據庫工程師進行校驗和修復。
6、數據庫工程師對數據庫文件進行驗證后發現部分數據庫文件和日志文件異常,表空間內存在大量壞塊,所有控制文件被破壞,undotbs02丟失。數據庫工程師對數據庫文件進行修復。
數據庫文件修復過程:
北亞企安數據恢復——OceanStor存儲數據恢復
北亞企安數據恢復——OceanStor存儲數據恢復
7、經過數據庫工程師對數據庫文件的修復和驗證,終于成功恢復數據庫數據。數據恢復工程師將修復好的數據庫數據導入準備好的環境中進行驗證,經過驗證所有數據均正常。用戶方工程師對數據進行驗證也沒有發現異常。本次服務器數據恢復工作完成。
審核編輯 黃宇
-
存儲
+關注
關注
13文章
4353瀏覽量
86169 -
服務器
+關注
關注
12文章
9303瀏覽量
86061 -
數據恢復
+關注
關注
10文章
585瀏覽量
17630 -
RAID5
+關注
關注
0文章
122瀏覽量
12767
發布評論請先 登錄
相關推薦
評論