服務器存儲數據恢復環境:
華為S5300存儲中有12塊FC硬盤,其中11塊硬盤作為數據盤組建了一組RAID5陣列,剩下的1塊硬盤作為熱備盤使用。基于RAID的LUN分配給linux操作系統使用,存放的數據主要是Oracle數據庫。
服務器存儲故障:
RAID5陣列中1塊硬盤出現故障離線,熱備盤自動激活開始同步數據,在同步數據的過程中又一塊硬盤離線,RAID5陣列癱瘓,上層LUN無法使用。
服務器存儲數據恢復過程:
1、將故障存儲中所有磁盤做好標記后取出。硬件工程師對所有磁盤做物理故障檢測,沒有發現有硬盤存在硬件故障,都可以正常讀取。將所有磁盤以只讀方式進行扇區級全盤鏡像,在鏡像過程中沒有發現有磁盤存在大量壞道。鏡像完成后將所有磁盤按照原樣還原到原存儲中,后續的數據分析和數據恢復操作都基于鏡像文件進行,避免對原始磁盤數據造成二次破壞。由于沒有檢測到有磁盤存在物理故障或者大量壞道,基本上可以判斷某些硬盤離線的原因就是磁盤讀寫不穩定。故障存儲raid控制器通常會將性能不穩定的磁盤識別為壞盤,并踢出RAID。一旦RAID中掉線的磁盤數據超過該RAID級別所允許掉盤的最大數量,該RAID將不可用,基于RAID的LUN也不可用。
2、基于鏡像文件分析所有硬盤底層數據。分析底層RAID相關信息,根據分析獲取到的raid信息重組RAID。RAID重建完成后,分析Oracle數據庫頁在每個磁盤中分布的情況。
3、由于RAID中有兩塊盤掉線且有一塊硬盤數據被同步破壞。分析每一塊硬盤中的數據,發現有一塊硬盤在同一個條帶上的數據和其他硬盤明顯不一樣,初步判斷此硬盤可能是被同步破壞的硬盤。通過北亞企安自主開發的RAID校驗程序對這個條帶做校驗,確認該盤就是被同步損壞的盤。
4、分析LUN在RAID中的分配情況以及LUN分配的數據塊MAP。將LUN的數據塊MAP提取出來,北亞企安數據恢復工程師編寫相應程序解析LUN的數據塊MAP,然后根據數據塊MAP導出LUN的數據。
5、由于是使用熱備盤重組RAID,EXT3文件系統無法正常掛載,所以只能先提取oracle數據庫文件,利用北亞企安自主開發的文件系統解析程序對其進行文件系統解析,導出oracle數據庫文件。
6、使用Oracle數據庫文件檢測工具檢測每個數據庫文件的完整性,經過檢測發現有錯誤。使用北亞企安自主研發的Oracle數據庫檢測工具檢測。經過檢測發現部分數據庫文件和日志文件錯誤:system和sysaux表空間存在上百個壞塊,3個控制文件存在大量壞塊,eschoolspace表空間的3個文件中的壞塊多達上千個,undotbs02.dbf丟失。北亞企安數據庫工程師對這些損壞的文件進行修復。
北亞企安數據恢復—RAID5數據恢復 北亞企安數據恢復—RAID5數據恢復
7、創建控制文件和undo表空間,啟動數據庫到mount。system數據文件壞塊導致數據庫無法打開,各種隱含參數也不能繞過system的壞塊。搭建數據庫環境,使用dmp文件還原數據庫,但是某個日期之后的數據導入報錯,只能導入這個日期之前的數據。
北亞企安數據恢復—RAID5數據恢復
由于故障發生后又對RAID進行了重建,導致一塊盤的數據被同步破壞。在第二塊盤離線之前,熱備盤已經同步了一段時間,已經寫入了部分數據,所以使用熱備盤中的數據只能恢復某個日期之前的數據。
8、在用戶方的配合下啟動Oracle數據庫。在本地虛擬機安裝OA客戶端,通過OA客戶端對數據記錄進行驗證,并且安排不同部門人員進行遠程驗證。
9、經過用戶方驗證,確認恢復出來的數據有效,認可數據恢復結果。沒有恢復出來的數據量比較少,可以通過其他方式人工補回來。
審核編輯 黃宇
-
存儲
+關注
關注
13文章
4353瀏覽量
86169 -
數據恢復
+關注
關注
10文章
585瀏覽量
17630 -
RAID5
+關注
關注
0文章
122瀏覽量
12767
發布評論請先 登錄
相關推薦
評論