服務(wù)器存儲數(shù)據(jù)恢復(fù)環(huán)境:
一臺存儲中有一組由6塊硬盤組成的RAID6,劃分為若干LUN,MAP到不同業(yè)務(wù)的SOLARIS操作系統(tǒng)服務(wù)器上。
服務(wù)器存儲故障:
由于業(yè)務(wù)變化需要增加一臺服務(wù)器,在存儲在線的狀態(tài)下將該存儲中的某個LUN映射到這臺新增加的服務(wù)器上并開始初始化,不料映射的這個LUN已經(jīng)MAP到其他SOLARIS服務(wù)器上了。由于該LUN已經(jīng)進(jìn)行了部分的初始化,磁盤報(bào)錯,重啟后發(fā)現(xiàn)卷無法掛載。
SUN工程師檢測后執(zhí)行了fsck操作,執(zhí)行fsck操作后文件系統(tǒng)雖然可以掛上,但是發(fā)現(xiàn)很大量數(shù)據(jù)丟失或文件大小變?yōu)?,特別是最新的數(shù)據(jù)損壞嚴(yán)重。
此類故障在SAN環(huán)境下較為常見,多數(shù)是人為導(dǎo)致,本案例情況就是如此。SAN分配出來的LUN是采用獨(dú)占模式的,如果同時被幾個操作系統(tǒng)控制,就會導(dǎo)致寫操作不互斥,繼而出現(xiàn)文件系統(tǒng)一致性出錯的問題。
針對這類問題的數(shù)據(jù)恢復(fù),需要深入文件系統(tǒng),觀察并分析具體的結(jié)構(gòu)破壞情況。本案例中的文件系統(tǒng)是UFS,所以對任何一個需要恢復(fù)的文件而言,我們需要優(yōu)先考慮目錄信息、節(jié)點(diǎn)、數(shù)據(jù)區(qū)是否正常。如果這3個結(jié)構(gòu)均正常,數(shù)據(jù)可完整恢復(fù)。多數(shù)情況下,執(zhí)行fsck操作后INODE會被清除,即使留下目錄信息,也無法與數(shù)據(jù)一一對應(yīng)。這種情況下只能參考文件內(nèi)部格式進(jìn)行類型式的恢復(fù)了。
服務(wù)器存儲數(shù)據(jù)恢復(fù)過程:
1、完整備份故障卷。因?yàn)镽AID無故障,所以可以直接在SOLARIS環(huán)境中對原LUN做dd備份。后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復(fù)操作都在備份文件中進(jìn)行,避免對原始數(shù)據(jù)造成二次破壞。
2、基于備份文件分析文件系統(tǒng)。經(jīng)過分析確認(rèn)需要恢復(fù)文件的inode已經(jīng)被全部清除,無法恢復(fù),只能按照文件類型進(jìn)行處理。
3、分析需要恢復(fù)的特定文件,發(fā)現(xiàn)采用vfs文件系統(tǒng)的索引文件具有強(qiáng)的類型特征,同時文件中包含目錄信息。
4、按照vfs文件系統(tǒng)的索引結(jié)構(gòu)特征,北亞企安數(shù)據(jù)恢復(fù)工程師編寫程序提取數(shù)據(jù)文件,提取完成后根據(jù)特征重新命名。
5、按類型恢復(fù)數(shù)據(jù)文件后,根據(jù)索引文件重新整理數(shù)據(jù)文件。
6、上述數(shù)據(jù)恢復(fù)操作完成后交由用戶方檢測。經(jīng)過用戶方仔細(xì)檢測,發(fā)現(xiàn)目錄索引文件基本上完整恢復(fù),大部分?jǐn)?shù)據(jù)文件恢復(fù)成功。針對無法恢復(fù)的文件,只能根據(jù)目錄索引文件重新采集。用戶方認(rèn)可數(shù)據(jù)恢復(fù)結(jié)果。
審核編輯 黃宇
-
服務(wù)器
+關(guān)注
關(guān)注
12文章
9304瀏覽量
86066 -
SAN
+關(guān)注
關(guān)注
0文章
162瀏覽量
41340 -
數(shù)據(jù)恢復(fù)
+關(guān)注
關(guān)注
10文章
585瀏覽量
17632
發(fā)布評論請先 登錄
相關(guān)推薦
評論