Rozpadly mirror s vadnym diskem

Miroslav Prýmek m.prymek at gmail.com
Tue Sep 11 11:46:16 CEST 2012


Zdravim,

mam dost neprijemny problem a chtel bych vas pozadat o konzultaci, nez
se pustim do reseni.

U zakaznika doslo k neocekavanemu vypadku proudu a UPSka server
neudrzela. Bohuzel doslo k nestastne shode nahod, fakta:

1. server ma dva disky v gmirroru (ad4,ad6)
2. na disku ad6 se objevily SMART chyby
3. disk ad4 je podle SMART v poradku, ale z mirroru vypadl (nejspis
vlivem toho vypadku se tam neco nezapsalo)

Problem je v tom, ze mirror nejde obnovit, protoze z disku ad6 nejdou
nektere sektory precist:
# gmirror status
      Name    Status  Components
mirror/gm0  DEGRADED  ad6
                      ad4 (99%)

Z logu:
ad6: FAILURE - READ_DMA48 status=51<READY,DSC,ERROR>
error=40<UNCORRECTABLE> LBA=488381440
GEOM_MIRROR: Synchronization request failed (error=5).
mirror/gm0[READ(offset=250051297280, length=131072)]
FAILURE - READ_DMA48 status=51<READY,DSC,ERROR>
error=40<UNCORRECTABLE> LBA=488395008
GEOM_MIRROR: Synchronization request failed (error=5).
mirror/gm0[READ(offset=250058244096, length=131072)]

Zalohu mam, ale kompletni obnove bych se rad vyhnul - nechal ji az
jako uplne nejzazsi moznost, protoze
od te posledni zalohy uzivatele pracovali (zaloha je ze dneska 4:30).
Uzivatelu je hodne a vsem vysvetlit, ze o dnesni
praci prisli, neni moc pruchodne...

Predpokladam, ze mirror zadnym zpusobem obnovit nejde (neco jako
"obnov mirror a ignoruj sektory, ktere se nepodarilo
zesynchronizovat").

Zasadni otazka zni:
1. kdyz gmirror vypsal dve oblasti, ktery se nepodarilo
zesynchronizovat, znamena to, ze zbytek je v poradku? Nebo kdyz se
vyskytnou
    dve chyby, tak dalsi pokusy vzda (takze chybi vsechno od offsetu
250058244096 do konce disku)?

2. da se nejak zjistit, jake soubory jsou v te poskozene oblasti ulozene?

Nebo je lepsi na tohle se vykaslat a situaci vyresit jednoduse tak, ze
do serveru zapojim novy disk, vytvorim na nem novy mirror a data tam
prekopiruju tarem, takze presne uvidim, ktere soubory neslo precist, a
ty obnovit ze zalohy?

Nebo mate nejakou jinou radu, jak postupovat?

dik

Mirek


More information about the Users-l mailing list