zlyhanie vinum mirroru

Dan Lukes dan at obluda.cz
Wed Jun 30 13:27:36 CEST 2004


Jozef Babjak napsal/wrote:

> Prvym indikatorom problemov bolo, ked mi screen(1) v ktorom bezalo
> centericq(1) "spadlo" na signal 11. Povedal som si ze "stava sa", pre
...
> niekolkych malo minutach sa to iste stalo kolegovi, ktory bol tiez
> pripojeny cez ssh a mal spustenu kombinaciu screen(1) + centericq(1).  
> Vtedy som spozornel a prakticky okamzite som zistil ze jeden zo subdiskov
> v mirrore je v stave "up" a druhy v stave "staled". Do cca 10 minut bol 
> jeden zo subdiskov v stave "staled" a druhy v stave "crashed", mirror sa 
> porucal do vecnych lovist a udaje sa mi nepodarilo nijakym sposobom 
> zachranit. Rovnaky status diskov bol aj po prelozeni oboch HDD do ineho 
> pocitaca s FreeBSD. 
> 
> Hardverovo su oba disky v poriadku, teda aspon isli bez problemov znovu 
> rozdelit, naformatova a vytvorit na nich opat vinum mirror. Ma niekto z 
> vas napad, preco mohlo k takejto poruche dojst? Disky "neodisli" naraz, 
> ale v kratkom casovom useku za sebou. Hardverovo su v poriadku, poskodili 

	Moznosti je mnoho.

	Jedna z teorii pravi, ze SIGSEGV se objevuje pri vadach pameti (at uz
jde o vadu pameti jako hardware, nedobry kontakt nebo treba prehrati -
je leto a pokud jsou vetraky prizadrene ...). Chyba v pameti muze tedy
byt pricinou obou padu i chyby v kodu VINUM, ktera sice nevedla k padu
neprodlene, ale, o to hur, vedla k postupnemu poskozovani disku (kdyz
vinum uz nebylo ve "zdravem" stavu, ale stale na disky sebevedome
zapisovalo).

	Druha teorie rika, ze mohlo jit primarne o nejakou chybu v kodu
"vinum", ktery vedl k zapisovani nesmyslu na disk. Konec koncu, je to
preci jen software ...

	Pozorovany SIGSEGV pak nastal pote, co se "vinum" konecne trefilo do
kodu programu nebo knihovny ktery v dane chvili bezel, ale "postizena"
pasaz nebyla v te chvili v pameti (kody knihoven a programu se v pripade
potreby pameti neswapuji ale zahazuji, protoze je lze kdykoli znovu
obnovit z puvodniho souboru). V okamziku kdy byl uvedeny obsah zavedeny
do pameti doslo k havarii programu.

	A to nejsou teorie jedine. Ale poznat, co konkretne to bylo u vas bude,
obavam se, na dalku nemozne (a v soucasne chvili uz asi i z blizka).

							Dan




More information about the Users-l mailing list