Problem s diskom - DMA TIMEOUT

Miroslav Lachman 000.fbsd at quip.cz
Fri Dec 4 09:51:52 CET 2009


Dan Lukes wrote:
> Marian Cerny napsal/wrote, On 12/03/09 16:36:

[...]

> Co se tyce toho, ze jeden disk vyrvava i po odpojeni - nemame od tebe vypis
> swapctl -l
> takze nevime, kde swap mas.

Z hlasky "Device gm0: provider ad12 disconnected" usuzuji, ze se cely 
disk pouziva pro RAID, neni tedy rozdeleny na slices / partitions, aby 
mohla cast byt pouzita pro swap a zbytek pro mirror. Leda ze by pro swap 
byl pouzit jeste uplne jiny disk, nez ty dva zminene, ale to by stejne 
nevysvetlilo, proc se neco (swap_pager) snazi dal pracovat s diskem ad12

> Mimochodem, ja bych swap na softwarovy RAID nedaval, nicmene, dovedu si
> predstavit situace, kdy to ma smysl.

Na jednu stranu to celkem chapu, ale na druhou stranu, neznamena to 
nahodou pak uplnou zbytecnost pouziti gmirroru, jelikoz system v 
okamziku problemu s diskem (jeho zmizeni / odpojeni) stejne zhavaruje a 
pak jsou dva samostatne swapy (na dvou diskach) jenom zvysenim 
pravdepodobnosti, ze jeden z nich bude mit nekdy nejaky problem?

Osobne kdyz uz nekde gmirror pouzivam, tak na cely disk vcetne swapu a 
system tak prezije i uplne zmizeni disku z ata kanalu. Takze aspon v mem 
pripade se mi vic vyplatilo mit i swap na SW RAIDu, problemy jsem s tim 
snad nikdy nezaznamenal.

> P.S.
> Obecne se v posledni prislo na to, ze rada disku neni vhodna pro provoz
> v RAIDu. A to proto, ze nekdy jim odpoved trva prilis dlouho (rec je o
> zejmena pripadech, kdy disk pouziva L2 samoopravny algoritmus, ktery je
> vypocetne narocnejsi) a RAID management je ma tendenci vyhodnotit jako
> vadne a vyradi je.
>
> Jak Seagate tak WD na problem reagovalo uvolnenim novych firmware pro
> nektere typy svych disku. Ten tvuj ale mezi ne nepatri, coz by mohlo
> znamenat, ze je v tomto ohledu v poradku.

FreeBSD pouziva obecne hrozne nizky timeout pro praci s (S)ATA disky (5 
sekund) a i kdyz na to bylo opakovane poukazovano i nekterymi vyvojari 
(tech PR, patchu, diskuzi v mailinglistech je vazne mnoho), tak se za 
uplynulych par let moc nezmenilo. Az celkem nedavno nekdo commitoval 
zvyseni nekterych timeoutu asi na 10 sekund, ale mam pocit, ze se to 
tykalo jen timeoutu po probouzeni disku ze spun down.
Ve FreeNASu je/byla dokonce moznost si ty timeouty nastavit pres sysctl, 
coz mi prislo rozumne reseni a porad mi neni jasne, proc to nebylo 
zpetne prijmuto do src FreeBSD - v zadne diskuzi se k tomu nikdo z 
vyvojaru nevyjadril ani kladne, ani zaporne. Pripada mi, jako by se 
kolem (S)ATA subsystemu chodilo v tichosti po spickach.
(az ted pro 9-CURRENT / 8-STABLE zacal Alexander Motin s prepisem pro 
CAM a zatim s celkem pozitivnim vysledkem)

Mirek


More information about the Users-l mailing list