bge0: watchdog timeout

Dan Lukes dan at obluda.cz
Tue Sep 7 18:51:58 CEST 2010


On 09/07/10 18:05, Miroslav Prýmek:
> Zajimavy je, ze me to na 7.x jelo uplne bez problemu - a taky se tam delaly zalohy
> v radu malych desitek gigabajtu...
>
>> Zajimave ovsem bylo, ze cerstve po restartu to tak 15 minut chodilo skvele.
>> Pak v ruznych casech vypadky od 1 do 4 vterin nahodne. Cim dele stroj bezel, tim castejsi.
>> f.
>
> Tak to jsem nepozoroval. Vsiml jsem si toho az kdyz se pustilo zalohovani,
> takze bych rekl, ze to souviselo spis se zvysenym provozem nez s casem.

U takto malo popsane zavady se samozrejme neda rict nic urciteho, ale 
jednou z moznych pricin "timeout" nektereho z hardwarovych zarzeni je 
"ztracene preruseni". Zarizeni proste ma dat vedet prerusenim, ze 
uspesne dokoncilo pozadovanou operaci - a ono neda.

Preruseni se muze ztratit (krome hardwarovych problemu) take u sdilenych 
preruseni v dusledku chyby v voladacich kdy preruseni prohlasi za sve 
nespravny ovladac. Pritom nemusi jit o deterministicky se vyskytujici 
chybu - casteji jde o nejakou race-condition vyskytujici se tehdy, pokud 
je v nevhodny okamzik splneni vice podminek soucasne.


Pak samozrejme zalezi na tom jak je vyuzivana sitovka ono "druhe" 
zarizeni. Takze se snadno stane, ze nekdo jiny problemy nema vubec - 
bud' proto, ze nema ono "druhe" zarizeni, nebo ma jinou hardwarovou ci 
softwarovou konfiguraci, taze to zarizeni se sitovkou preruseni nesdili. 
Staci mit karty zasunute v jinych slotech.

Problem muze mit i casove zavislou "teplotni" slozku - ony podminky, 
ktere musi byt splneny soucasne mozna mohou byt splnovany jen v pripade, 
ze zarizeni vlivem zmeny teploty zmeni nektere sve charakteristiky 
(nikoliv nutne mimo povolene tolerance - staci v ramci nich). Ale ze 
samotneho faktu,ze "nejdriv to vzdycky 15 minut bezelo" nelze mit 
automaticky za dokazane, ze to je ten pripad.

> Nicmene teda asi budu resit, jakou sitovku tam dat. Ta, co jsem tam
> narychlo dal ted je:
>
> em0 at pci0:9:0:0:	class=0x020000 card=0xa01f8086 chip=0x10d38086 rev=0x00 hdr=0x00
>      vendor     = 'Intel Corporation'
>      device     = 'Intel 82574L Gigabit Ethernet Controller (82574L)'

Intelky jsou obecne dost dobra volba. Nejenze jde o hardwarove celkem 
slusne zarizeni, ale hlavne - Intel se pro podili na vyvoji ovladacu. Da 
se tedy spis ocekavat bezproblemova soucinnost hardware a ovladacu.

> Myslite, ze clovek neco vyznamnyho ziska, kdyz tam da podobnou kartu ze serverove
> rady? (neco na zpusob http://www.alza.cz/sitova-karta-intel-pro-1000-pt-server-adapter-pci-e-x1-d65224.htm
> - cca 3x drazsi)

Obecne bys mel ziskat lepsi pomer "pruchodnost"/"spotreba vykonu 
procesoru". Ale jake bude to zvyseni pruchodnosti a snizeni zatizeni lze 
tezko odhadnout - to zavisi hodne na konkretnim zpusobu pouzivani a jak 
se to projevi zrovna u tebe nedokazu odhadnout.


> Nejkritictejsi a nejvic "online" vec, co tam bezi, je samba PDC s cestovnimi profily
> a nejakymi sdilenimi. Pro ostatni sluzby vykon neni kriticky (smtp, imap, proxy, dns apod.).
> Stroj ma CPU vytizeni stabilne v radu jednotek procent.

Pak te snizeni zateze procesoru asi moc neoslovi ...

						Dan



More information about the Users-l mailing list