Padani stroje

Dan Lukes dan at obluda.cz
Mon Jan 14 11:51:00 CET 2013


On 01/14/13 09:33, Radek Krejča:
> padaji mi 3 stroje na nasledujici chybu - je to ovladaci, ci cim to muze byt?
> Fotka je zde: http://www.krejca.info/chyba.jpg

Pokud se to opakuje (a me se jevi, ze ano), je treba nejmene jeden z 
tech stroju nechat bezet na kernelu s ladicimi informacemu 
(/boot/kernel/kernel.debug)

Az takovy stroj spadne, vznikly coredump je dulezity zdroj informaci:

gdb -k kernel.debug /usr/crash/vmcore.0

(jmeno coredumpu se bude nejspis lisit)

Vypise totiz u funkci nejen binarni offsety, ale primo cisla radku 
odkazujici do zdrojovych kodu. Tedy - misto

> #5 0xffffffff8060c05a at turnstile_wait+0x01aa

bychom videli (ve vypisu gdb, ne pri samotnem panicu) neco jako:

> #5 0x8060c05a in turnstile_wait (ts=???, lock=0x???, owner=0x???)
>     at /usr/src/sys/kern/subr_turnstile.c:???

Podstatne jsou ty otazniky. To by dovolilo exaktnejsi analyzu.

Bez toho muzu zkusit leda hadat - klicovy je ramec #5, funkce 
turnstile_wait(). Ta mela problemy v zamcich uz driv, abendovalo to tam 
uz pred cca osmi lety jeste na 5.2-R (nevim presne, ja se vsem 5.x 
vyhnul obloukem).

Ja osobne bych nejspis zkusil aplikovat patche z techto dvou setu:
http://svnweb.freebsd.org/base?view=revision&revision=239585
http://svnweb.freebsd.org/base?view=revision&revision=240424

Myslim, ze ani v 9.1 jeste nejsou.

Tezko ale dokazu vysvetlit proc prave tyhle dva. Vybral jsem si je 
postupem, kterej smrdi vestenim a samotne podklady pro vesteni uz jsou 
taky "hadane". Takze vsechno co k tomu muzu rict, ze ja bych zkusil 
prave tohle. Mozna to nezabere a mozna dokonce uskodi. C'est la vie.

Dan






More information about the Users-l mailing list