Padani stroje

Radek Krejča radek.krejca at starnet.cz
Mon Jan 14 14:57:16 CET 2013


Ahoj,

> Pokud se to opakuje (a me se jevi, ze ano), je treba nejmene jeden z
> tech stroju nechat bezet na kernelu s ladicimi informacemu
> (/boot/kernel/kernel.debug)
> 
> Az takovy stroj spadne, vznikly coredump je dulezity zdroj informaci:
> 
> gdb -k kernel.debug /usr/crash/vmcore.0
> 
> (jmeno coredumpu se bude nejspis lisit)
> 
> Vypise totiz u funkci nejen binarni offsety, ale primo cisla radku
> odkazujici do zdrojovych kodu. Tedy - misto
> 
> > #5 0xffffffff8060c05a at turnstile_wait+0x01aa

Hm, asi budu vypadat jako vecny potizista, ale tohle bude trosicku problem - jednak je to diskless masina, takze logovani bude pro me trosicku problem, i kdyz by asi slo to snad odsmerovat nekam na zapisovatelnou nfs "partisnu". Druhy, vetsi problem je, ze opravdu vzacne se stane, ze se k takhle padlemu stroji dostanu ja - vzdy tam vyjede technik, co ma pohotovost a pocitac jako prvni vyrve ze zasuvky, aby lidi mohli jet :-(.

> 
> bychom videli (ve vypisu gdb, ne pri samotnem panicu) neco jako:
> 
> > #5 0x8060c05a in turnstile_wait (ts=???, lock=0x???, owner=0x???)
> >     at /usr/src/sys/kern/subr_turnstile.c:???
> 
> Podstatne jsou ty otazniky. To by dovolilo exaktnejsi analyzu.
> 
> Bez toho muzu zkusit leda hadat - klicovy je ramec #5, funkce
> turnstile_wait(). Ta mela problemy v zamcich uz driv, abendovalo to tam
> uz pred cca osmi lety jeste na 5.2-R (nevim presne, ja se vsem 5.x
> vyhnul obloukem).
> 
> Ja osobne bych nejspis zkusil aplikovat patche z techto dvou setu:
> http://svnweb.freebsd.org/base?view=revision&revision=239585
> http://svnweb.freebsd.org/base?view=revision&revision=240424
> 

To jsou "oficialni" opravy systemu? Tedy kdyz stahnu cvsupem a rebuildnu world, tak to tam bude? Pokud ano, tak by to tam melo byt, zaplaty jsem aplikoval velmi nedavno, cca tyden zpet.

Zkusim instruovat techniky, aby pouzili ten prikaz, ale jelikoz mi skoro rok trvalo, nez jsem vsechny presvedcil, aby udelali alespon fotku, nez to restartujou, tak to vidim blede :-(.

Radek



More information about the Users-l mailing list