swap_pager: indefinite wait buffer

Miroslav Lachman 000.fbsd at quip.cz
Mon Aug 7 09:53:29 CEST 2006


Miroslav Lachman wrote:
[...]
> Napriklad spusteni prikazu gstat trva vic nez minutu.
[...]
> Vsimnete si, ze disky maji 111% busy (pri jednotlivych obnovenich 
> obrazovky se hodnoty pohybuji od 90 do 115), presto tps pouze 1 a datovy 
> tok temer nulovy.
> Ve vypisu gstat je videt problikavani velmi vysokych hodnot 
> procentualniho zatizeni (cisla od 150 az do 3000), ale jsou to jen velmi 
> kratke okamziky, rozhodne to nevypada, jako kdyz se na disk opravdu neco 
> systematicky zapisuje / cte. Zaroven jsou tam silene dlouhe casy pro 
> zapisy (ms/w).
> 
> dT: 0.501s  w: 0.500s
>   L(q) ops/s r/s kBps ms/r w/s kBps   ms/w   %busy Name
>     0    0    0    0  0.0   0    0    0.0    0.0| acd0
>     4    2    0    0  0.0   2    4 5110.3  164.6| ad5
>     5    2    0    0  0.0   2    4 5002.8  167.9| ad4
>     6    2    0    0  0.0   2    4 5002.9  167.9| mirror/gm0
>     0    0    0    0  0.0   0    0    0.0    0.0| ad4s1
>     0    0    0    0  0.0   0    0    0.0    0.0| ad4s2
>     0    0    0    0  0.0   0    0    0.0    0.0| ad5s1
>     0    0    0    0  0.0   0    0    0.0    0.0| ad5s2
>     1    0    0    0  0.0   0    0    0.0    0.0| mirror/gm0s1
>     5    2    0    0  0.0   2    4 5003.0  167.9| mirror/gm0s2
>     0    0    0    0  0.0   0    0    0.0    0.0| mirror/gm0s1a
>     0    0    0    0  0.0   0    0    0.0    0.0| mirror/gm0s1b
>     0    0    0    0  0.0   0    0    0.0    0.0| mirror/gm0s1c
>     0    0    0    0  0.0   0    0    0.0    0.0| mirror/gm0s1d
>     0    0    0    0  0.0   0    0    0.0    0.0| mirror/gm0s1e
>     0    0    0    0  0.0   0    0    0.0    0.0| mirror/gm0s1f
>     0    0    0    0  0.0   0    0    0.0    0.0| mirror/gm0s1g
>     1    0    0    0  0.0   0    0    0.0    0.0| mirror/gm0s1h
>     0    0    0    0  0.0   0    0    0.0    0.0| mirror/gm0s2c
>     5    2    0    0  0.0   2    4 5003.0  167.9| mirror/gm0s2d
> 
> Nejsem bohuzel nijak schopen zjistit, cim to muze byt.

Tak uz jsem v podstate nahodou zjistil, cim bylo to zpomaleni - muze za 
to extended self-test SMART monitoringu disku. Nevim, jestli self-test 
ridi smartmontools, nebo jen preda patricny prikaz disku a ten uz si 
test dela sam (rekl bych, ze plati druha varianta). Test jsem vcera 
vecer spustil prikazem smartctl -t long /dev/ad4 a mel trvat priblizne 
dve hodiny. Jenze kdyz jsem se rano prihlasoval na server (asi 10 hodin 
od spusteni self-testu), choval se opet velmi zpomalene (viz popis z 
puvodniho mailu) a vypis gstat vypadal jako vyse uvedeny. smartctl -X 
/dev/ad4 jsem abortnul test, ktery stale jeste bezel (podle zaznamu ve 
SMART logu byl v 90%, ale to same je tam zapsane z doby pred 2 dny). 
Zkratka test se nejak zasekne a naprosto zpomali disk.

Zkusil jsem stejny prikaz pustit na jinych strojich s jinymi disky a tam 
se to chova tak, jak bych ocekaval - disk neni testem nijak viditelne 
zpomalen, cist z neho jde az 60MB/s (dvojnasobek toho, co na zminenem 
"problemovem" stroji pri vypnutem selftestu!)

Vyznate se nekdo ve SMART disku natolik, abyste mi dokazal rict, jestli 
je problem ve smartmontools, nebo je to chyba disku? Nemuzu v serveru 
vyzkouset jiny disk, protoze server je pronajaty a poskytovatel ma k 
dispozici jen uplne stejne disky z jedne serie, ktere se patrne chovaji 
stejne :(

Miroslav Lachman



More information about the Users-l mailing list