Re: Reštart pri zvýšenej záťaži

Vladimír Drgoňa vlado at drgona.eu
Sat Jan 30 11:38:51 CET 2016



Dňa 30.01.2016 o 10:55 Dan Lukes napísal(a):
> On 01/30/16 10:21, Vladimír Drgoňa wrote:
>> mám malý domáci server:
>> core-i3, 16GB RAM, 2x3000GB WD RED, 120GB SSD-Intel
>> FreeBSD-10.2-RELEASE-p11, 2x3000GB mirror zfs, 120GB je ako cache a zil.
>
> Nepochybne jsem nespravedlive zaujatej, ale nelze prehlednout, ze jak
> v posledni dobe resim nejakej "podivnej" problem okolo stability, tak
> logy maji zretelne stycne body. A temi spolecnymi body jsou pismena Z,
> F a S
>
> Zrovna naposled jsem resil postupne ztracejici se pamet. A on ji
> postupne pozira kernelovy modul opensolaris, ktery tam je kvuli ...
> ... modri uz urcite vedi ...
>
Áno, asi to bude "požieraním" pamäte, problém nastáva najčastejšie po
2-3 týždňoch, dovtedy je swap nulový.

>> Ak na server pristupujú súčasne všetci klienti, zfs začne masívne
>> využívať disky (hlavne cache na SSD), obsadí oveľa viac pamäte a
>> potrebuje použiť swap.
>
> Uz v tyhle chvili tedy vime, ze stroj neni na zatez dimenzovanej. Za
> bezne se vyskytujici zateze (a tou se mysli i opakovane se vyskytujici
> spickove zateze) stroj swap pouzivat nesmi.
S tým nesúhlasím, na opakovanú záťaž stačí, pokiaľ nemá problém s pamäťou.
>
>
>> V takomto prípade sa občas celý server reštartne
>> aj bez toho, aby celý swap využil a bez zápisov do logov. Keď vypnem
>> dedup, server beží bez problémov aj rok.
>> Čo sa s tým dá robiť okrem vypnutia dedup?
>
> Velmi nerad to uslysis, ale da se s tim udelat jedine - najit tu
> chybu. Coz znamena mit debugovaci kernel, nakonfigurovat system tak
> aby pri restartu udelal coredump (na to ale, zda se mi, nemas ten swap
> dost velkej, takze nejprve zvetsit swap - musi byt vetsi jez je
> mnozstvi fyzicke pameti) - doufat, ze to pri padu ten coredump udela.
>
> Pak uz "jen" zjistit co to delalo v okamziku, kdy to spadlo, najit tu
> chybu a opravit ji. Pokud bych mel vystrelit zcela naslepo, tak jde o
> chybu pri praci s pameti, ktera je chybne oznacena jako zpusobila k
> odswapovani, nasledne odswapovana - a system spadne v okamziku, kdy
> kernelovy modul tu pamet chce pouzit v kontextu, ktery nedovoluje jeji
> nacteni ze swapu. Ale to jsem si jen hodil kostkama. Muze to byt i
> uplne neco jinyho.
>
> Existuje pro tebe urcita mala sance na mene narocne reseni. Pokud
> nejde o memory-leak (kdy je spotreba pameti z dlouhodobeho hlediska
> shora neomezena), pak by ti problem mohlo vyresit pridani pameti - a
> to takoveho mnozstvi, aby swap nebyl potrebny.
>
> Ostatne, uz nahore jsem naznacoval, ze to je minimalni mnozstvi pameti
> v kazdem pripade.
>
Pamäť nemôžem pridať, jedine po výmene dosky (procesora atď). Pred rokom
tam bolo 8GB.

> Alternativne se samozrejme muzes pokusit omezit pouzivani stavajici
> pameti - zkusit ZFS presvedcit, ze nesmi pouzivat vic pameti nez kolik
> ji je. I pokud se ti to povede, nebude to zadarmo, nejspis to bude mit
> negativni vliv na vykon.
>
Zfs by nemalo používať viac ako 4GB RAM, mám nastavené vfs.zfs.arc_max:
4294967296.
>> Reštart nastane samozrejme v najnevhodnejší čas.
>
> To je nejpravdepodobnejsi - v dobe nejvetsi zateze jsou nejvetsi
> naroky na pamet.
>
>> Za každú radu ďakujem.
>
> Skutecne i za tuhle ? ;-)
>
Samozrejme, takto som si overil že nie som jediný kto má problémy so zfs.
>
> Dan
>
>
>
>



More information about the Users-l mailing list