sockets disabled, out-of-fds

Miroslav Lachman 000.fbsd at quip.cz
Thu Dec 8 21:54:55 CET 2016


Dan Lukes wrote on 2016/12/08 19:36:

> To muze znamenat proste jen prilis velky pocet prichozich pozadavku
> (velky zajem o server nebo utok), ne az tak velky pocet prichozich
> pozadavku, ale takoveho typu, ze jejich vyrizeni trva velmi dlouho (mj.
> napriklad proto, ze o velka data zada klient s pomalym spojenim, takze
> prilis dlouho trva prenos), priblem lighttpd (z nejakeho duvodu i
> normalni a male pozadavky vyrozuje velmi pomalu - napriklad jsou data na
> vzdalenem disku a problemy jsou s nim).

Mam graf datoveho toku, poctu otevrenych spojeni lighttpd, pocet 
obslouzenych requestu za sekundu, ale bohuzel s tou petiminutovou 
granularitou tam nikde neni ani naznak nejakeho narustu. Takze pokud to 
opravdu byl nejaky velky pocet spojeni, narostlo to tak rychle, ze to na 
grafu neni videt.

>> Proces Lighttpd bezi, ale neodpovida
>
> Ja myslim, ze odpovida - ale musis se s prichozim pozadavkem trefit do
> toho okamziku, kdy se ve fronte prichozich pozadavku zrovna uvolni misto
> - a pak si pockat, nez pozadavek prijde na radu a TCP spojeni je
> skutecne navazano (coz se navic musi trefit do okamziku, kdy ma lighttpd
> prostor pro navazani dalsiho spojeni) a kdy je skutecne vyrizeno.
>
> Statisticky to muze vypadat, ze neodpovida vubec.

Podle access logu to vypadalo takhle - skutecne po ohlaseni out-of-fds 
dobehla jen existujici spojeni (v case 14:09:16) a pak to nabehlo az po 
restartu Lighttpd

192.168.28.106 xx.yyy.zz - [07/Dec/2016:14:09:05 +0100] "GET 
/noRW_layout/favicon.ico HTTP/1.1" 200 894
91.13.253.30.cz xx.yyy.zz - [07/Dec/2016:14:09:16 +0100] "GET 
/noRW_wr/o2/mojeid-prihlasit-155x24.png HTTP/1.1" 304 0
192.168.15.145 xx.yyy.zz - [07/Dec/2016:14:42:43 +0100] "GET 
/noRW_layout/favicon.ico HTTP/1.1" 200 894

>> "service lighttpd restart" problem vyresi.
>
> To porad jeste nedokazuje, ze problem je nutne v nem (ale nerikam ani,
> ze neni).
>
> Je treba zjistit jake pozadavky ma ten server "rozdelane" v okamziku,
> kdy problem nastal, zda je vubec vyrizuje (a nove jen pribyvaji moc
> rychle) nebo data nepodava vubec (pak je dobre identifikovat jaka data
> to ma problem podavat a zacit hledat proc by mel byt problem je podat).

server-status stranka byla samozrejme taky nedostupna, ale muzu priste 
zkusit nejaky truss, ktrace, nebo tak neco. I kdyz si s tim moc nerozumim.

Mirek



More information about the Users-l mailing list