zjisteni kodovani souboru

Jan Pechanec jp at devnull.cz
Mon Mar 23 13:52:46 CET 2009


On Mon, 23 Mar 2009, Jan Pechanec wrote:

>	zamysli se nad tim, co chces. Jak poznas win-1250 od lat2? Ze znaku 
>z/s s diakritikou (nebo jaky to jsou); kdyz je vsechno OK az na ty 2 znaky, 
>ale divam se na to v kodovani lat2, tak to je asi 1250. Atd.
>
>	kodovani souboru je o semantice, takze by se to muselo resit nejak 
>heuristicky. Nevim, jestli na to nejaky program, treba v portech, existuje.

	jo, a pokud je, tak pochybuju, ze bude pro cestinu. Jak pisu, je to 
o semantice, takze kdyz nepodporuju jazyk, v jakem to je napsane, tak s tim 
muzu tezko neco rozumnyho udelat. Mohl bych treba zkouset hledat nejaky 
znaky v UTF kodovanich, jako euro atd., a podle toho usoudit, ze to je 
UTF-x, ale to jsou jen specialni pripady.

-- 
Jan Pechanec <jp (at) devnull (dot) cz>
http://www.devnull.cz



More information about the Users-l mailing list