OCR

Ivo Hazmuk ivo at vutbr.cz
Wed Nov 6 10:14:09 CET 2002


Dobre dopoledne,

> 	Nemam sice prehled o tom, jake papiry hodlate skladovat, nehodlam
> tady ani vyvolat na toto tema diskusi, ale muj soukromy pocit je, ze
> dokumenty se daji zaradit do tri trid - ucetni doklady a podklady pro

mame vsechny tri tridy, ale staci nam vyznamne zjednoduseni. Ukol zni:
"byt schopen papir vyhledat". Vetsinou se jedna o dodaci listy, smlouvy,
... Jejich originaly jsou archivovany ruznym zpusobem (ucetni oddeleni,
sekretarka, ...). Jenze do archivu se da jit pouze se znalosti typu a
cisla dokumentu. Uvaha znela nascanovat, OCR z prikazove radky s
konfigurakem a dostatecnou uspesnosti. Data do vyhledavaciho stroje
podle klicovych slov.

Vypada to na uplne jine reseni. PDF v 1.4 muze obsahovat jak puvodni
nascanovany obrazek, tak i text. U jedne HP tiskarny/scanneru je pod M$
Widows program, ktera umi takto strukturovana PDF vytvaret primo pri
scanovani. Uspesnost je vyssi nez OCR programem.
Bohuzel Acrobat Reader i xpdf v libovolnych versich si s temito
dokumenty nerozumi. Snad se to casem zlepsi.

							Ivosh

Open-Source software isn't a matter of life or death...
...It's much more important than that!




More information about the Users-l mailing list