|
[an error occurred while processing this directive]
Jak na OCR
25.4.2003
OCR program obvykle vyžaduje, aby obrázky textu měly rozlišení aspoň 300 dpi. V článku o dpi jsem se pokusil vysvětlit některé zdánlivé záhady s dpi spojené. Ve fotografické praxi nemusíme zpravidla na dpi myslet. Ovšem v praxi OCR bývá dpi 300 základní požadavek. Vtip ale je v tom, že snímek pořízený digitálním aparátem má vždy 72 dpi. Zde by mohl být zdroj potíží. Při mých pokusech si Fine Reader kupodivu nechal 72 dpi líbit, může se ale stát, že vám hodí hlášku, že má zdrojový obrázek (tedy snímek textu) malé rozlišení. Zde je třeba postupovat obezřetně. Jde o editaci, proto editujte kopii. Ve volbě Velikost obrazu vypněte volbu Převzorkovat obraz - horní část dialogové=ho okna se vypne. V okénku Rozlišení přepište původních 72 na 300. Změní se původní údaj 2048x1536 bodů na 491x368 bodů - toho si nevšímejte, důležité je, že snímek má 300 dpi. Nyní zopakujte pokus s rozpoznáním. Kdyby soft i tentokrát vykázal příliš mnoho chyb, jděte zase do volby Velikost obrazu, tentokrát zapněte volbu Převzorkovat obraz, a šířku 491,5 nastavte dejme tomu na 600. V horní části dialogového okna se změní situace - bude tam 2500x1875: tentokrát skutečně fyzicky zvětšujeme obrázek. Po zvětšení je dobře doladit jas a kontrast, eventuálně doostřit a teď už by to mělo fungovat. Zkušenost s C-740 UZ je velmi dobrá. Dařilo se snímat a přes OCR rozpoznat texty v časopisu A4, trojsloupečné články z novin bez úpravy dpi, jakmile šlo o novinovou půlstranu, nastaly mírné potíže, ale text rozpoznatelný byl. Zde musím dodat, že OCR zřídka funguje absolutně bez chyby, plete si litery "l" a "í" a pod., takže vždycky je nutné po OCR procesu text zkorigovat. Nicméně je nepochybné, že touto metodou lze velmi rychle pořizovat archiv - a doplňovat ho i v terénu, kde nemáme skener k disposici. Skenování je samozřejmě kvalitnější, ale zdlouhavější proces. Instalace OCR programu je ovšem nutným předpokladem, přičemž Fine Reader mi připadá jako optimální a doporučení hodný program. (eff) |
[an error occurred while processing this directive] | |||||||||||