| Výuka > Práce se skenerem > Optické rozpoznávání znaků (OCR) |

Optické rozpoznávání znaků (OCR)

Pro OCR je zapotřebí mít zejména kvalitní předlohu. Pokud lze text z předlohy pohodlně přečíst okem, s největší pravděpodobností si s ním OCR program poradí a rozpoznání bude bez větších chyb. Pokud máte ale k dispozici text, který je hůře čitelný, různě barevný, s různými typy písma, s dopisovanými poznámkami, nebo na nekvalitním papíře (zažloutlý, s hrubým zrnem či s rastrem nebo linkami), bude to pro OCR program dosti tvrdý oříšek, někdy až nerozlousknutelný. V takovém případě bude rozpoznávání trvat mnohem déle a budete nejprve muset naskenovanou předlohu alespoň částečně vyčistit v nějakém grafickém programu.

Většina OCR programů nabízí jednoduchý postup při rozpoznávání. Po vložení předlohy do skeneru a spuštění OCR programu si příslušnou volbou provede naskenování předlohy, poté provede určení tzv. zón a stanovení jejich typu a nabídne automaticky rozpoznaný text. Často je ale potřeba stanovit ručně pozici a typ zón, neboť program si je může určit podle svých pravidel, která ovšem někdy nemusí odpovídat skutečnosti. Zóny oceníte zejména při skenování z novin či časopisů, kde je text umístěn do sloupců vedle sebe, nebo pokud budete chtít ze skenovaného textu některé části vypustit.

OCR program by měl být schopen otevřít i sken, který jste si uložili (např. do formátu TIFF), upravili a až po těchto krocích jej chcete nechat rozpoznat.

Po rozpoznání znaků OCR program složí výsledné slovo a může jej porovnat se slovníkem, zda se mu podařilo rozpoznání uskutečnit. Nespoléhejte ovšem na jeho kvality a vždy si ještě text sami překontrolujte, neboť může dojít i k chybám, které nejsou na první pohled odhalitelné.

31.08.2007, 12:34 vytvořil Administrator