150 likes | 446 Views
OCR. (Optical Character Recognition). Vypracovali: P. Vymetálek, J. Viktora Kartografická polygrafie a reprografie akademického roku 2007/2008. Co nás čeká. úvod historie metody ocr jak funguje. Úvod. OCR - Optical Character Recognition = optické rozpoznávání znaků
E N D
OCR (Optical Character Recognition) Vypracovali: P. Vymetálek, J. Viktora Kartografická polygrafie a reprografie akademického roku 2007/2008
Co nás čeká • úvod • historie • metody ocr • jak funguje
Úvod OCR - Optical Character Recognition = optické rozpoznávání znaků • umožňuje digitalizaci tištěných textů • úspěšnost převodu je závislá na kvalitě předlohy • je použitelné pro všechny tištěné výstupy z laserových, inkoustových, termosublimačních, jehličkových tiskáren a předlohy vytištěné knihtiskem
Historie • 1950 – začátek vývoje ocr • 1954 – první OCR systém – Reader‘s Digest První generace OCR: • 1960 – 1965 • charakterizuje se využitím pro jednoduché zpracování znaků • znaky byly speciálně vyvinuty pro tyto systémy
Historie • znaky vypadali značně uměle • postupně systémy s více fonty • systém porovnával znaky s knihovnou znaků E13B
Historie Druhá generace OCR: • pol. 60. let až 70. léta • rozpoznání běžně psaných strojových textů • „rozpoznání“ ručně psaných znaků • první systémy – IBM1287, Toshiba (poštovní třídič), Hitashi • americký standard character set OCR-A • evropský standard character set OCR-B
Historie OCR – A OCR - B
Historie Třetí generace OCR: • od poloviny 70. let • rozpoznávají dokumenty nižší kvality OCR dneška: • masové nasazení a velké rozšíření různých systémů po cele Zemi • jmenujme: Fine Reader, …
Metody OCR • principem modelu rozpoznávání je naučit systém základním případům • základní typy: speciální symboly, otazník, čárka,… • učení systému na demo datech • systém si vyrobí prototypy • při rozpoznávání se porovnávají znaky s prototypy
Jak funguje • nejprve skenování podkladů
Jak funguje • předzpracování, binární obraz • lokalizace řádků, znaků
Jak funguje • extrahování rysů – získání základních charakteristik každého znaku
Jak funguje • klasifikace znaků – rozpoznávání • porovnávání vzniklých slov se slovníkem • kontrola pravopisu -extrahování rysů-
Zdroje • http://cs.wikipedia.org/wiki-OCR [online] • http://www.quido.cz/Objevy/ocr.htm [online] • http://medard.soc.cas.cz/digidat/obraz_OCR.htm [online] • http://www.digineff.cz/jaknato/ocr/ocr.html [online] • V.Suchý, Rozpoznávání textu v obraze, Brno 2007