180 likes | 324 Views
Digitalizacija pos lovnih dokumenata Prepoznavanje ili rekognicija (OCR, ICR, OMR). Digitalna obrada. Ručni unos – zamoran i dugotrajan posao Tehnologije skeniranja i optičkog prepoznavanja podataka (tehnologija digitalizacije pisanih dokumenata) Automatizacija Povećanje efikasnosti.
E N D
Digitalizacija poslovnih dokumenataPrepoznavanje ili rekognicija(OCR, ICR, OMR)
Digitalna obrada • Ručni unos – zamoran i dugotrajan posao • Tehnologije skeniranja i optičkog prepoznavanja podataka (tehnologija digitalizacije pisanih dokumenata) • Automatizacija • Povećanje efikasnosti
Digitalizacija • Unošenje podataka u sustav: • Skeniranje • Prerekognicija – priprema • Rekognicija – prepoznavanje • Postrekognicija – prepravke
Skeniranje i priprema • Prirpema dokumenata • Vađenje iz registratora, kuverti... • Sortiranje, ispravljanje listova • Micanje spajalica • Skeniranje • Kvaliteta slike • Skener • Postavke skenera • Softver za obradu slike
Rekognicija • Postupak pretvaranja slikovnog digitalnog zapisa vizualno čitljivih znakova u kompjuterski čitljive znakove • Razlikujemo: • Optičko prepoznavanje znakova • Inteligentno prepoznavanje znakova • Prepoznavanje markiranih obrazaca
Optičko prepoznavanje znakova • OCR – engl. Optical Character Recognition • Postupak kojim pomoću programa za OCR kompjutorski ispisane znakove u standardnim fontovima pretvaramo u digitalni zapis znakova
Princip usporedbe slike znaka s oblicima ASCII znakova,dijeljenje znakova na kvadrante i traženje podudarnost uzorka • Da bi se povećala točnost prepoznavanja, uvodi se način rada u kojemu se znak prepoznaje na više načina te se između dobivenih rezultata određuje najvjerojatniji
OCR softver • ABBYY • GOCR • MS Office Document Imaging • Ocrad • SimpleOCR • SmartScore ...
Inteligentno prepoznavanje znakova • ICR – engl. Intelligent Character Recognition • Postupak kojim se pomoću uvježbanog (treniranog) programa prepoznaje rukopis ili podaci pisani nestandardnim fontovima
Programi za IRC temelje se na tehnologiji neuralnih mreža • Vrlo spori • Nepogodni za obradu velikih količina podataka • Poboljšavanje točnosti • ograničavanje broja znakova koji se rabe na obrascima • korištenje prostora (kućica) za unos • korištenje priređenih tablica za unos podataka
Prepoznavanje markiranih obrazaca • OMR – engl. Optical Mark Recognition • Najveću primjenu ima u trgovini gdje se na proizvodima nalaze bar-kod zapisi u EAN/UPC linijskom bar kodu • Bar-kod zapisi su linearni jednodimenzionalni kodovi u kojima definirane kombinacije tankih i debelih crta tvore brojeve i slova
Postrekognicija • Nakon provođenja rekognicije, dobiva se rezultat s određenom točnošću • Točnost može biti vrlo visoka, no kod velikih količina podataka dolazi do pogrešaka koje treba ispraviti • Ručno prepravljanje • Da bi se ubrzalo, u OCR-programima se mjesta (mogućih) pogrešaka označavaju u boji različitoj od boje točno prepoznatih podataka
Literatura • V. Srića, A. Kliment, B. Knežević - Uredsko poslovanje, Strategija i koncepti automatizacije ureda, Sinergija, Zagreb, 2003. • http://www.bds.hr/dnn/Default.aspx?tabid=78&language=en-US • http://en.wikipedia.org/wiki/Optical_character_recognition