220 likes | 392 Views
PROGRAMSKI SUSTAV ZA RASPOZNAVANJE TISKANOG TEKSTA. Autor: Mladen Jurković Mentor: Prof.dr.sc. Zoran Kalafatić Broj rada: 858 Datum: 10.7.2009. Sadržaj. Uvod Metoda izrade sustava Modeli sustava Prikaz faza Prikaz rada programa Zaključak. Uvod. Optičko raspoznavanje znakova
E N D
PROGRAMSKI SUSTAV ZA RASPOZNAVANJE TISKANOG TEKSTA Autor: Mladen Jurković Mentor: Prof.dr.sc. Zoran Kalafatić Broj rada: 858 Datum: 10.7.2009.
Sadržaj • Uvod • Metoda izrade sustava • Modeli sustava • Prikaz faza • Prikaz rada programa • Zaključak
Uvod • Optičko raspoznavanje znakova • Računalni vid • Raspoznavanje uzoraka
Metoda izrade sustava • Učenje s učiteljem • Dvije faze: • Faza učenja • Faza odlučivanja
Slike za učenje • JPG format • Svako slovo prikazano s 19 fontova
Izlučivanje značajki • Vektor značajki je 5-dimenzionalan • Prva značajka: broj rupa u slovu • Ostale: Hu-ovi invarijantni momenti
Sličnost uzoraka • Udaljenost između vektora gdje je i-ti član vektora značajki uzorka A • Ukupna sličnost: umnožak sličnosti svake od polovica slika i cijele slike
Klasifikacija nepoznatih uzoraka • 1-NN metoda • Klasifikacija pomoću jednog prototipa • Konačna odluka: kombinacija ovih metoda
Problemi kod prepoznavanja • Sljepljivanje slova • Nezatvorenost kontura • Razlomljena slova
Prepoznati tekst THE QUICK BROMN DOG JUMPS OVER THE AZY FON THE QUECK BMOWN DOG JUMFS OVES THE LAY FOX THE QUICK BROKN DOC JUMPS OVER THE LAY FOZ TNE QUICK BROWN DOG JUMPS OVER TNE LAZY FOX TME QUICK BRONS SOG JUMPS OVER TME AY FOX TGE QUICE BROSM DOG JXMPS OVER TME LAZY FON TNE QUICK BROMN DOG JUMPS OVER TNE AZV FOX
Testiranje i uspješnost • Testirano na 7 nepoznatih fontova • Pogrešna klasifikacija: 5,66 % • Baza slika za učenje: 26 x 19 slova • Baza slika za testiranje: 7 x 400 slova
Programska potpora • Programski jezik: c++ • Korištenje funkcija knjižnice OpenCV • Visual Studio 2008
Zaključak • Uspješnost ostvarenog programskog sustava > 94% • Moguća poboljšanja: korištenje rječnika
Hvala na pažnji Pitanja?