160 likes | 330 Views
Detekcija lica Gaborovim filtrom. Sveučilište u Zagrebu - FER Napredne metode digitalne obradbe signala Tomislav Androš Ivica Dvoršćak Saša Kovačec 25.siječnja, 2008. Motivacija. Gaborov filtar je najbolja aproksimacija prostornog receptivnog polja stanice u vizualnom dijelu moždane kore
E N D
Detekcija lica Gaborovim filtrom Sveučilište u Zagrebu - FER Napredne metode digitalne obradbe signala Tomislav Androš Ivica Dvoršćak Saša Kovačec 25.siječnja, 2008
Motivacija • Gaborov filtar je najbolja aproksimacija prostornog receptivnog polja stanice u vizualnom dijelu moždane kore • dobro oponaša vizualni sustav nekih sisavaca • jednostavan je za implementaciju • koristi se za mnogobrojne probleme kao što su segmentacija tekstura, analiza dokumenata, detekcija rubova, kodiranje slike...
Gaborov filtar • kompleksna sinusoida karakteristične frekvencije i orijentacije modulirana Gaussovom ovojnicom • H(x,y) = s(x,y)*g(x,y) s(x,y) = g(x,y) =
Gaborov filtar • frekvencijski odziv filtra: • filtar možemo zamisliti kao Gaussovu funkciju posmaknutu u frekvenciji na poziciju od ishodišta i na orijentaciji • filtar sa orijentacijom Θ ima snažan odziv na regiji koja ima varijaciju na istoj orijentaciji
Gaborov filtar • Prolaskom slike kroz Gaborov filtar definiran s dobivamo sve komponente slike koje imaju energiju koncentriranu na
Baza ulaznih uzoraka • koriste se lica i ne-lica, a zbog većeg broja uzoraka novi uzorci se dobivaju zrcaljenjem i posmicanjem originalne slike • slike su veličine 27*18, a iz njih se dobiva vektor dimenzije 2160 koji je dobiven konvolucijom Gaborovog filtra i slike • dimenzija značajki dobivenih konvolucijom je 3x veća od navedene, ali je smanjena zbog povećanja brzine učenja
Učenje • učenje se izvodi neuronskom mrežom • neuronska mreža je dvoslojna – ima 2160 ulaza, 100 skrivenih neurona te jedan izlazni neuron; sve transfer funkcije neurona su tansig • mreža se uči backpropagation algoritmom koji koristi konjugirano gradijentni algoritam učenja - brži od metode najbržeg spusta • parametri zaustavljanja su 400 iteracija ili MSE manja od
Testiranje – 1. faza • testiranje se izvodi na slikama proizvoljne veličine • na početku testiranja se ulazna slika konvoluira sa predlošcima koji su lica • na slici dobivamo korelacijske regije koje su nam potencijalna lica • one nam pomažu da smanjimo broj potencijalnih uzoraka i ubrzamo izračun
Testiranje – 2. faza • stvaraju se vektori uzoraka iz korelacijskih regija i stavljaju se na mrežu • definiran je prag za odziv koji mreža mora dostići da bi regija bila klasificirana kao lice • stvara se mali krug oko centralnog piksela za čiji smo pravokutnik utvrdili da je lice • krug nam služi za treću fazu koja morfološki određuje regiju lica
Testiranje – 3. faza • gleda se matrica odziva mreže te se filtrira s pragom da se dobije binarna slika • radi se dilatacija slike koristeći strukturni element krug – lice je kružnog oblika • nakon toga se radi connected-component labeling – identificiraju se pojedini objekti • traže se centroidi pojedinih objekata • oko centroida se izrađuje zeleni pravokutnik(lice) koji se “zalijepi” na sliku
Problemi • algoritam realiziran u Matlabu je spor • povećanjem brzine opada detection rate • empirijski se određuje prag koji minimizira false detection rate • za veću brzinu treba smanjiti vrijednost praga • korištena je mala baza lica, za veću bazu je bolji detection rate
Problemi • problem je sekvencijalna obrada regija testirane slike • kritičan je odabir načina na koji se dolazi do regija koja su potencijalna lica