220 likes | 559 Views
Yerel Görünüm Tabanlı Yüz Tanıma İçin Değişik Boyut İndirme ve Normalizasyon Yöntemlerinin İncelenmesi. Berkay Top çu ve Hakan Erdo ğ an Sabancı Üniversitesi. Out line. Yerel Görünüm Tabanlı Yüz Tanıma Yüz Tespiti Veritabanı (M2VTS) Değişik Boyut İndirme Teknikleri
E N D
Yerel Görünüm Tabanlı Yüz Tanıma İçin Değişik Boyut İndirme ve Normalizasyon Yöntemlerinin İncelenmesi Berkay Topçuve Hakan Erdoğan Sabancı Üniversitesi
Outline • Yerel Görünüm Tabanlı Yüz Tanıma • Yüz Tespiti • Veritabanı (M2VTS) • Değişik Boyut İndirme Teknikleri • TBA, DAA, aPAC, Normalize TBA, Normalize DAA, NNDA • Normalizasyon Teknikleri • Sınıflandırma Sonuçları
Yerel Görünüm Tabanlı Yüz Tanıma • Öznitelik vektörleri, yüz imgesini eşit parçalara ayıran bloklardan çıkarılarak oluşturulur. 16 x 16 bloklar 8 x 8 bloklar
Genel Sistem • Bloklarda Boyut İndirme: • TBA • DAA • aPAC • NTBA • NDAA • NNDA Blok ve öznitelik normalizasyonları Yüz Tespiti • Sınıflandırma: • nmc • nnc • ldc
Yüz Tespiti– M2VTS • OpenCV – otomatik yüz tespiti • Kullanılan yüz imgelerinin boyutu : 48x64
Veritabanı – M2VTS M2VTS veritabanından örnek imgeler. Her sütunda aynı kişiye ait farklı imgeler bulunuyor.
Veritabanı – M2VTS • Her 37 kişinin 40 adet yüz imgesi • Eğitim için 32 imge ve Test için 8 imge • 48x64 piksel 3072 piksel • 16’lık ve 8’lik bloklar • 16x16 bloklar için: 12 blok x 12 öznitelik 144 öznitelik • 8x8 bloklar için : 48 blok x 3 öznitelik 144 öznitelik
TBA (Temel Bileşenler Analizi) • Temel bileşenler analizi (PCA), veriyi düşük bir boyuta, verideki değişintiyi koruyacak şekilde eşleyen dikgen bir doğrusal dönüşümdür. • Fakat PCA’in sınıf bilgisini kullanmadığını göz önüne alırsak, en fazla değişintinin olduğu bileşenlerin sınıflandırma problemi için doğru öznitelikleri içerdiğini garanti edemeyiz.
DAA (Doğrusal Ayırtaç Analizi) • Doğrusal ayırtaç analizi (LDA), düşük boyutlu uzayda sınıfları en başarılı ayıracak vektorleri bulur. Amaç sınıf-içi saçılımı en büyük yapmaya çalışırken, sınıflar arası saçılımı en düşük seviyeye çekmektir.
aPAC (Yaklaşık İkili Doğruluk Kriteri) • LDA’in en önemli dezavantajı: • Sınıflar arası uzaklığın karesini büyütürken, aykırı sınıfların bu işlemi domine etmesi dolayısıyla hali hazırda ayrık sınıflara daha fazla önem vererek geri kalan sınıfların ayrılmasını zorlaştırır. • K-sınıflı LDA problemi K*(K-1)/2sayıda 2-sınıf LDA problemine ayrıştırlabilir. • İkili sınıflar üzerinde ağırlıklandırma kullanılarak, her sınıfın boyut düşürme optimizasyonuna katkısı normalize edilebilir.
NPCA (Normalize PCA) • PCA düşürülmüş boyutlu uzaydaki veride değişintiyi maksimize ederken aynı zamanda verinin izdüşümünde örnekler arası ikili uzaklıların karelerinin toplamını da maksimize etmektedir. • Bu ikili uzaklıkların karelerini ağırlıklandırarak (ikili benzemezlikler) toplayıp maksimize ederek büyük uzaklıkların etkisi azaltılabilir.
NPCA (Normalize PCA) • Önerilen ağırlıklar:
NLDA (Normalize LDA) • NPCA’in geliştirilmiş bir şekli olan NLDA’de, ikili benzemezliklere ek olarak, ikili benzerlikler de probleme dahil edilmiştir. • Aynı sınıfa ait elemanları yaklaştırmaya çalışırken aynı zamanda farklı sınıflara ait elemanları uzaklaştırmaya çalışmaktayız.
Nearest Neighbor Discriminant Analysis (NNDA) • Sınıflar arası uzaklığı arttırmaya çalışırken, aynı sınıfa ait elemanları izdüşüm uzayında yaklaştırmayı hedeflemektedir. • Her eleman için, aynı sınıftaki en yakın komşu ile uzaklığını ve diğer sınıflardan en yakın komşu ile uzaklığını göz önüne alır.
Sınıflandırma (Eğitim ve Test) • Sınıflandırma için MATLAB – PrTools (Pattern Recognition Toolbox) • Nearest Mean Classifier (nmc) • Nearest Neighbor Classifier (nnc) • Linear Discriminant Classifier (ldc) • 37 kişinin herbirinden 40 yüz imgesi 1480 imge • 32x37 = 1184 imge eğitim için • 8x37 = 296 imge test için
Normalizasyon Öncesi Herhangi bir normalizyon uygulanmadan önceki tanıma oranları :
Normalizasyonlar • Öznitelik Normalizasyonu • Uzunluk bölümü (normalizasyonu) • Standart sapma bölümü (normalizasyonu) • Blok içi Normalizasyon • Blok içi ortalama ve standart sapma normalizasyonu
Öznitelik Normalizasyonları • Uzunluk Bölümü: Farklı parlaklık seviyelerindeki bloklar, farklı değer seviyeleri içeren görsel öznitelik vektorlerine sebep olmaktadır. Uzunluk normalizasyonu olarak adlandırdığımız bu yöntemle yüksek veya düşük parlaklık seviyeli bloklardan gelen özniteliklerin etkilerini dengelemiş oluruz. • Standart Sapma Bölümü: Her özniteliğin katkısını dengelemek için, her özniteliği, eğitim verisi üzerinden öğrendiğimiz standart sapmalarına böleriz.
Öznitelik Normalizasyonu Sonuçları Uzunluk Bölümü Sonuçları Standart Sapma Bölümü Sonuçları Blok boyutu 8 Blok boyutu 16
Blok içi Normalizasyon • İmge üzerindeki her bir blok, insan yüzündeki farklı bölgeleri içerdiğinden, her bloktaki farklı parlaklık seviyesi aynı kişi için bile değişiklik göstermektedir. • Ayrıca ışıklandırma durumuna bağlı olarak, farklı blokların piksel değerleri arasında büyük farklılıklar oluşabilir. • Aynı kişinin farklı imgelerinden çıkarılmış öznitelik vektörleri arasında büyük farklar olması, sınıflandırma performansını düşürmektedir.
Blok içi Normalizasyon Sonuçları Block size 8 Block size 16
Gelecek Çalışmalar • Çakışan Bloklar • Karar Birleştirme • Her blok için bağımsız karar verme • Hareketli Bloklar • En uygun eşleşme için blok merkezlerinin kaydırılması • Diğer veritabanları • CMU yüz ifadesi veritabanı, AR yüz veritabanı