250 likes | 477 Views
ÇOK KATMANLI ALGILAYICI VE GERİYE YAYILIM ALGORİTMASI İLE KONUŞMACI AYIRT ETME. Fırat Fehmi Aygün Aybars Moralı Dokuz Eylül Üniversitesi Bilgisayar Mühendisliği Bölümü. Ana Hat. Giriş Konuşmacı Tanıma Nasıl Ayırt Edilebilir Bayes Karar Ağaçları Yapay Sinir Ağları Girdi Sorunları
E N D
ÇOK KATMANLI ALGILAYICI VE GERİYE YAYILIM ALGORİTMASI İLE KONUŞMACI AYIRT ETME Fırat Fehmi Aygün Aybars Moralı Dokuz Eylül Üniversitesi Bilgisayar Mühendisliği Bölümü
Ana Hat • Giriş • Konuşmacı Tanıma • Nasıl Ayırt Edilebilir • Bayes • Karar Ağaçları • Yapay Sinir Ağları • Girdi Sorunları • Öznitelik Çıkarma • MFCC • MLP Yapay Sinir Ağları • Eğitim Kümesi • Değerlendirme Kümesi • Deneyler • Bitim • Teşekkürler Akademik Bilişim '07 Dumlupınar Üniversitesi
Giriş Konuşmacı Tanıma • Konuşmacı Doğrulama • Konuşmacı Ayırt Etme Akademik Bilişim '07 Dumlupınar Üniversitesi
Konuşmacı Tanıma Akademik Bilişim '07 Dumlupınar Üniversitesi
Nasıl Ayırt Edilebilir ? • Arama • Tam Eşleştirme NP-Complete • Yaklaşık Çözüm • Bayes • Yapay Sinir Ağları • Karar Ağaçları Akademik Bilişim '07 Dumlupınar Üniversitesi
Bayes? • + • Başarım oranı yüksek • Eğitim için ek süre yok • Yerel en iyi noktaları yok • - • Yüksek işlem zamanı • İstatistiksel -> Geniş çalışma kümesi Akademik Bilişim '07 Dumlupınar Üniversitesi
Karar Ağaçları? • + • Hızlı Sınıflandırma • Sonuç: Ağaç • - • Yerel En İyi Noktası Sorunu Akademik Bilişim '07 Dumlupınar Üniversitesi
Yapay Sinir Ağları? • + • Hızlı Sınıflandırma • Sonuç: Fonksiyon • Yerel En İyi Noktası Sorunu Yok • - • Uzun Eğitim Süresi • Çok Fazla Değişken Akademik Bilişim '07 Dumlupınar Üniversitesi
Girdi Sorunları Girdi Boyu • Değişken Girdi Verisi • Eğitime Uygun Değil Çözüm : • Öznitelik Çıkarma Akademik Bilişim '07 Dumlupınar Üniversitesi
Aşama 1 – Veri Toplama ve Eğitim Akademik Bilişim '07 Dumlupınar Üniversitesi
Aşama 2 – Ayırt Etme Akademik Bilişim '07 Dumlupınar Üniversitesi
Öznitelik Çıkarma • MFCC • DFT Akademik Bilişim '07 Dumlupınar Üniversitesi
MFCC • Mel-Frequency Cepstrum Katsayıları, algı temelli sesi temsil eden katsayılardır. • Fourier Dönüşümü veya Discrete Cosine Dönüşümü'nden türetilir. FFT/DCT ve MFCC arasındaki temel fark MFCC'de frekans bantları logaritmik olarak (Mel ölçüsünde) yerleşmiştir ve bu da insan ses sisteminin yanıtını bantları doğrusal olarak yerleşen FFT veya DCT'ye göre daha da yaklaştırır. Akademik Bilişim '07 Dumlupınar Üniversitesi
MLP Yapay Sinir Ağları • 4 Katman • 1 Giriş • 1 Çıkış • 2 Gizli • Geriye Yayılım Algorithması • HyperTansig • Rastsal İlkleme Akademik Bilişim '07 Dumlupınar Üniversitesi
Eğitim Kümesi • 4 Konuşmacı • Aybars • Kürşat • Begüm • Fırat Akademik Bilişim '07 Dumlupınar Üniversitesi
Eğitim Kümesi • Konuşmacı başına 10 kelime • Ad • Adil • Sektör • Kızı Öp • Vizör • Kokoş • Porsuk • Öpücük • Kuzen • Yüzyıl Akademik Bilişim '07 Dumlupınar Üniversitesi
Değerlendirme Kümesi • Eğitim Kümesi • Yeni Girdiler Akademik Bilişim '07 Dumlupınar Üniversitesi
Deney 1 • Adım : 1000 • Ayırt Etme Oranı: %32,5 Akademik Bilişim '07 Dumlupınar Üniversitesi
Deney 1 – Hata Grafiği Akademik Bilişim '07 Dumlupınar Üniversitesi
Deney 2 • Adım : 2000 • Ayırt Etme Oranı: %45 Akademik Bilişim '07 Dumlupınar Üniversitesi
Deney 2 – Hata Grafiği Akademik Bilişim '07 Dumlupınar Üniversitesi
Deney 3 • Adım : 5000 • Ayırt Etme Oranı: %57,5 Akademik Bilişim '07 Dumlupınar Üniversitesi
Deney 3 – Hata Grafiği Akademik Bilişim '07 Dumlupınar Üniversitesi
Bitim • Sonuç: • Düşük başarım oranı? • Nasıl geliştirilebilir: • Adım sayısı • Nöron sayıları • Girdi • Daha çok girdi • Daha az gürültü; daha iyi kayıt ortamı • Daha iyi örnek dağılımı • Daha iyi öznitelik çıkarma Akademik Bilişim '07 Dumlupınar Üniversitesi
Teşekkürler • Yöney nicemleme işlemlerindeki ve Malcom Slanley’in MFCC fonksiyonunu düzenlemedeki yardımlarından ötürü Dr. Emine Ekin’e teşekkür ederiz. Akademik Bilişim '07 Dumlupınar Üniversitesi