220 likes | 336 Views
Juan Castro Mayorgas TFC - Enginyeria Tècnica de Telecomunicacions especialitat Telemàtica Universitat Oberta de Catalunya Segon semestre 2010-2011. RECONEIXEMENT AUTOMATIC D ’INSTRUMENTS MUSICALS. AGENDA. Context Objectius del TFC Propietats del so Característiques acústiques
E N D
Juan Castro Mayorgas TFC - Enginyeria Tècnica de Telecomunicacions especialitat Telemàtica Universitat Oberta de Catalunya Segon semestre 2010-2011 RECONEIXEMENT AUTOMATICD’INSTRUMENTS MUSICALS
AGENDA • Context • Objectius del TFC • Propietats del so • Característiques acústiques • Classificadors • Corpus • Implementació • Resultats experimentals • Resum
OBJECTIUS DEL TFC (I) Aprenentatge Extracció de característiques acústiques Senyal d’àudio Classificació Identificació
OBJECTIUS DEL TFC (II) Selecció de classificadors Configuració Corpus Selecció de característiques Configuració d’escenaris Sistema de reconeixement automàtic Anàlisi de resultats
PROPIETATS DEL SO • Intensitat i volum • Intensitat: quantitat absoluta • Volum: valor subjectiu • Altura: freqüència • Escala Mel • Duració • Timbre: permet diferenciar el mateix so produït per dos instruments diferents
Informació que s’extreu de cada un dels petits fragments en que es talla el senyal d’àudio CARACTERISTIQUES ACUSTIQUES • En el domini freqüencial • Centroide • Extensió • Coeficients MFCC • Roll-Off • En el domini temporal • Taxa de pas per zero • Energia
CLASSIFICADORS • Model de mescles Gaussianes (GMM) • Probabilístic i sense supervisió • K-veí més proper (k-NN) • Basat en distància • Molt senzill d’implementar. Alt cost de computació • Support Vector Machines (SVM) • Basat en distància • Dissenyat per a discernir entre dues classes. • Versions multi-classe.
CORPUS • TunediT • 115.000 mostres (no es disposa de l’àudio original) • 70 – 30 % (entrenament – test) • 18 instruments (2 famílies – 8 subfamílies) • Generació pròpia • 18 instruments (2 famílies – 8 subfamílies) • Entrenament: Gravació de cada una de les notes de l’extensió de l’instrument • Test: Gravacions amb fraseig per cada instrument.
Funcions relacionades amb l’extracció de les característiques acústiques IMPLEMENTACIO (I) • cAudioList = TFCLoadAudioList (filename) • Cfeatures = TFCExtractFeatures (cAudioList, windowSize) • TFCExportFeatures (audioListFile, featuresFile, windowSize)
Funcions relacionades amb la classificació IMPLEMENTACIO (II) • cResults = TFCGMMCheck (cFTraining, vWhat, scale, classType) • CResults = TFCGMMClassify (cFTraining, cFTest, vWhat, scale, classType) vWhat = [x x x x x x x x x x x x x x x x x x] Centroide Extensió RollOff ZeroCrossEnergia MFCC1 … MFCC13
Funcions relacionades amb la classificació IMPLEMENTACIO (III) • cResults = TFCKNNClassify (cFTraining, cFTest, vWhat, scale, classType, k, maxDist) • cResults = TFCKNNClassify2 (cFTraining, cFTest, vWhat, scale, classType, k, maxDist) • cResults = TFCKNNClassify3 (cFTraining, cFTest, vWhat, scale, classType, k, maxDist) • cResults = TFCSVMClassify (cFTraining, cFTest, vWhat, classType)
Funcions relacionades amb l’anàlisi de resultats IMPLEMENTACIO (IV) • cAnalytics = TFCCreateAnalytics (cFTest, cResults, classType) • cReport = TFCReportAnalytics (cAnalytics) • cReport = TFCReportDecision (cAnalytics)
RESUM • Implementació funcions per a: • Extreure característiques acústiques • Classificar e identificar mostres • Analitzar resultats • Experiments que mostren entre altres: • El nombre de mostres afecta de diferent manera als resultats segons el mètode de classificació • La rellevància de les característiques acústiques depèn del mètode de classificació • Hi ha instruments més fàcils d’identifcar amb un mètode que amb un altre • El fraseig harmònic redueix el percentatge d’encerts