120 likes | 226 Views
Modèle statistique de la voix à structure optimisée pour la caractérisation des phénomènes dynamiques. Sylvain Daudé DEA ATIAM. Stage réalisé au LIA sous la direction de MM. Bonastre et Linarès. Contexte. Traitement automatique de la parole Modélisation statistique de la parole
E N D
Modèle statistique de la voixà structure optimisée pour la caractérisationdes phénomènes dynamiques Sylvain Daudé DEA ATIAM Stage réalisé au LIA sous la direction de MM. Bonastre et Linarès
Contexte • Traitement automatique de la parole • Modélisation statistique de la parole • MMG en R.A.L. • MMC en R.A.P • Dynamique de la parole • durée, séquentialité, synchronie • variations spectrales • importance dans le signal de parole
Problématique • Apprentissage du modèle • MMG : peu d'information dynamique • MMC : de l'information dynamique dans les transitions, mais… • peu prise en compte lors de l'apprentissage • modèles de durée infructueux Objectif : prendre en compte les infos dynamiques dans le modèle
Analyse Données Caractères statistiques + infos dynamiques + d’infosInterprétation ? Correspondance Modèle Méthode : des données au modèle
Construction du modèle ... Diminution du nombre d’états MMG MMC
Vrais. Vrais. t t Etat1 Etat 2 « vraie » distribution Etat 1+2 Info dynamique dans les MMC ? • transitions : séquentialité, durée • regroupement d’états : synchronie : « vraie » distribution d’un caractère acoustique
Stratégies de regroupement • Similarité des entrées-sorties :séquentialité, synchronie des chemins parallèles • Eloignement des entrées-sorties :bifurcations, asynchronie des chemins parallèles • Information mutuelle : synchronie • Transitions mutuelles : linéaire, séquentialité
Nombre d'états du modèle 128 127 117 107 97 87 77 67 57 47 37 27 17 7 1 0,4 0,3 0,2 0,1 0 Ecart p/r au hasard (logV) -0,1 -0,2 -0,3 -0,4 -0,5 Transitions mutuelles Information mutuelle Eloignement de profils Proximité de profils Les résultats
Conclusion • Meilleurs modèles : • séquentialité ou synchronie portées par le modèle • réestimation des transitions • Gain en complexité • Meilleure modélisation de l’information dynamique
Perspectives • Améliorations • Concilier synchronie et séquentialité • Modèles de durée • Estimation de la qualité • Application musicale
p ( a , b ) å ij = × I ( i , j ) p ( a , b ) log ij × p ( a ) p ( b ) ( a , b ) i j Des questions ? (1) E A D Trame 1 Trame 2 Trames 3, 4, 5 Vraisemblance du MMC Meilleur chemin Vraisemblances trame / état Trame 9 Trame 8 Trames 6, 7 Information mutuelle :
Vrais. Vrais. t t Etat 2 Etat 1 « vraie » distribution Etat 1+2 Des questions ? (2)