1 / 12

Sylvain Daudé DEA ATIAM

Modèle statistique de la voix à structure optimisée pour la caractérisation des phénomènes dynamiques. Sylvain Daudé DEA ATIAM. Stage réalisé au LIA sous la direction de MM. Bonastre et Linarès. Contexte. Traitement automatique de la parole Modélisation statistique de la parole

nyla
Download Presentation

Sylvain Daudé DEA ATIAM

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Modèle statistique de la voixà structure optimisée pour la caractérisationdes phénomènes dynamiques Sylvain Daudé DEA ATIAM Stage réalisé au LIA sous la direction de MM. Bonastre et Linarès

  2. Contexte • Traitement automatique de la parole • Modélisation statistique de la parole • MMG en R.A.L. • MMC en R.A.P • Dynamique de la parole • durée, séquentialité, synchronie • variations spectrales • importance dans le signal de parole

  3. Problématique • Apprentissage du modèle • MMG : peu d'information dynamique • MMC : de l'information dynamique dans les transitions, mais… • peu prise en compte lors de l'apprentissage • modèles de durée infructueux Objectif : prendre en compte les infos dynamiques dans le modèle

  4. Analyse Données Caractères statistiques + infos dynamiques + d’infosInterprétation ? Correspondance Modèle Méthode : des données au modèle

  5. Construction du modèle ... Diminution du nombre d’états MMG MMC

  6. Vrais. Vrais. t t Etat1 Etat 2 « vraie » distribution Etat 1+2 Info dynamique dans les MMC ? • transitions : séquentialité, durée • regroupement d’états : synchronie : « vraie » distribution d’un caractère acoustique

  7. Stratégies de regroupement • Similarité des entrées-sorties :séquentialité, synchronie des chemins parallèles • Eloignement des entrées-sorties :bifurcations, asynchronie des chemins parallèles • Information mutuelle : synchronie • Transitions mutuelles : linéaire, séquentialité

  8. Nombre d'états du modèle 128 127 117 107 97 87 77 67 57 47 37 27 17 7 1 0,4 0,3 0,2 0,1 0 Ecart p/r au hasard (logV) -0,1 -0,2 -0,3 -0,4 -0,5 Transitions mutuelles Information mutuelle Eloignement de profils Proximité de profils Les résultats

  9. Conclusion • Meilleurs modèles : • séquentialité ou synchronie portées par le modèle • réestimation des transitions • Gain en complexité • Meilleure modélisation de l’information dynamique

  10. Perspectives • Améliorations • Concilier synchronie et séquentialité • Modèles de durée • Estimation de la qualité • Application musicale

  11. p ( a , b ) å ij = × I ( i , j ) p ( a , b ) log ij × p ( a ) p ( b ) ( a , b ) i j Des questions ? (1) E A D Trame 1 Trame 2 Trames 3, 4, 5 Vraisemblance du MMC Meilleur chemin Vraisemblances trame / état Trame 9 Trame 8 Trames 6, 7 Information mutuelle :

  12. Vrais. Vrais. t t Etat 2 Etat 1 « vraie » distribution Etat 1+2 Des questions ? (2)

More Related