1 / 32

Reconnaissance de la parole

Reconnaissance de la parole. Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage ivan@ieee.org. Objectifs. Transformer un signal de parole en : Texte (dictée vocale, transcription) Action (commande vocale, systèmes de dialogue) Information indexée (annotation, indexation).

Download Presentation

Reconnaissance de la parole

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Reconnaissance de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage ivan@ieee.org LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

  2. Objectifs Transformer un signal de parole en : • Texte (dictée vocale, transcription) • Action (commande vocale, systèmes de dialogue) • Information indexée (annotation, indexation) LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

  3. Les sources de variabilité • Les facteurs intra-locuteurs :co-articulation, variation dans la prononciation, etc. • Les facteurs inter-locuteurs :physiologie, age, sexe, psychologie, familiarité avec l’application, etc. • L’environnement :bruit, micro, canal de transmission, présence d’autres locuteurs, etc. LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

  4. Variabilité intra- et inter-locuteur LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

  5. Variabilité intra-locuteur LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

  6. Typologie des systèmes • Type de parole • Taille du vocabulaire • Niveau de dépendance par rapport aux locuteurs • Environnement d’utilisation • Profil des utilisateurs potentiels LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

  7. Type de parole • Mots isolés • Mots connectés • Détection de mots clés • Parole contrainte • Parole continue • Parole spontanée LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

  8. Taille du vocabulaire • Quelques mots (5 – 50) • Petit vocabulaire (50 – 500) • Vocabulaire moyen (500 – 5000) • Grand vocabulaire (5000 – 50000) • Très grand vocabulaire (> 50000) LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

  9. Dépendance au locuteur • Dépendant du locuteur :le système fonctionne correctement avec un utilisateur particulier Adaptation au locuteur =utilise quelques données spécifiquesd’un locuteur pour adapter le systèmeà une nouvelle voix • Indépendant du locuteur :le système fonctionne avec n’importe quel utilisateur LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

  10. Environnement d’utilisation • Parole large-bande(ordinateur, etc.) • Parole bande-étroite avec distorsion (téléphone, etc.) • Environnement calme (bureau + micro-casque) • Bruit de fond LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

  11. Profil des utilisateurs potentiels • Utilisation professionnelle par des spécialistes • Grand public • Entraîné / naïf • Fréquent / occasionnel • Utilité • Coopération LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

  12. Deux exemples Dictée vocale • Parole continue • Grand vocabulaire • Adaptation au locuteur • Bureau+micro-casque • Utilisateurs d’ordinateurs Service téléphonique • Détection de mots clés • Quelques mots • Indépendant du locuteur • Parole téléphonique • Grand public LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

  13. Système de reconnaissance de mots LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

  14. Mot 1 Mot inconnu Y Mot 2 Mot X Mot n meilleur chemin Programmation dynamique (DTW) LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

  15. Contraintes locales LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

  16. Contraintes locales : exemple LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

  17. Modèle de Markov caché : principe LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

  18. Mot inconnu Y Mot 1 Mot 2 Mot X Mot n meilleur chemin Modèles de Markov cachés (HMM) LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

  19. Viterbi : exemple LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

  20. Algorithme de Viterbi : exercice LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

  21. Le modèle hiérarchique LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

  22. Le modèle hiérarchique : exemple LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

  23. Modèles phonétiques (1) LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

  24. Modèles phonétiques (2) Le mot « américain » LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

  25. Modèles contextuels LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

  26. Modèles de langage • A un instant donné, tous les mots n’ont pas la même probabilité de présence : • Le petit chat boit du … • Grammaires probabilistes : toutes les phrases sont possibles mais avec des probabilités différentes • Grammaires à états finis : partition binaire des séquences de mots en « séquences possibles » et « séquences impossibles » LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

  27. Modèle acoustique + Modèle de langage LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

  28. Les n meilleures phrases LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

  29. Treillis de mots / Graphe de mots LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

  30. Graphe de mots (2) LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

  31. Performances LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

  32. Recherche actuelle LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

More Related