1 / 12

Reconnaissance de la parole

Reconnaissance de la parole. SCIA 2008. Julien Assémat David Landais. Plan. Introduction Rappel du projet Objectifs du projet Un point sur l’état de l’Art Méthode explicite Méthode implicite Performances Approche du projet Techniques et méthodes retenues Applications.

lyn
Download Presentation

Reconnaissance de la parole

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Reconnaissance de la parole SCIA 2008 Julien Assémat David Landais

  2. Plan • Introduction • Rappel du projet • Objectifs du projet • Un point sur l’état de l’Art • Méthode explicite • Méthode implicite • Performances • Approche du projet • Techniques et méthodes retenues • Applications

  3. Introduction • Rappel du projet • Système de reconnaissance vocale • Parole continue • Vocabulaire de grande taille • Objectifs du projet • Capacité de reconnaissance d’un signal de parole continue • Applicable à tout type de messages sonores (discours, …) • Taux de reconnaissance correct • Utilisation pour une application concrète

  4. Un point sur l’état de l’Art • Deux méthodes de conception selon les techniques utilisées • Méthode explicite • Méthode basée sur l’utilisation de connaissances explicites • Méthode implicite • Méthode basée sur une approche statistique

  5. Un point sur l’état de l’Art Méthode explicite • Première approche en reconnaissance de la parole dès 1970 • Basée sur l’utilisation de connaissances explicites • Comparaison à des formes de références (spectres, …) • Techniques • Systèmes multi-agents • Blackboard (Hearsay II) • Systèmes experts (1980) • Méthode peu performant

  6. Un point sur l’état de l’Art Méthode implicite • Approche statistique • Niveau phonétique (modèle acoustique) • Niveau linguistique (modèle de langue) • Nécessite un apprentissage • Techniques • Hidden Markov Models (HMM) • Algorithme N-gram • Réseaux de neurones

  7. Un point sur l’état de l’Art Modèle acoustique • Extraction de caractéristiques d’un signal • Travail sur les phonèmes propres à la langue • Utilisation du vecteur de caractéristiques extrait • Probabilité qu’une portion du signal appartienne à chacun des phonèmes de la langue (HMM) • Hidden Markov Models • Calculer la probabilité d'une séquence particulière

  8. Un point sur l’état de l’Art Modèle de langue • Travail sur la syntaxe et la sémantique propres à la langue • Probabilité qu’une suite de mots existe dans la langue • Introduction de la notion d’approximation avec N-gram • Algorithme N-gram • Agrégation en séquences de 2 ou 3 mots avec une probabilité associée • Approximation de probabilités de séquences plus longues • Calcul des probabilités sur ces séquences plutôt que sur des mots

  9. Un point sur l’état de l’Art Méthode implicite : résumé

  10. Un point sur l’état de l’Art Performances • Quelques chiffres en moyenne pour les systèmes actuels dans les mêmes conditions environnementales : • 0,3 % d’erreur pour l’énumération d’une suite de chiffres • 5 % d’erreurs pour un vocabulaire de 20 000 mots en parole continue • 8 % d’erreurs pour une énumération de lettres • 40 % d’erreurs pour une conversation téléphonique spontanée • En général, forte dépendance de certains paramètres • Taille du vocabulaire • Régionalisation (paramètre inter-locuteur) • Etat émotionnel (paramètre intra-locuteur)

  11. Approche du projet • Méthodes et techniques retenues • Utilisation de la méthode implicite • Meilleurs résultats • Utilisation des deux modèles (phonétique et linguistique) • Réseaux de neurones pour la reconnaissance des phonèmes • Applications • Indexation de messages sonores • Emissions radiophoniques • Discours • Conversation • …

  12. ?

More Related