1 / 15

Présenter par : Mounir GRARI

RAPPORT DE PROJET SOUS HTK Reconnaissance de mots isolés Et Reconnaissance de mots connectés. Présenter par : Mounir GRARI. Reconnaissance de mots isolés Et Reconnaissance de mots connectés. Plan. Introduction Construction de la base de données Construction de modèle de langage

tess
Download Presentation

Présenter par : Mounir GRARI

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. RAPPORT DE PROJET SOUS HTK Reconnaissance de mots isolés Et Reconnaissance de mots connectés Présenter par : Mounir GRARI

  2. Reconnaissance de mots isolés Et Reconnaissance de mots connectés Plan • Introduction • Construction de la base de données • Construction de modèle de langage • Acquisition des fichiers sons • Étiquetage des fichiers sons • Représentation acoustique du signal • Description des modèles • Modèles de Markov • Fichiers gabarits • Apprentissage • Apprentissage avec l’algorithme Vitervi (HInit) • Apprentissage avec l’algorithme de Baum Welch (HRest) • Ré estimation avec l’algorithme de Baum Welch de tous les models a la fois (HERest) • Reconnaissance • HVite et Hresults • Etude d’autres possibilités; vocabulaire restreint, vocabulaire plus complexe, analyse par mots et analyse par phonème • Etude du cas multi locuteur • Synthèse des résultats trouvés • Conclusion

  3. Reconnaissance de mots isolés Et Reconnaissance de mots connectés Introduction : • Le but est de construire un système de reconnaissance de mots isolés et ensuite de phrase qui suive une certaine syntaxe de plusieurs mots et de le valider sous l'environnement HTK (Hidden Markov Model Toolkit)

  4. Reconnaissance de mots isolés Et Reconnaissance de mots connectés عشرون نادي على Pause محمد أمين Pause كلم Pause و Pause Pause إهتف لي Pause صفر واحد إثنان عشرة تسعون Pause ركب Début Fin modèle de langage

  5. Reconnaissance de mots isolés Et Reconnaissance de mots connectés Acquisition des fichiers sons :

  6. Reconnaissance de mots isolés Et Reconnaissance de mots connectés Étiquetage des fichiers sons : • La santaxe de la Commande HSlab: • HSlab –F WAVE –L labels/ihtif.lab Signal/ihtif.wav

  7. Reconnaissance de mots isolés Et Reconnaissance de mots connectés Enregistrement et étiquetage des fichiers sons HSlab Les étiquettes (.lab) Les fichiers sons (.wav) Étiquetage des fichiers sons : • Le résultat de cette phase est une base de données des étiquettes des différents fichiers sons. (Les étiquettes sont dans le dossier labels)

  8. Reconnaissance de mots isolés Et Reconnaissance de mots connectés Fichier de configuration parametrisation.conf Les Fichiers MFCC ihtif.mfcc kallime.mfcc mohammed.mfcc etc Les fichiers sons (.wav) (hcopyliste.conf) Ihtif.wav Kallime.wav Amine.wav Hcopy Représentation acoustique du signal Représentation acoustique du signal : hcopyliste.conf signal/ihtif.wav mfcc/ihtif.mfcc signal/kallime.wav mfcc/kallime.mfcc signal/ala.wav mfcc/ala.mfcc signal/mohamed.wav mfcc/mohamed.mfcc . . . . parametrisation.conf SOURCEFORMAT=WAVE TARGETKIND=MFCC_E_D WINDOWSSIZE=250000.0 TARGETRATE=10000.0 NUMCEPS=8 # nb de coeff MFCC USEHAMMING=T PREEMCOEF=0.97 NUMCHANS=26 CEPLIFTER=22

  9. Reconnaissance de mots isolés Et Reconnaissance de mots connectés Représentation acoustique du signal : • Le nombre de coefficients MFCC utilisé est 8 + l’energie + les dérivés (donc 18) • Le résultat de cette phase est un ensemble de fichiers .mfcc dans le dossier mfcc contenant les coefficients.

  10. Reconnaissance de mots isolés Et Reconnaissance de mots connectés sil ih tif sil Description des modèles : • Pour chaque entité lexicale, on définira le modèle associé. Pour cela, on donnera la topologie de chaque modèle, le nombre d'états et les probabilités de transition entre les états. • Exemple du model en phonétique représentant le mot du vocabulaire ihtif

  11. Reconnaissance de mots isolés Et Reconnaissance de mots connectés Description des modèles : • Fichiers gabarits : A chaque entité lexical (mot du vocabulaire) on va crée un fichier Gabarit (model) représentant l’entité lexical dans la pratique. <BeginHMM> <NumStates> 4 <VecSize> 18 <MFCC_D_E> <State> 2 <Mean> 18 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 <Variance> 18 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 <State> 3 <Mean> 18 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 <Variance> 18 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 <TransP> 4 0.0 1.0 0.0 0.0 0.0 0.6 0.4 0.0 0.0 0.0 0.6 0.4 0.0 0.0 0.0 0.0 <EndHMM> Exemple : fichier gabarits/ihtif

  12. Reconnaissance de mots isolés Et Reconnaissance de mots connectés Introduction :

  13. Reconnaissance de mots isolés Et Reconnaissance de mots connectés Introduction :

  14. Reconnaissance de mots isolés Et Reconnaissance de mots connectés Introduction :

  15. Merci 

More Related