E N D
1. Reconnaissance et synthèse de la parole Quels sont les enjeux ?
Quels sont les usages ?
2. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 2 Une activité humaine
3. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 3 Les acteurs
4. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 4 Des services par la voix Avantage
médium de communication proche de l’homme, interface simple
Inconvénients
le canal acoustique peut être encombré
phénomène complexe
Ingrédients de réussite
expérience...
5. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 5 Des interactions complexes
6. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 6 Dualité acoustique/linguistique
7. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 7 L’alphabet des phonèmes
8. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 8 La parole aspects fonctionnels
9. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 9 La parole hypothèses simplificatrices Deux informations indispensables
matière acoustique = pâte sonore
matière prosodique = musique
Matière acoustique
contenu du message + locuteur
Matière prosodique
composante linguistique forte
mais aussi influence du locuteur
10. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 10 Hypothèse source/filtre
11. Reconnaissance de parole
12. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 12 Reconnaissance de parole Objectif
transcription linguistique (mots, phrases)
et compréhension
d’une parole spontanée
énoncée par n’importe quel locuteur
Compromis
selon les fonctions applicatives visées
13. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 13 Quels compromis ?
14. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 14 Où sont les difficultés ? Segmentales
le phonème est une abstraction…et n’est jamais prononcé par un locuteur
physiologie, état, coarticulation,…
Linguistiques
Nous ne parlons pas comme nous écrivons !
syntaxe relâchée
compréhension ?
15. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 15 Méthodologie
16. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 16 Modèles de Markov Cachés [HMM]
17. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 17 Modélisation linguistique
18. Synthèse de la parole
19. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 19 Introduction Objectif d’une machine parlante
faire prononcer par une machine un message qui pourrait n’avoir jamais été prononcé auparavant par un être humain
Synthèse de la parole à partir du texte
Importance d’un tel concept
les télécommunications : lecture de courriers électroniques, lecture de lignes d’annuaires téléphoniques
les systèmes embarqués (voiture, avion, téléphone
l’aide aux handicapés
20. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 20 Synoptique des traitements Les traitements linguistiques
le pré-traitement du texte
la transcription orthographique/phonétique
l’analyse grammaticale et syntaxique
l’analyse prosodique
Les traitements acoustiques
les méthodes de fabrication du signal de parole
la modification des paramètres prosodiques
21. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 21 Prétraitement du texte En MCMLXXXIX, l ’ORTF a vendu la 2è édit. de 1830 pour 978,45F T.T.C. à M. D*** à 12:15
MCMLXXXIX: nombre romain
l ’: apostrophe
ORTF: acronyme par lettre
2è: nombre arabe ordinal
édit.: abréviation
1830: nombre cardinal
978,45: virgule
F T.T.C: abréviations
M. : abréviation
D***: astérisque
12:15: format heure
22. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 22 Transcription orthographique phonétique Relation non biunivoque entre les deux ensembles
A un graphème peut correspondre plusieurs phonèmes
le graphème [X] est prononcé:
/k/./s/ dans axe
/s/ dans six
/z/ dans dixième
/g/./z/ dans exact
A un phonème peut correspondre plusieurs graphèmes
le phonème /è/ se trouve dans:
peine, fête, monnaie, tramway
23. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 23 Calcul de la prosodie Alphabet prosodique élémentaire
formes mélodiques: montée, descente,…(F1,F2,…)
Indices de coupures: coupures +/- importantes (C1,C2,…)
Calcul d’une séquence d ’étiquettes prosodiques
à partir de l ’arbre syntaxique et des étiquettes grammaticales
1 étiquette par mot ou groupe de mots, groupes intonatifs
Calcul des valeurs de F0 et des durées de phonèmes
fonction des étiquettes prosodiques, groupe intonatif, syllabes, phonèmes…et contextes
24. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 24 Génération à partir du texte Synthèse par mots ou par phonèmes ?
Synthèse par mots préenregistrés
horloge parlante, annonce des quais de gare
Synthèse par phonèmes préenregistrés:
25. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 25 Génération à partir du texte Synthèse par concaténation d’unités acoustiques
« diphone » : segment de parole de la zone stable d’un phonème à la zone stable du phonème suivant.
On stocke les transitions entre phonèmes
Synthèse par règles
on modélise les transitions entre phonèmes,
pouvoir explicatif plus important
26. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 26 Synthèse par juxtaposition d’unités acoustiques
27. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 27 Synthèse par règles
28. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 28 Quel avenir scientifique et technologique ?