230 likes | 542 Views
Traitement des sons de parole (5). Catégorisation et Accès au lexique. La parole forme un flux sonore continu qu’il est nécessaire de segmenter en phonèmes, en syllabes, en mots. Segmentation du flux acoustique. Catégorisation des sons de parole.
E N D
Traitement des sons de parole(5) Catégorisation et Accès au lexique
La parole forme un flux sonore continu qu’il est nécessaire de segmenter en phonèmes, en syllabes, en mots Segmentation du flux acoustique
Catégorisation des sons de parole • La langue française comporte environ 37 phonèmes (15 voyelles, 19 consonnes et 3 semi-consonnes). La réalisation acoustique de ces phonèmes est très variable d’où la nécessité pour le système auditif de catégoriser, c’est-à-dire de ramener une grande variation de productions vocales à un nombre de classes restreint. • On appelle phones ou allophones les réalisations acoustiques des sons de parole (phonétique). Les paramètres acoustiques et phonétiques des sons de paroles sont continus. • On appelle phonèmes les catégories distinctives d’une langue (phonologie). Dans le domaine de la phonologie, les sons de paroles constituent des catégories discrètes. • Catégoriser c’est donc introduire une discontinuité perceptive dans un continuum physique.
Développement de la perception des sons de parole Eimas et al. (1971) paradigme d’habituation. Comme celle de l’adulte, la perception des bébés est catégorielle. A 6 mois, les bébés catégorisent correctement un contraste phonétique anglais ou hindi. A 11-13 mois (ou adulte) ils catégorisent correctement le contraste de leur langue. anglais hindi
Parole et apprentissage • L'apprentissage du langage par les nourrissons est grandement facilité par leurs remarquables capacités perceptives : par exemple, ils sont capables de distinguer dès la naissance un grand nombre de contrastes phonétiques (comme /ba/ et /pa/), et sont également capables de distinguer.différentes langues, si elles ont des structures rythmiques différentes. • Des singes (tamarins) manifestent les mêmes performances discriminatives des sons de parole Language discrimination by human newborns and by cotton-top tamarin monkeys, Franck Ramus, Marc D.Hauser, Cory Miller, Dylan Morris, Jacques Mehler, Science, 2000, 288(5464), 349-351. • Cependant, il n’est pas attesté que les discrimination des deux espèces se font sur les mêmes indices acoustiques. • Le traitement des sons de parole se spécifie par la familiarisation avec la langue maternelle qui affecte déjà le babillage (de Boysson-Bardies B. (1996) Comment la parole vient aux enfants. Paris, Ed. Odile Jacob.
Le Temps d’Attaque vocalVoice Onset Time = VOT Lorsque on prononce des syllabes (CV) contrastant un son voisé et un son non voisé comme /ba/ vs. /pa/ on peut, avec des sons synthétiques faire varier de manière continue le délai de voisement de la voyelle. "En pil" "En bil" Le VOT est l’intervalle temporel séparant le relâchement de l’air lors de la prononciation de la consonne et le début du voisement de la voyelle http://www.ac.wwu.edu/~mseilo/c573/unit7/VOT.PDF http://www1.ldc.lu.se/logopedi/department/andy/Perturbations/VOT.html ba pa da ta ga ka
Le VOT peut être négatif, nul ou positif. • Il est nul quand le début de la vibration des cordes vocales est synchrone avec l’explosion consonantique • Il est positif quand la vibration commence après le relâchement des articulateurs • Il est négatif quand la vibration commence avant le relâchement des articulateurs Anglais Français /pa/ /ba/
consonne http://www.bsos.umd.edu/hesp/newman/Newman_classes/Newman300/webpages/categperc.htm
/é/ /è/ Catégorisation dans la langue seconde Comparaison de la catégorisation d’un contraste phonétique existant en catalan et pas en espagnol Ces données indiquent que l'exposition même précoce à une seconde langue n'est pas suffisante pour en maîtriser parfaitement le système phonologique. Elles révèlent que les représentations phonologiques, une fois mises en place, sont peu plastiques même à un très jeune âge. Pallier, C., Bosch, L., & Sebastian-Gallés, N. (1997) A limit on behavioral plasticity in speech perception. Cognition, 64(3), B9-B17.
La syllabe • Les mots ne sont une somme de phonèmes, ils ont, au moins dans certaines langues comme le français, une structure syllabique. • Tâche de détection d’un phonème avec mesure des temps de réaction. Le mot contient-il (oui ou non) le phonème /p/ ? capture caprice Le TR sera plus court dans le cas de capture que dans le cas de caprice car dans le premier cas le phonème cible appartient à la première syllabe et dans le second à la seconde syllabe
Le lexique mental • Définition : c’est l’ensemble des mots d’une langue possédé par un individu • Plusieurs questions : Format : phonologique, orthographique ? Structure : alphabétique, fréquentielle, multidimensionnel ? Accès : différentes théories Paradigme expérimental : la décision lexicale présentation écrite pour un bon contrôle de la durée de présentation. Elle suppose transcodage graphème-phonème
Décision lexicale Des chaînes de caractères sont présentées brièvement sur l’écran. Le sujet doit décider le plus rapidement possible s’il s’agit de mots de sa langue ou de non-mots. Le pourcentage de réponses correctes et le temps de réaction sont mesurés. Les mots sont sélectionnés de manière à tester une hypothèse spécifique, par exemple l’effet de la fréquence de ces mots dans la langue. Les non-mots sont fabriqués selon des règles précises : - tirage au hasard des lettres - respect de la fréquence des digrammes - prononciabilité - etc. chat ctoh chet http://grove.ufl.edu/~tomomi/Intro/Lecture27/sld005.htm
Temps de Réaction (ms) mot non-mot Rôle des non-mots • Lettres au hasard : TRmot > TRnon-mot baton - tbonw Non-mot prononçables : TRmot < TRnon-mot baton - badon Pour des présentations auditives, les non-mots sont nécessairement prononçables ! babel.ling.nwu.edu/~lidz/teaching/ cogsci210/processing.ppt
Effet de la fréquence des mots Temps de Réaction (ms) Temps de Réaction « mots » Catégories de fréquences des mots babel.ling.nwu.edu/~lidz/teaching/ cogsci210/processing.ppt
Modèles d’accès au lexique • Modèle LAFS de Klatt (1988) lexical access from spectra • Modèle de cohorte Marslen-Wilson • Modèle de Trace de McClelland et Elman
LAFS Klatt • Le lexique mental serait constitué des traces des spectres de fréquence des mots prononcés • La procédure de reconnaissance consisterait en un appariement du spectre actuel du mot entendu avec la trace mnésique du spectre • Il y aurait accès direct au lexique sans segmentation ni catégorisation « four scores and seven years ago »
Modèle de CohorteMarslen-Wilson Lexique Mental L'information acoustique et phonétique arrive séquentiellement. Un mot isolé ne peut être identifié qu'à partir du moment où il est seul compatible avec l'information déjà disponible. Les premières syllabes activent la cohorte des mots candidats les comprenant. Plus il y a de syllabes prononcées, plus la cohorte se rétrécit. Le mot peut être reconnu avant qu’il ait fini d’être prononcé. Le point d’identification est la fin de la syllabe qui ne laisse plus qu’un seul candidat. Exemple : le mot « vocabulaire » table chaise chien moineau éléphant vocable vote vocal vocalise volage vocation volant vocabulaire table chaise chien moineau éléphant vocable vote vocal vocalise volage vocation volant vocabulaire table chaise chien moineau éléphant vocable vote vocal vocalise volage vocation volant vocabulaire table chaise chien moineau éléphant vocable vote vocal vocalise volage vocation volant vocabulaire « vo- « vo-ca « vo-ca-bu « vo-ca-bu-laire Point d’identification
Etape 1: activation des traits graphiques ou acoustiques contenus dans le stimulus et inhibition des autres Etape 2 : activation des lettres ou des phonèmes contenus dans le mot et inhibition des autres Etape 3 : activation des mots contenant les mêmes lettres ou les mêmes phonèmes et inhibition des autres Modèle TraceMcClelland et Elman (1986) C’est un modèle de type connexionniste qui distingue trois grandes étapes de traitement : les traits (graphiques ou acoustiques), les lettres ou les phonèmes et enfin les mots. Il s’agit d’un modèle interactif, à la fois ascendant et descendant. Exemple avec mot : « MOVE »
Conclusions La perception des sons de parole est un exemple des mécanismes de traitement de l’information. Ceci implique une série d’étapes de traitements: - traitements acoustiques - traitements phonétiques (surtout articulatoires ) - traitements phonémiques - accès au lexique A chaque étape, divers traitements peuvent s’effectuer en parallèle