1 / 17

étude acoustique et perceptive Vasilescu I., Candea M. & Adda-Decker M.

étude acoustique et perceptive Vasilescu I., Candea M. & Adda-Decker M. Hésitations autonomes en 8 langues :. Colloque MIDL 29-30 nov. 2004 MIDL - projet STIC-SHS du CNRS Programme Société de l’Information 2001-2004. Hésitations autonomes en 8 langues : objet d’étude.

sirius
Download Presentation

étude acoustique et perceptive Vasilescu I., Candea M. & Adda-Decker M.

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. étude acoustique et perceptiveVasilescu I., Candea M. & Adda-Decker M. Hésitations autonomes en 8 langues : Colloque MIDL 29-30 nov. 2004 MIDL - projet STIC-SHS du CNRS Programme Société de l’Information 2001-2004

  2. Hésitations autonomes en 8 langues : objet d’étude • Phénomènes dits d’hésitation ou de formulation : grande diversité. • Hésitations autonomes : Segment vocalique allongé placé entre deux pauses ou bien à la suite d’un mot mais ne constituant pas un allongement de celui-ci ( pauses remplies, fillers). • Occurrences: ~5% dans les corpus spontanés • < 0.5% dans les corpus de parole lue/préparée. • Caractéristique principale: très longues (jusqu’à 1 seconde, voire +). • En français et en anglais : il s’agit d’une voyelle centrale.

  3. Hésitations autonomes en 8 langues : questions • Hésitations autonomes : porteuses d’information spécifique à la langue ? • Faut-il prévoir des modèles différents pour chaque langue ? • Les éventuelles différences sont-elles perceptibles à l’oreille ? • Timbre des voyelles support : toujours central ? toujours une voyelle du système vocalique de la langue ? • Paramètres (autres que la durée) permettant de différencier la voyelle d’hésitation de son homologue intra-lexicale (F0, qualité de voix, timbre…)? • Remarque : peu d’études sur les langues autre que anglais et français ; pas d’études comparatives multilingues à notre connaissance

  4. CORPORA • Corpus multilingue • Émissions journalistiques en 8 langues (2 heures / langue) (français, espagnol, italien, portugais, anglais, allemand, arabe moyen-oriental, chinois mandarin) • Corpus français • Émissions journalistiques diverses (env. 6 heures) • Etude plus approfondie

  5. CORPUSMULTILINGUE • Corpus initial Émissions journalistiques en 8 langues (français, espagnol, italien, portugais, anglais, allemand, arabe moyen-oriental, chinois mandarin). • Sous-corpus hésitations Extraction semi-automatique 30 à 200 occurrences par langue, locuteurs h/f. Critères : durée > 200 ms. • Contrôle Nous avons retenu uniquement les hésitations autonomes (voyelles support extra-lexicales) et nous avons écarté les mots outils vocaliques allongés.

  6. Analyse acoustique Distribution des voyelles support dans un espace F1/F2 Dispersion inter-langues > dispersion intra-langues. Qualité vocalique différente français [ə] anglais [a], [ə] et [æ], espagnol [e] et [ɛ], italien [ɛ] et [ə] . De manière générale : voyelle support appartient au système vocalique de la langue. Voyelle support hors système de la langue : italien [ə] . Analyse acoustique (1)

  7. Distribution des valeurs moyennes (hommes et femmes) : voyelles centrales et antérieures Analyse acoustique (2)

  8. Etude perceptive Français/L2 (1) 6 stimuli par langue(x 2) 20 auditeurs français Tâche : Français / L2, après une phase de familiarisation avec L2 • Hésitations isolées; diverses qualités de voix, timbre +/- central de la voyelle support, sélection de stimuli représentatifs pour chaque langue • Discrimination moyenne : 75%. – : françaisvsarabe, portugais, allemand→ voyelle support centrale + : françaisvsitalien, espagnol, anglais→ voyelle centrale vs [ε], [e], [æ] françaisvschinois → hauteur F0,qualité de voix

  9. Étude perceptive Français/L2 (2) • L2 mieux dans : FR/Arabe, FR/Chinois, FR/Allemand. • Stratégie: les auditeurs ont recherché ce qui est DIFFERENT par rapport à un prototype d’hésitation du français. • Ce résultat soulève des questions sur le rôle de la langue maternelle et du protocole de test dans les tâches de discrimination.

  10. Etude perceptive Français/L2 (3) • Effet L1 vs L2 : ANOVA deux facteurs (« langue de test » et « langue maternelle », i.e. comparer L1 vs L2). • Effet significatif du facteur « condition de test/langue de test » (p<0.0001). L2 est mieux reconnu que L1 (PLSD de Fisher, p=0.0198) • Effet L2 par rapport au Français (L1): t-test appariés. • Les sujets ont significativement (p<0.0001) mieux reconnu l’anglais, l’espagnol, l’italien, lechinois que l’arabe, leportugais et l’allemand par rapport au français.

  11. . HF hésitations 1484 378 schwa [ə - œ] 964 754 eu-fermé [ø] 923 291 CORPUS FrançaisÉtude acoustique comparative : voyelle d’hésitation vs voyelle intra-lexicale de timbre similaire • Étude sur le français Analyse acoustique des occurrences des voyelles d’hésitations vs des occurrences de [ø] (eu-fermé) et de [ə] (schwa) intra-lexicaux. • Critère de sélection Segments de durée > 40ms extraits automatiquement par le système d’alignement du LIMSI. 70% locuteurs Hommes vs. 30% locuteurs Femmes.

  12. Paramètres étudiés : voyelle d’hésitation vs voyelle intra-lexicale de timbre similaire • Durée • Timbre de la voyelle : F1, F2, F3 • Hauteur & contour de la fréquence fondamentale F0 • Qualité de voix

  13. Paramètres étudiés: la durée • Hésitations >200ms (200-650ms) • Voy. Intra-lexicales <100ms (40-150/200ms) hésit. schwa Fig. 3a– Distribution des hésitations en fonction de la durée (hommes+femmes). Eu-fermé Fig. 3b&c – Distribution des schwa & eu-fermés en fonction de la durée (hommes+femmes).

  14. Paramètres étudiés: la fréquence fondamentale F0 • Fréquence fondamentale: Distribution des moyennes similaire pour voyelles d’hésitation/voyelles du système. Distribution plus étendue avec plus de valeurs extrêmes pour les voyelles d’hésitation. Non détection avec PRAAT: 11,5 (hésitations) vs 3% (intra-lexicales) – Hommes 8,2 (hésitations) vs 0,5% (intra-lexicales) – Femmes • Hypothèse: Les hésitations sont produites avec un contrôle réduit de la phonation, et sujettes à une production non modale (creaky, breathy). F0Moy E-Type Hésitations hommes 155 97,3 femmes 179 68,5 Schwahommes 114 48,6 femmes 192 38,3 Eu-ferméhommes 144 45,4 femmes 219 56

  15. F1 F2 Hésitations H / F 470/523 1464/1659 [ə - œ] H / F réf. Calliope - Fant 1421/1659 1450/1650 404/523 500/550 [ø] H / F réf. Calliope - Fant 382/430 400/450 1465/1666 1450/1650 Paramètres étudiés: le timbre • F1, F2, F3 : Ouvert/fermé (F1) : les hésitations sont plus ouvertes (mais il faut tenir compte des effets liés à la durée – cf. communication de C. Gendrot & M. Adda-Decker). Antérieur/postérieur (F2) : Distribution des moyennes similaire pour voyelles d’hésitation/voyelles du système. Étiré/arrondi (F3) : moyennes de 2500Hz pour les hésitations et les voyelles intra lexicales (cf. C. Gendrot & M. Adda-Decker).

  16. Conclusions • Observations acoustiques • Plaident en faveur de l’existence d’informations spécifiques à la langue dans les hésitations autonomes. • Tests de perception • Confirment que les différences acoustiques observées sont perçues par les auditeurs. • Par conséquent : • Approfondir la modélisation de ces phénomènes pour chaque langue • Exploiter ces indices dans l’identification automatique de la langue

  17. Perspectives • Acoustique • comparer voyelle d’hésitation vs voyelle du système vocalique (intra-lexicale) • rapport hésitation autonome / hésitations « mots outils figés » (roumain, japonais, etc.) • hésitations autonomes vs allongements vocaliques d’une voyelle finale • Perception • L2’/L2 pour des locuteurs de langue L1.

More Related