1 / 42

OBJECTIFS > PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION

OBJECTIFS > PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION. Apport dans l’analyse de la Langue Parlée en Interaction – LPI  Décrire - la langue sur la base de ses usages en interaction - l'organisation de l'interaction sur la base d'un grand corpus

tuan
Download Presentation

OBJECTIFS > PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. OBJECTIFS > PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION • Apport dans l’analyse de la Langue Parlée en Interaction – LPI  Décrire - la langue sur la base de ses usages en interaction - l'organisation de l'interaction sur la base d'un grand corpus  Articuler recherches qualitatives et quantitatives  Constitution de collections  Formulation de nouvelles hypothèses, validation GROUPE ICORhttp://clapi.univ-lyon2.fr

  2. CORINTE :http://icar.univ-lyon2.fr/projets/corinte/ site dédié à la recherche sur "corpus de parole en interaction" GROUPE ICORhttp://clapi.univ-lyon2.fr

  3. OBJECTIFS > PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION • Mise à disposition de ressources sur corpus d'interactions en situation naturelle :  accès libre aux descripteurs  transcriptions alignées sur le signal audio-vidéo  outils d’analyse et de requête => 70% des données interrogeables en ligne librement GROUPE ICORhttp://clapi.univ-lyon2.fr

  4. OBJECTIFS> PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION • Dimension patrimoniale : conservation et valorisation Intégration  de corpus anciens (depuis 1980 - GRIC)  de corpus externes  de corpus récents établis selon les nouvelles règles de l’art Enrichissement description détaillée  numérisation des données  balisage XML automatique des transcriptions  préparation au streaming audio-vidéo => Médiathèque de corpus GROUPE ICORhttp://clapi.univ-lyon2.fr

  5. OBJECTIFS> PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION . Spécificités de CLAPI Diversité des situations documentées Particularités de l’oral en interaction Multimodalité Hétérogénéité des transcriptions Interopérabilité GROUPE ICORhttp://clapi.univ-lyon2.fr

  6. OBJECTIFS> PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION Diversité des situations documentées Interactions en contexte naturel interactions familières professionnelles médicales en classe … + situations construites (entretiens) Domaines Analyse de LPI Syntaxe de l’oral Didactique Acquisition Sociolinguistique Psychosociologie Dialectologie GROUPE ICORhttp://clapi.univ-lyon2.fr

  7. OBJECTIFS> PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION • Des exemples … GROUPE ICORhttp://clapi.univ-lyon2.fr

  8. Particularités de l’oral en interaction changement de locuteur production verbale attribuée enchaînement des locuteurs, taille pv (tour bref), place dans la pv (début/fin)formes (tokens)lexique répétition co_occurrences   variantes morphologiquesdistance entre les mots  groupe de motschevauchement chevauchant, chevauché, départ simultané pause (courte, longue, quantifiée) timing commentaire/observationPerspectives : troncation, allongement, enchaînement rapide, gestes OBJECTIFS >PRINCIPES> BANQUE DE DONNEES ET OUTILS > EXPLOITATION GROUPE ICORhttp://clapi.univ-lyon2.fr

  9. OBJECTIFS> PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATIONIntégration de l’orthographe adaptée b`jour `fin GROUPE ICORhttp://clapi.univ-lyon2.fr

  10. OBJECTIFS> PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION • Multimodalité Conception multimodale des pratiques linguistiques  Accès au signal audio/vidéo grâce à l'alignement  Développement en coursde notations du multimodal • Hétérogénéité des transcriptions  Différentes conventions de transcription  Transcriptions partielles de certains phénomènes, de certains passages  Niveaux de granularité différents  Respect de la transcription d’origine, pas de re-transcription • Balisage automatique en XML des transcriptions préparé par l’équipe médiathèque, validé par le responsable de corpus GROUPE ICORhttp://clapi.univ-lyon2.fr

  11. OBJECTIFS> PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION • Interopérabilité Choix de formats largement diffusés pour les données primaires (.wav, .mov…)  pour les alignements (praat, clan…) Echange avec d’autres applications informatiques traitant des corpus Dublin Core pour les métadonnées TEI pour les métadonnées mais aussi pour le contenu des transcriptions (Lou Burnard) GROUPE ICORhttp://clapi.univ-lyon2.fr

  12. OBJECTIFS> PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION Banque de données Volume de données 40 corpus / 120 h 300 enregistrements / 500 transcriptions 40 h de transcriptions balisées et alignées dont 70% interrogeables librement 7 h de données téléchargeables (transcriptions et enregistrements) GROUPE ICORhttp://clapi.univ-lyon2.fr

  13. OBJECTIFS> PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION Banque de données : descripteurs GROUPE ICORhttp://clapi.univ-lyon2.fr

  14. OBJECTIFS> PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION Banque de données : documents annexes GROUPE ICORhttp://clapi.univ-lyon2.fr

  15. OBJECTIFS> PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION Banque de données : locuteurs GROUPE ICORhttp://clapi.univ-lyon2.fr

  16. OBJECTIFS> PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION Plateforme logicielle Outils Automatiques lexique  reconnaissance des variantes graphiques  co-occurrence de tokens et/ou phénomènes  enchaînement de locuteurs  saillances de phénomènes au cours de l’interaction  répétition, reprise Requêtes complexespermettant de combiner  métadonnées  lexique  phénomènes interactionnels • Dans les deux cas, repérer des Clusters lexique + phénomènes interactionnels GROUPE ICORhttp://clapi.univ-lyon2.fr

  17. OBJECTIFS> PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION Présentation type des résultats Transcription  contexte autour de la cible Signal aligné sur le contexte Descripteurs accès aux métadonnées GROUPE ICORhttp://clapi.univ-lyon2.fr

  18. OBJECTIFS> PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION Une palette d'utilisations de complexité différente Le conflit identification d'une situation complexe indices de détection Cluster de phénomènes et de formes  caractérisation d'un segment chevauchant d’un tour bref Déroulement de l’interaction  identification de phases variations de fréquence des phénomènes en liaison avec les formes Etude comparative spécificités en fonction du genre de l’interaction, du nombre de locuteurs (face à face,…) Formes identification des usages variantes graphiques fréquences, co-occurrences GROUPE ICORhttp://clapi.univ-lyon2.fr

  19. OBJECTIFS> PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION Une palette d'utilisations de complexité différente Le conflit identification d'une situation complexe indices de détection Cluster de phénomènes et de formes  caractérisation d'un segment chevauchant d’un tour bref Déroulement de l’interaction  identification de phases variations de fréquence des phénomènes en liaison avec les formes Etude comparative spécificités en fonction du genre de l’interaction, du nombre de locuteurs (face à face,…) Formes identification des usages variantes graphiques fréquences, co-occurrences GROUPE ICORhttp://clapi.univ-lyon2.fr

  20. OBJECTIFS > PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION Co-occurrences de la particule ben sur plusieurs corpus GROUPE ICORhttp://clapi.univ-lyon2.fr

  21. OBJECTIFS > PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION Co-occurrences de la particule ben on détaille GROUPE ICORhttp://clapi.univ-lyon2.fr

  22. OBJECTIFS> PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION Une palette d'utilisations de complexité différente Le conflit identification d'une situation complexe indices de détection Cluster de phénomènes et de formes  caractérisation d'un segment chevauchant d’un tour bref Déroulement de l’interaction  identification de phases variations de fréquence des phénomènes en liaison avec les formes Etude comparative spécificités en fonction du genre de l’interaction, du nombre de locuteurs (face à face,…) Formes identification des usages variantes graphiques fréquences, co-occurrences GROUPE ICORhttp://clapi.univ-lyon2.fr

  23. OBJECTIFS > PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION Représentativité de bendans une transcription donnée GROUPE ICORhttp://clapi.univ-lyon2.fr

  24. OBJECTIFS > PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION Analyse qualitative ben repérage des usages différents ah ben oui – ah ben non approbation d’un résultat positif/négatif GROUPE ICORhttp://clapi.univ-lyon2.fr

  25. OBJECTIFS > PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION Analyse qualitative ben repérage des usages différents ben justement par la même personne pour s’opposer de manière plus forte GROUPE ICORhttp://clapi.univ-lyon2.fr

  26. OBJECTIFS > PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION Analyse qualitative ben repérage des usages différents ben non justement opposition, interruption GROUPE ICORhttp://clapi.univ-lyon2.fr

  27. OBJECTIFS > PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION Analyse qualitative ben repérage des usages différents ben = ben liant-lubrifiant en cascade pour un changement thématique GROUPE ICORhttp://clapi.univ-lyon2.fr

  28. OBJECTIFS> PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION Une palette d'utilisations de complexité différente Le conflit identification d'une situation complexe indices de détection Cluster de phénomènes et de formes  caractérisation d'un segment chevauchant d’un tour bref Déroulement de l’interaction  identification de phases variations de fréquence des phénomènes en liaison avec les formes Etude comparative spécificités en fonction du genre de l’interaction, du nombre de locuteurs (face à face,…) Formes identification des usages variantes graphiques fréquences, co-occurrences GROUPE ICORhttp://clapi.univ-lyon2.fr

  29. Analyse contextuelle de ben OBJECTIFS > PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION Saillances segment chevauchant, début de tour, jamais isolé GROUPE ICORhttp://clapi.univ-lyon2.fr

  30. OBJECTIFS> PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION Une palette d'utilisations de complexité différente Le conflit identification d'une situation complexe indices de détection Cluster de phénomènes et de formes  caractérisation d'un segment chevauchant d’un tour bref Déroulement de l’interaction  identification de phases variations de fréquence des phénomènes en liaison avec les formes Etude comparative spécificités en fonction du genre de l’interaction, du nombre de locuteurs (face à face,…) Formes identification des usages variantes graphiques fréquences, co-occurrences GROUPE ICORhttp://clapi.univ-lyon2.fr

  31. OBJECTIFS> PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION Etude comparative des particules mais ben voilà donc  Localisation dans le tour Ben 75% début de tour, 40 % en premier 19% fin de tour , 4% en dernier 11% tour bref 20% en début de segment chevauchant 3% en segment chevauché Donc 42% début de tour, 25 % en premier 14% fin de tour , 6% en dernier 4% tour bref 12% en début de segment chevauchant 8% en segment chevauché Voilà 71% début de tour, 47 % en premier 56% fin de tour , 42% en dernier 40% tour bref 27% en début de segment chevauchant 5% en segment chevauché • Mais • 60% début de tour, 26 % en premier • 16% fin de tour, 7% en dernier • 7% tour bref • 24% en début de segment chevauchant • 6% en segment chevauché GROUPE ICORhttp://clapi.univ-lyon2.fr

  32. OBJECTIFS> PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION Etude comparative des particules mais ben voilà donc Genre Interactionnel Ben 40% interactions privées 22% interactions entre professionnels 35% interactions professionnels/particuliers Donc 16% interactions privées 53% interactions entre professionnels 29% interactions professionnels/particuliers Voilà 8% interactions privées 61% interactions entre professionnels 27% interactions professionnels/particuliers Mais 30% interactions privées 28% interactions entre professionnels 38% interactions professionnels/particuliers GROUPE ICORhttp://clapi.univ-lyon2.fr

  33. OBJECTIFS> PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION Une palette d'utilisations de complexité différente Le conflit identification d'une situation complexe indices de détection Cluster de phénomènes et de formes  caractérisation d'un segment chevauchant d’un tour bref Déroulement de l’interaction  identification de phases variations de fréquence des phénomènes en liaison avec les formes Etude comparative spécificités en fonction du genre de l’interaction, du nombre de locuteurs (face à face,…) Formes identification des usages variantes graphiques fréquences, co-occurrences GROUPE ICORhttp://clapi.univ-lyon2.fr

  34. OBJECTIFS> PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION Bilan graphique • Pointe d’activité linguistique : saillance lexique+ chevauchement à un moment de l‘interaction GROUPE ICORhttp://clapi.univ-lyon2.fr

  35. OBJECTIFS> PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION Une palette d'utilisations de complexité différente Le conflit identification d'une situation complexe indices de détection Cluster de phénomènes et de formes  caractérisation d'un segment chevauchant d’un tour bref Déroulement de l’interaction  identification de phases variations de fréquence des phénomènes en liaison avec les formes Etude comparative spécificités en fonction du genre de l’interaction, du nombre de locuteurs (face à face,…) Formes identification des usages variantes graphiques fréquences, co-occurrences GROUPE ICORhttp://clapi.univ-lyon2.fr

  36. OBJECTIFS> PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION Requêtes personnalisées GROUPE ICORhttp://clapi.univ-lyon2.fr

  37. OBJECTIFS> PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION Requêtes personnalisées GROUPE ICORhttp://clapi.univ-lyon2.fr

  38. OBJECTIFS> PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION ben + début de segment chevauchant + tour bref benn’est pas forcément un simple régulateur … GROUPE ICORhttp://clapi.univ-lyon2.fr

  39. OBJECTIFS> PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION Une palette d'utilisations de complexité différente Le conflit identification d'une situation complexe indices de détection Cluster de phénomènes et de formes  caractérisation d'un segment chevauchant d’un tour bref Déroulement de l’interaction  identification de phases variations de fréquence des phénomènes en liaison avec les formes Etude comparative spécificités en fonction du genre de l’interaction, du nombre de locuteurs (face à face,…) Formes identification des usages variantes graphiques fréquences, co-occurrences GROUPE ICORhttp://clapi.univ-lyon2.fr

  40. OBJECTIFS> PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION Le conflit  indices de détection dans CLAPI Formes 'non',' mais non', 'si ', ‘pas d’accord’, ‘répondre à’, ‘revenir sur’ usage de certains patterns : ex. interro-négative Saillance de chevauchement à un moment de la transcription  comparaison du nombre de tours avec et sans chevauchement  localisation dans le tour chevauché Débit : nombre important de tokens à un moment donné Tours brefs (micro production) Les répétitions en signe d’insistance …. Etude par locuteurs GROUPE ICORhttp://clapi.univ-lyon2.fr

  41. OBJECTIFS> PRINCIPES > BANQUE DE DONNEES ET OUTILS > EXPLOITATION GROUPE ICORhttp://clapi.univ-lyon2.fr

More Related