250 likes | 593 Views
Analyse lexicale. L'analyse lexicale consiste à prendre connaissance des textes dans l'optique d'extraire des morceaux choisis et de créer de nouvelles variables qui décriront quantitativement ces textes. questions ouvertes textes. Définitions. L'ensemble des textes s'appelle le corpus.
E N D
L'analyse lexicale consiste à prendre connaissance des textes dans l'optique d'extraire des morceaux choisis et de créer de nouvelles variables qui décriront quantitativement ces textes. • questions ouvertes textes.
Définitions • L'ensemble des textes s'appelle le corpus. • Ce corpus est composé de plusieurs fragments, chacun correspondant à une phrase de discours, à une observation, à un individu ou à une réponse selon le contexte de l'enquête ou de l'étude. • Un fragment est composé de formes graphiques que nous appellerons par simplification des mots.
Des séparateurs délimitent les mots, d'autres délimitent les phrases. • Une expression est une suite de mots. • L'ensemble des mots utilisés dans le corpus sera désigné sous le nom de lexique des mots. • Le bouton Lemmatiser : permet de lancer l'analyse syntaxique des textes au cours de laquelle chaque mot est remplacé par une forme canonique (infinitif, masculin singulier, etc.).
Tableau des réponses • Le Tableau des réponses présente les réponses aux questions ouvertes textes dans un tableau qui indique la fréquence des réponses identiques ou celle des mots contenus dans le texte. • Toutes les fonctions d'analyse des tris à plat et des tris croisés avec tests statistiques et représentations graphiques peuvent alors être appliquées à ces tableaux de mots (resp. réponses) ;
Croiser • Les effectifs des tableaux de mots ou de réponses peuvent aussi être ventilés selon une autre variable caractérisant les répondants (bouton Croiser).
L’atelier lexical permet de donner un aperçu du contenu du texte en dressant le lexique, c’est-à-dire la liste des mots (ou des expressions) classée par fréquence d’apparition. • Plusieurs méthodes sont utilisées dans Sphinx pour permettre d’approcher le texte tout en réduisant au mieux les ambiguïtés:
Coder les questions ouvertes textes • Traitements et analyses -> Etudier les textes
Nb citations Nb occurrences
Autres fonctions • regroupements de plusieurs termes sous un même thème (bouton Regrouper), • suppression de mots qui n’apportent aucune information (bouton Supprimer), • classement selon le nombre d’occurrences, par ordre alphabétique, longueur des mots ou encore par d’apparition (bouton Classer) ; • navigation lexicale : recherche de réponses qui contiennent un ou plusieurs mots sélectionnés (bouton Marquer) puis affichage de l’ensemble des réponses avec mise en couleurs des mots marqués (corpus dans la liste déroulante Vue) ;
Exemple: regroupement de tous les mots qui commence par voit* et regroupement sous le mots voiture
Strates • Tous les traitements et analyses peuvent être effectués au choix sur l’échantillon total ou sur des sous populations (strates). • Par défaut, ils concernent l’échantillon total c’est-à-dire la totalité des personnes interrogées. • Dès qu’une strate est définie et appliquée (grâce aux fonctions Strates… du menu Dépouiller et Changer de strate du menu Analyser dans l’environnement classique), le Sphinx n’affiche les résultats de la base de données que pour la strate courante.
Exemple: dépenses pour l’entretien de la voiture • Echantillon totale