1 / 25

Codage des données de recensement: Une vue d’ensemble

Codage des données de recensement: Une vue d’ensemble. Division de statistique des Nations Unies. Vue d’ensemble de la présentation. Qu’est-ce que le codage? Les méthodes de codage Les index de codage Types d’opérations de codage Types de codes Questions ouvertes Systèmes de codage

Download Presentation

Codage des données de recensement: Une vue d’ensemble

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Codage des données de recensement: Une vue d’ensemble Division de statistique des Nations Unies Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

  2. Vue d’ensemble de la présentation • Qu’est-ce que le codage? • Les méthodes de codage • Les index de codage • Types d’opérations de codage • Types de codes • Questions ouvertes • Systèmes de codage • Organisation du codage • Sources d’erreurs de codage Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

  3. 1. Qu’est-ce que le codage? • Processus dans lequel les données du questionnaire sont transformées and valeurs numériques et/ou alphanumériques • Objectif est de préparer les données dans une forme utilisable par un ordinateur pour analyse ultérieure • Réalisé en déterminant les réponses possibles pour chaque question et établissant une table de correspondance entre ces réponses et les valeurs numériques et/ou alphanumériques Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

  4. 2. Méthodes de codage • Simple • Limité à une seule question du questionnaire • Direct: la réponse peut être codée selon une liste • Structuré • Utilisé pour des variables complexes (profession, activité économoqie, éducation, etc.) • Référence peut être faite à plusieurs questions (statut dans l’emploi, public/privé…) • Des règles de codage peuvent être établies pour guider les opérateurs Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

  5. Méthodes de codage(cont.) • Successif (ou hiérarchique) • S’applique aux caractéristiques pour lesquels il est nécessaire d’avoir plusieurs niveaux de détail avant d’assigner un code • Utilisé communément pour le codage des adresses: • Le codeur commence par chercher à identifier un niveau gégoraphique large (province), puis détermine la ville, puis la rue, puis le numéro dans la rue Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

  6. 3. Index de codage • Quel que soit le système utilisé, il s’appuie sur des index • Les index sont des liste de réponses caractéristiques susceptibles d’être données et À chacune desquelles est affecté un code. • Doivent s’appuyer sur les déclarations des recensés et pas uniquement sur les libellés des postes de la nomenclature • Permet de répartir les réponses entre les diverses rubriques de la nomenclature • Qualité de ces index est primordiale; le temps et les efforts nécessaires ne doivent pas être sous-estimés • Les index ne sont pas statiques et doivent être mis à jour pour prendre en compte de nouvelles réponses Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

  7. 4. Types d'opérations de codage Les opérations de codage peuvent impliquer une des trois options : • Assigner des codes numériques aux réponses libéllées en clair, par exemple les variables tels que lieux géographique, métier, activité économique, etc. • Reporter des codes numériques sur une feuille de programmation séparée de faciliter la saisie de données. • Utiliser des entrées précodées sur les questionnaires qui peuvent être employés directement pour la saisie de données Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

  8. 5.Types de codage • Réponses pré-codées • Codage manuel en bureau Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

  9. (a) réponses pré-codées • Adapté aux questions fermées; les nombres dans les cases du questionnaire sont employés pour coder les réponses • Dans la mesure du possible, les réponses précodées devraient être employées pour le recensement avec des codes numériques ou alphanumériques • Les catégories de codage devraient être mutuellement exclusives et exhaustives • Pour: • Plus facile • Plus rapide • Contre: • Ne peut pas être utilisé pour des questions ouvertes Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

  10. (b) Codage manuel en bureau • Toutes les questions de recensement ne peuvent être précodées, par exemple, celles qui exigent des réponses ouvertes • L’étendue complète des réponses peut ne pas être connue et ne peut pas donc être codée sur place, ainsi le codage est fait après la collecte Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

  11. Questions ouvertes: avantages • Permet aux répondants de s’exprimer par eux-mêmes, plutôt qu’avec les termes choisis par les organisateurs du recensement • Particulièrement approprié pour des concepts complexes comme la profession • Les chercheurs peuvent étudier comment les répondants parlent de leur profession par example, et trouver des informations de valeur pour eux Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

  12. Questions ouvertes: inconvénients • Différents répondants peuvent aborder la même question de différentes perspectives de sorte que leurs réponses ne puissent pas être entièrement comparables • Les questions ouvertes sont une source commune d'erreur de mesure sur des recensements • Le codage peut impliquer de grouper ensemble les répondants qui ont apporté les réponses semblables. Puisqu'aucun deux répondants peuvent jamais ne pas donner des réponses identiques, le codeur peut compléter des détails d'une réponse en faisant des conjectures au sujet de quel répondant a voulu dire pour dire. Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

  13. Questions ouvertes: problèmes autour du codage • Toutes les questions d’un recensement ne peuvent être précodées (par exemple, caractéristiques économiques) • Il est nécessaire de former le personnel pour déterminer des codes appropriés avec les listes des codes existantes sur la base de l'information fournie par des répondants • La catégorie « autre » est habituellement incluse parce que souvent la gamme complète des réponses n'est pas connue Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

  14. 6. systèmes de codage • Les réponses textuelles et verbales doivent être remplacées par des codes par intervention : • Manuelle • Assistée par ordinateur • Automatique • Combinaison des précédentes Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

  15. (a)Codage manuel • Les codeurs assignent manuellement un code aux réponses en consultant l’index, ou les livres de code • Ils écrivent alors manuellement les codes sur un formulaire pour la saisie et le traitement de données postérieurs • Pour: • Simple • Contre: • Long et pénible • Sujet à des biais et au sur-codage (codeur trop zélé pour trouver un code même en l’absence d’information suffisante) • Plus sujet à erreurs que d'autres types de codage. Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

  16. (b) Codage assisté par ordinateur • Systèmes automatisés (ordinateurs centraux, PCs, etc.) utilités pour aider les codeurs • Les index utilisés sont comme décrit auparavant, mais cette fois ils sont stockés sur l’ordinateur. Les codes associés sont stockés dans une base de données et accédés pendant l'opération de codage • Un codeur peut saisir soit à partir de feuilles de programmation soit saisir chaque réponse à partir du questionnaire directement Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

  17. (b) Codage assisté par ordinateur (cont.) • Exécution pratique : • Le codeur dactylographie quelques caractères de chaque mot dans la réponse • L'ordinateur renvoie une liste de valeurs possibles à partir de l'index de codage approprié • Le codeur choisit la valeur dans la liste de possibilités • L'ordinateur enregistre automatiquement le code correspondant • Exemple : pour « éleveur de volaille » le codeur écrit « elev vol » Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

  18. (b) Codage assisté par ordinateur (cont.) • Pour: • Relativement plus efficace • Plus de règles de codage peuvent être incorporées au système pour guider les codeurs, ce qui a pour conséquence des données de meilleure qualité • Approprié au codage structuré en particulier • Contre: • Relativement complexe • Long et coûteux à développer Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

  19. (c) Codage automatique • Un algorithme automatisé compare la réponse textuelle capturée (par exemple, d'ICR) à des index, et assigne le numéro de code dans la majorité des cas sans intervention humaine • Implique typiquement un mécanisme de notation où un nombre minimum de points est exigé avant qu'une réponse soit considérée comme valide • Quand le score est au-dessous d'un certain niveau, l'intervention humaine est nécessaire • Les taux de codage dépendent des algorithmes utilisés et des types de variables Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

  20. (c) Codage automatique (cont.) • Pour: • Vitesse • Grande efficacité • Bonne qualité • Particulièrement adapté au codage structuré • Contre: • Complexe • Coûts élevés • Risques d’erreurs systématiques dans le cas de défauts dans les algorithmes de correspondance et les index Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

  21. NSO élaborent souvent une liste de codes communs pour quelques variables employées dans le recensement et dans les enquêtes ; par exemple, lieu de naissance, langue, appartenance ethnique/race, citoyenneté L'exemple du code commun pour le « lieu géographique » pourrait être code hiérarchique de 3 chiffres avec pour le premier chiffre le plus large niveau de la géographie, et le troisième chiffre le niveau le plus fin Le problème commun qui se pose est quand les définitions diffèrent ou changent entre les recensements (ou entre un recensement et une enquête) pour des variables telles que le travail ou l'appartenance ethnique ; le NSO doit développer une politique sur la façon dont prendre en considération ces changements Pour le « codage simple », le NSO doit définir une liste de codes: Ex. Sexe : maaculin-1, féminin-2 ; Ex. Type d’inactivité : au foyer-0, étudiant-1, retraité-2, other-3 7. Organisation du codage Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

  22. 7. Organisation du codage (cont.) • Pour « le codage structuré », il y a un certain nombre de systèmes de classification internationaux que les NSOS peuvent employer directement ou adapter à leurs propres variantes nationales • Exemples: • Classification Internationale Type par Industrie, de toutes les branches d’activité économique, CITI Rév. 4 Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

  23. 7. Organisation du codage (cont.) (b) Classification Internationale Type des Professions, CITP-08 Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

  24. 8. Sources d’erreurs de codage • Les règles de codage peuvent être déficientes • Les règles de codage peuvent ne pas être correctement appliquées • Le codage peut être fortement subjectif • Les opérations de codage sont importantes dans les recensements et donc difficile à contrôler Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

  25. MERCI Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

More Related