310 likes | 411 Views
Le Continuum d’accès pour les produits de Statistique Canada. par Sage Cram Le 30 avril 2004 Atelier de Formation IDD Université de Montréal. L’information statistique. Deux modèles a utiliser pour l’identification et la sélection des informations statistiques :
E N D
Le Continuum d’accès pour les produits de Statistique Canada par Sage Cram Le 30 avril 2004 Atelier de Formation IDD Université de Montréal
L’information statistique • Deux modèles a utiliser pour l’identification et la sélection des informations statistiques : • Graphique des informations statistiques • La différence entre les statistiques et les données • La différence entre les données aggrégées et les microdonnées
L’information statistique • Continuum d’accès • Associer les modes de diffusion avec les produits désirés
Les statistiques ou les données? Les statistiques sont : • Des faits numériques • créer de données, p. ex. données traitées • prêtent à être présentées Les données sont : • des fichiers numériques crées pour l’analyse • brutes (seulement des codes) • inutilisables pour les presentations
Graphique des informations statistiques N’oubliez pas que la relation entre les statistiques et les données est liée. Les statistiques sont crées de données!
Graphique des informations statistiques Imprimées
Graphique des informations statistiques Données Aggrégées
Les données aggrégées • Les données aggrégées sont des statistiques organisées dans les bases de données ou dans les fichiers de données. • La différence entre les données aggrégées et les statistiques dans une base de données est la manipulation.
Structure des données : • Séries de temps • Géographie • Contenue sociale
Graphique des informations statistiques Microdonnées
Les microdonnées confidentielles • Les données brûtes sont organisées dans un fichier où chaque ligne représente une unité d’observation du quel l’information fourni contient les valeurs des variables.
Les microdonnées confidentielles • Fichier principal (masterfile) : contient tous les détails récoltés du questionnaire. L’information contenu dans ce fichier pourrait facilement identifier une personne, alors ce fichier est traité comme confidentiel.
Les microdonnées confidentielles • Fichier partagé (sharefile) : pendant l’entrevue le répondant est demandé s’il autorise Statistique Canada à partager leurs informations avec d’autres ministères. Si Oui, un autre fichier principal est créé c’est ce qu’on appelle un fichier partagé. • De plus en plus rare.
Fichier de microdonnées à grande diffusion • Public Use Microdata File (pumf) • Un fichier préparé pour minimiser le risque d’identification d’une personne • Les données du fichier principal sont modifiées pour créer un fichier de microdonnées à grande diffusion.
Fichier de microdonnées à grande diffusion • Quelques exemples de modification qui peuvent être apportées aux fichiers principals : • Enlever tous les détails personnels (les noms, les adresses, etc.); • Inclu seulement les niveaux de géographie élevée; • Aggréger les informations détaillés dans des catégories plus générales; • Enlever les valeurs extrèmes; • Supprimer les valeurs d’une variable; et/ou • Supprimer le cas.
Sommaire • La graphique des informations statistiques montre la vaste gamme des produits difussé par STC
Le continuum d’accès • Statistique Canada donne accès à une vaste gamme d’informations statistiques par l’entremise de ses services et ses inititatives qui agit comme mode de diffusion. • Le continuum démontre les divers niveaux d’accès
Les caractéristiques du continuum • Le coût : de gratuits à très cher • Les restrictions : d’accès libre à accès restreint • L’information disponible : des statistiques aux données
Continuum d’accès pour les produits de Statistique Canada Il y a dix ans…
Continuum d’accès pour les produits de Statistique Canada Légère amélioration…
Continuum d’accès pour les produits de Statistique Canada La pièce de résistance!
Continuum d’accès pour les produits de Statistique Canada Accès aux données confidentielles