280 likes | 436 Views
La statistique. Définitions et méthodes. La statistique est la branche des mathématiques qui collecte, classe, analyse et interprète des données afin d’en tirer des conclusions et de faire des prévisions.
E N D
La statistique Définitions et méthodes
La statistique est la branche des mathématiques qui collecte, classe, analyse et interprète des données afin d’en tirer des conclusions et de faire des prévisions. En sciences, l’analyse de données issues d’expériences ou d’études statistiques est un élément essentiel de la recherche. À cette fin, elle utilise un vocabulaire qui lui est spécifique.
Population: ensemble des individus, objets ou évènements ayant des caractéristiques communes et sur lequel porte l’étude. Les premières études de la statistique portaient sur les populations humaines. Le terme « population » est resté, mais aujourd’hui, en statistique, ce terme désigne aussi bien des objets, des phénomènes que des humains. Exemple : Si on s’intéresse à la qualité de l’eau des piscines d’une municipalité, la population étudiée est « les piscines ». Caractère: le sujet de l’étude. Dans l’exemple des piscines, le caractère étudié est « la qualité de l’eau ».
Échantillon: C’est un sous-ensemble d’une population. Il est parfois impossible d’étudier tous les éléments d’une population. On élabore alors un sous-ensemble possédant, le plus possible, les caractéristiques de la population. Exemple : On ne pourrait pas étudier toute la population des morues qui vivent en mer; cependant, on pourrait faire l’étude des morues capturées par plusieurs pêcheurs. On aurait alors un échantillon. Taille: Le nombre d’éléments qui composent l’échantillon. Remarque : Construire un échantillon représentatif d’une population est très important. Il existe, en statistique, une branche qui est spécialisée dans la construction des échantillons, la théorie del’échantillonnage.
Procédés d’échantillonnage Lorsque la population est homogène. C’est-à-dire, lorsque l’ensemble des individus qui le compose se ressemblent par rapport au caractère étudié. Exemple : On s’intéresse à l’intention de votes des gens d’une municipalité concernant l’élection d’un maire. On peut utiliser 3 procédés qui sont plus ou moins aléatoires : - l’échantillonnage aléatoire; - l’échantillonnage systématique; - l’échantillonnage par grappes.
Procédés d’échantillonnage Lorsque la population est homogène : - l’échantillonnage aléatoire On choisit les éléments complètement au hasard. Exemple : Dans un bottin téléphonique, on choisit 200 noms n’importe comment. - l’échantillonnage systématique On choisit au hasard un point de départ et,ensuite, on utilise toujours le même procédé pourchoisir les autres éléments. Exemple : Dans un bottin téléphonique, on prend un nom à tous les 25 noms. - l’échantillonnage par grappes On prend tous les individus d’un même groupe, les groupes étant choisis au hasard. Exemple : On prend tous les élèves d’un groupe de mathématique 306, mais dans plusieurs écoles différentes.
Élèves de l’école Filles gars Sec 1 50 70 Sec 2 60 95 Sec 3 40 85 Total 150 250 400 Procédés d’échantillonnage Lorsque la population est hétérogène. C’est à dire quand les éléments ont des caractéristiques différentes. On voudrait connaître les préférences alimentaires des étudiants d’une école secondaire. Exemple : On utilise l’échantillonnage parstrates.
Élèves de l’école Filles gars Sec 1 50 70 Sec 2 60 95 Sec 3 40 85 Total 150 250 400 filles de sec 1 filles de l’échantillon = total des élèves taille de l’échantillon = x = 60 X 50 400 50 400 Il s’agit alors de construire un échantillon proportionnel à la population. 60 On veut construire un échantillon de 60 personnes. Combien de filles de sec 1, y aura-t-il ? x x = 7,5 donc 8 filles.
On collecte différentes informations quantitatives et/ou qualitatives et on les organise pour qu’elles nous apprennent des choses. Exemples d’informations qualitatives : sexe, couleur des yeux, opinion politique, … Exemples d’informations quantitatives : l’âge, le poids, le salaire, le nombre de bactéries, etc.; tout ce qui représente une quantité, donc mesurable.
Procédés de collecte de données Il existe plusieurs procédés de collecte de données : - le questionnaire écrit; - l’entrevue en personne; - l’entrevue téléphonique; - l’observation directe; - l’observation de listes ou de documents; - la collecte par instruments; - etc.
Sources de biais Plusieurs raisons peuvent fausser une étude statistique; parmi les principales, on retrouve : - un mauvais échantillonnage; - la non-pertinence et la formulation des questions; - l’attitude du sondeur; - les erreurs de mesure; - le rejet d’une partie de l’échantillon; - la subjectivité dans la présentation des résultats; - etc.
Pour étudier les données recueillies lors d’un sondage, d’enquêtes ou de recensements, il existe différents outils statistiques. Cette année, nous étudierons : - Les tableaux de distribution Le tableau de données condensées et le tableau de données groupées en classes. - Les mesures de dispersion L’étendue de la distribution, l’étendue interquartile, l’étendue des quarts. - Les mesures de tendance centrale La moyenne, la médiane, le mode. - Les diagrammes L’histogramme et le diagramme de quartiles.
Différentes sortes de graphiques : Graphique à bandes Graphique circulaire Ce graphique donne des quantités exactes. Il montre très clairement l’importance d’une répartition.
Taille des élèves d’un groupe de 6e année 70 80 90 100 110 120 130 140 150 160 170 Graphique à ligne brisée Histogramme Il permet de montrer la continuité d’un phénomène. Il permet de regrouper des données. Le diagramme de quartiles Il représente la concentration ou la dispersion de données statistiques.
Répartition du nombre de diplômés en fonction du domaine d’étude et du sexe. Québec, 2005.
Taux de chômage au Canada et dans les provinces ( 2005-2006)
Pyramide normale de population babyboom Pyramide de référence