1 / 71

Introduction

Introduction. Les concepts de base. Thèmes. La statistique - pourquoi? Les statistiques descriptives Analyse des fréquences Les distributions Les mesures de tendance centrale Quelle mesure faut-il prendre ? Les mesures de la dispersion La relation entre deux variables

niabi
Download Presentation

Introduction

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Introduction Les concepts de base

  2. Thèmes • La statistique - pourquoi? • Les statistiques descriptives • Analyse des fréquences • Les distributions • Les mesures de tendance centrale • Quelle mesure faut-il prendre ? • Les mesures de la dispersion • La relation entre deux variables • La statistique inférentielle

  3. La statistique sert à ... • La description des données • Inférence: étude des caractéristiques d’une population à partir d’un sous-ensemble (échantillon) tiré de cette population • Estimation des paramètres • Vérification des hypothèses

  4. Présentation de toutes les données

  5. La statistique descriptive Les étapes • Poser une question • Élaborer une étude (choix de l’échantillon, choix des mesures) • Récolter les données • Décrire les données • Interpréter les données Hypothèse Données Conclusion

  6. Un exemple Question: Développement de la population Méthode: Recensions de la population au Canada

  7. Tracé en arborescence

  8. Type de variables • Variable: Une variable est une caractéristique qui peut supposer plus d'un ensemble de valeurs auquel il est possible d'attribuer une mesure numérique • Les variables nominales servent uniquement à catégoriser, aucun ordre et aucune métrique ne correspond à la classification (ex: couleur des yeux) • Les variables ordinales fournissent un ordre. Pourtant les intervalles entre les catégories correspondant aux chiffres peuvent être variables (ex: mise en rang des préférences) • Les variables par intervalles sont métriques. Des intervalles égaux et mesurables existent entre chacune des catégories, pourtant le point zéro est arbitraire (ex: échelles de température Fahrenheit et Celsius) • Les variables de rapport sont des variables par intervalle avec un zéro absolu (ex: les fréquences absolues, l’échelle de température Kelvin)

  9. Analyse des fréquences

  10. Taille des personnes

  11. Forme de la distribution Distribution bimodale Distribution symétrique moyenne = médiane = mode Biais positif: moyenne > médiane > mode Biais négatif: mode > médiane > moyenne

  12. SPSS - Frequencies

  13. Mesures de la tendance centrale Mode : Valeur ou catégorie d’une variable ayant la plus forte fréquence Médiane : Valeur qui divise le nombre des observations d’une distribution en deux parts égales Moyenne arithmétique : Somme pondérée des valeurs d’une variable

  14. Exemple • Données: nombre de partenaires sexuelles

  15. Calcul du mode La valeur la plus fréquente

  16. Calcul de la médiane • Trier les observations selon leur ordre de magnitude • Identifiez le chiffre au milieu Ex. : Quelle est la médiane de la série suivante ?: 11, 11, 13, 15, 17, 17, 17, 19, 19, 19, 19 et de celle-ci ?: 1,5,6,9,11,12

  17. Calcul de moyenne µ = Sx/n Ex. : la moyenne de 1,2,3,6,6,7,9 est: La somme Sx est (1+2+3+…+9) = 34 Il y a n = 7 observations µ = 34 / 7 = 4.9

  18. Autre types de moyennes Trimean: La somme du 25e quartile (Q1) plus deux fois le 50e quartile (Q2) plus le 75e quartile (Q3) divisé par 4. Donc: (Q1 + (2*Q2) + Q3)/4 Moyenne tronquée (trimmed mean): Avant de calculer la moyenne 5% des valeurs extrêmes sont enlevées (Ex: Notes de patinage artistique)

  19. Exemple

  20. SPSS - Explore

  21. Quelle mesure faut-il prendre ? • Échelle de mesure • Distribution des données

  22. Distribution • Un chercheur pose la question à savoir combien de livres de statistique et de méthodologie possèdent les étudiants. • Dans un groupe cours les 5 étudiants ont tous un livre de stats de leurs cours du CEGEP, du Bac et du Doctorat ainsi que deux livres de métho.

  23. Dans un autre cours, plusieurs étudiants ont vendu certains livres alors que d’autres étudiants ont acheté des livres plus spécialisés.

  24. Finalement, dans un autre groupe cours, il y a une personne qui possède maintenant 12 livres.

  25. Mesures de la dispersion Pourquoi? • Les mesures de tendance centrale décrivent les observations "en général" ou "en moyenne". • Les mesures de la dispersion nous informent jusqu'à quel point ces observations sont proche ou loin de leur "moyenne".

  26. L’étendue • La différence entre la valeur la plus grande et la valeur la plus petite. • Cette mesure est très sensible aux valeurs extrêmes. Ex: 3 5 7 8 9 10 12 13 l’étendu: 13-3 = 10 Femmes: 100 Hommes: 253

  27. Intervalle semi-interquartile • La moitié de la différence entre le 75e quartile (Q3) et le 25e quartile (Q1). • Donc: (Q3-Q1)/2. • Cette mesure est très peu sensible au valeurs extrêmes. Femmes: 2 Hommes: 9

  28. Écart-type Sommes des carrés (SC) = Variance (s2) = SS/N-1 Femmes: 39.08 Hommes: 552.63 Écart-type (s) = Femmes: 6.25 Hommes: 23.51

  29. Erreur-type

  30. La relation entre deux variables

  31. La covariance La moyenne du produit des déviations des valeurs des variables par rapport à leur moyenne. • Cette mesure varie selon l'échelle de mesure. Ex: On obtient une valeur différente pour la taille quand on la mesure soit en pouce soit en centimètre.

  32. La corrélation: La covariance divisée par le produit des écart types des variables • Le coefficient de corrélation varie entre -1 et 1. • Le signe correspond à la direction de la corrélation. Quand les deux valeurs augmentent ou diminuent ensemble il s'agit d'une corrélation positive. • Quand une valeur augmente alors que l'autre diminue il s'agit d'une corrélation négative • La taille absolue correspond au degré du lien entre les deux variables

  33. Corrélation

  34. Exemple • Sir Francis Galton se posa la question à savoir s’il y a un lien entre la taille des parents et la taille de leurs enfants. Il a donc mesuré la taille de 952 parents et de leurs enfants. Sir Francis Galton 1822-1911

  35. Régression vers la moyenne

  36. SPSS - Corrélations

  37. Fenêtre des variables

  38. Output

More Related