1 / 23

Site du cours : http://louis.chauvel.free.fr

Pratiques des sciences sociales Le monde des nombres Séance 3 : Les variables numériques (1) Les nombres et leur mise en représentation Bruno Cautrès, Chercheur au CEVIPOF Louis Chauvel, Professeur des Universités à Sciences Po . Site du cours : http://louis.chauvel.free.fr.

jana
Download Presentation

Site du cours : http://louis.chauvel.free.fr

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Pratiques des sciences sociales Le monde des nombresSéance 3 : Les variables numériques (1) Les nombres et leur mise en représentationBruno Cautrès, Chercheur au CEVIPOFLouis Chauvel, Professeur des Universités à Sciences Po Site du cours : http://louis.chauvel.free.fr

  2. Plan de cette séance : c’est du sérieux !  • Les distributions de variables numériques : de l’histogramme à la densité • Les statistiques de tendance centrale : moyenne arithmétique, médiane, mode,… • Les statistiques de dispersion : écart-type, fractiles, rapports interdéciles, coefficient de Gini…

  3. Les distributions de variables numériques : de l’histogramme à la densité • La diversité des variables numériques : discrètes / continues ; additives / multiplicatives, etc. • Les variables numériques continueset la difficulté de leur représentation=> Exemple du revenu en France

  4. Exemple du revenu en FranceEnquête Budget des ménages 2000 : 10 305 ménages interrogés sur les revenus et les dépenses de l’année(les gens déclarent-ils la réalité ou leur réalité ????) • Problème : si on considère le revenu (au centime près) par tête dans le ménage (après impôt), on ne peut guère trouver deux ménages avec le même revenu=> solution : on peut représenter la « distribution » par un histogramme fondé sur un découpage en tranches ni trop fines ni trop épaisses …

  5. Exemple du revenu en France 43 ménages situés entre 10000 et 10050 euros par an En ordonnée : les effectifs dans chaque tranche En abscisse : revenu par tête (euros), ici en tranches de 50 €

  6. Exemple du revenu en France 88 ménages situés entre 10000 et 10100 euros par an En ordonnée : les effectifs dans chaque tranche En abscisse : revenu par tête (euros), ici en tranches de 100 €

  7. Exemple du revenu en France 771 ménages situés entre 10000 et 11000 euros par an En ordonnée : les effectifs dans chaque tranche En abscisse : revenu par tête (euros), ici en tranches de 1000 €

  8. Exemple du revenu en France => la « densité » Queue de distribution En ordonnée : échelle normée => surface sous la courbe = 1 En abscisse : revenu par tête (euros)

  9. Exemple du revenu en France => la « densité » En ordonnée : échelle normée => surface sous la courbe = 1 En abscisse : revenu par tête (euros)

  10. Les statistiques de tendance centrale : moyenne arithmétique, médiane, mode,… • La moyenne arithmétique : • S x • n • La somme des valeurs divisé par le nombre n d’individus : • Ex : somme de tous les revenus rapportée au nombre d’individus :moy (revenu par tête) = 14 155 euros/an/tête • Moy (x) =

  11. Les statistiques de tendance centrale : moyenne arithmétique, médiane, mode,… • La médiane : • C’est la valeur qui divise en deux parties égales la population • Ex : la médiane des revenus est le revenu qui divide en deux parties égales de 50 % la population :méd (revenu par tête) = 10 906 euros/an/tête

  12. Les statistiques de tendance centrale : moyenne arithmétique, médiane, mode,… • Le mode : • C’est la valeur qui regroupe le plus d’individus • Ex : le mode des revenus est situé autour de 8500 euros/an/tête

  13. Mode 8 500 Médiane 10 906 Moyenne 14 150 0 2000 4000 6000 8000 10000 12000 14000 16000 18000 20000 22000 24000 26000 28000 30000 32000 34000 La moyenne est-elle trompeuse ? 1- quand une distribution est très dissymétrique, la moyenne est très différente de la médiane 2- lorsque la distribution est très « écrasée », de nombreux individus sont loin de la moyenne

  14. Les statistiques de dispersion : écart-type, fractiles, rapports interdéciles, coefficient de Gini… • L’écart-type : • S [x – moy(x)]2 • n • S’interprète comme la distance (quadratique) moyenne à la moyenne : • Ex : l’écart-type des revenus est :Ect (revenu par tête) = 16 060 euros/an/tête • Ect (x) =

  15. Exemple de la « loi normale »(la taille des conscrits, les notes aux concours de Sciences-Po, …) Ect moy 68 % de la pop entre : (moy – Ect) et (moy + Ect) 95,5 % de la pop entre : (moy – 2 Ect) et (moy + 2 Ect)

  16. Exemple de la « loi normale »(la taille des conscrits, les notes aux concours de Sciences-Po, …) Ect moy 2/3 de la pop entre : (moy – 0,97 Ect) et (moy + 0,97 Ect) 95 % de la pop entre : (moy – 1,96 Ect) et (moy + 1,96 Ect)

  17. Exemple : La taille des Néerlandais et des Portugais Est-il possible de discriminer Néerlandais et Portugais simplement sur leur taille ? • Hommes, Pays-Bas : moy (taille) = 1,80 mect (taille) = 7,79 m • Hommes, Portugal : moy (taille) = 1,70 mect (taille) = 7,48 m • => Réponse : oui et non… Seuls 16  % des néerlandais sont sous la barre des 1,72 m, donc un Portugais moyen a des chances d’être un peu reconnaissable, mais ce n’est pas systématique !…

  18. Mode Médiane queue de distribution QG1 QG2 QG3 QG4 q1 q3 Med =q2 d1 d9 10 % Moyenne 25 % Med/2 = seuil de pauvreté relative • Différents indicateurs de dispersion : • Quartiles / quintiles / déciles ( / centiles) • Quantiles et groupes de quantiles • (Le rapport interquartile : q3/q1) • Le rapport interdécile ; d9/d1 • « Seuil de pauvreté relative » = 1/2 médiane

  19. Income The strobiloid representation of income distribution Higher income class = rich 200 Median income class =« middle class » 100 median income 50 Lower income class = poor

  20. Comparisons of national strobiloids : national median Brazil : Median disposable income per year per capita : 6.900 $PPP/an Gini coef.: 59.8 % Median class = 44 % US : Median disposable income per year per capita : 32.000 $PPP/an Gini coef.: 34.5 % Median class = 58 % Sweden : Median disposable income per year per capita : 23.000 $PPP/an Gini coef.: 25.2 % Median class = 84 % Median national income

  21. 100 90 80 70 60 50 40 30 20 10 0 0 20 40 60 80 100 • Courbe de Lorenz et coefficient de Gini :  % de revenu cumulé Le Gini vaut 0 en cas d’égalité absolue, et 1 en cas de captation de l’ensemble du revenu par une seule personne La surface entre la courbe et la diagonale = coefficient de Gini Les 60  % les moins aisésgagnent 36  % du revenu total  % de la population par revenu croissant

  22. Représentations de l’inégalité : comparaison de coefficients de Gini Suède France Brésil

  23. Que faut-il absolument retenir ?(mais aussi le reste : c’est de la culture…) • L’histogramme et la densité • Le sens des indicateurs : moyenne arithmétique, médiane, mode,… La formule de la moyenne … • Le sens des indicateurs : écart-type, fractiles, rapports interdéciles, coefficient de Gini… La formule de écart-type

More Related