320 likes | 591 Views
Pratiques des sciences sociales Le monde des nombres Séance 4 : Les variables numériques (2) Représenter les variations et le changement Bruno Cautrès, Chercheur au CEVIPOF Louis Chauvel, Professeur des Universités à Sciences Po . Site du cours : http://louis.chauvel.free.fr.
E N D
Pratiques des sciences sociales Le monde des nombresSéance 4 : Les variables numériques (2) Représenter les variations et le changementBruno Cautrès, Chercheur au CEVIPOFLouis Chauvel, Professeur des Universités à Sciences Po Site du cours : http://louis.chauvel.free.fr
Plan de cette séance : • Les statistiques de dispersion : écart-type, fractiles, rapports interdéciles, coefficient de Gini… • Les représentations du changement et des variations : les graphiques standards / les graphiques à échelle logarithmique • Les chausse-trappes et les trompe l’œil …
30 25 20 15 10 5 0 150 155 160 165 170 175 180 185 190 195 200 • Exemple : La taille des Néerlandais et des Portugais Est-il possible de discriminer Néerlandais et Portugais simplement sur leur taille ? • Hommes, Pays-Bas : moy (taille) = 1,80 mect (taille) = 7,79 Cm • Hommes, Portugal : moy (taille) = 1,70 mect (taille) = 7,48 Cm • => Réponse : oui et non… Seuls 16 % des néerlandais sont sous la barre des 1,72 m, donc un Portugais moyen a des chances d’être un peu reconnaissable, mais ce n’est pas systématique !…
Mode • Différents indicateurs de dispersion : Médiane queue de distribution Med Moyenne
Mode • Différents indicateurs de dispersion : • Quartiles • (Le rapport interquartile : q3/q1) Médiane queue de distribution QG1 QG2 QG3 QG4 q1 q3 Med =q2 Moyenne 25 %
Mode • Différents indicateurs de dispersion : • Quartiles • (Le rapport interquartile : q3/q1) • Déciles ( / centiles) • Le rapport interdécile ; d9/d1 Médiane queue de distribution QG1 QG2 QG3 QG4 q1 q3 Med =q2 d1 d9 10 % Moyenne 25 % Med/2 = seuil de pauvreté relative
Mode 8 500 Médiane 10 906 Moyenne 14 150 0 2000 4000 6000 8000 10000 12000 14000 16000 18000 20000 22000 24000 26000 28000 30000 32000 34000
100 90 80 70 60 50 40 30 20 10 0 0 20 40 60 80 100 • Courbe de Lorenz et coefficient de Gini : % de revenu cumulé Le Gini vaut 0 en cas d’égalité absolue, et 1 en cas de captation de l’ensemble du revenu par une seule personne La surface entre la courbe et la diagonale = coefficient de Gini Les 60 % les moins aisésgagnent 36 % du revenu total % de la population par revenu croissant
Comparaison de coefficients de Gini => voir aussi les prochaines séances Suède: 25,2 % France:34,5 Brésil: 59,8
Que faut-il absolument retenir ?(mais aussi le reste : c’est de la culture…) • L’histogramme et la densité • Le sens des indicateurs : moyenne arithmétique, médiane, mode,… La formule de la moyenne … • Le sens des indicateurs : écart-type, <La formule de écart-type, non ; mais le sens, oui>, fractiles, rapports interdéciles, coefficient de Gini…
Les représentations du changement et des variations • Le graphique temporel standard En ordonnée : une variable continue(moyenne, % ou autre…) En abscisse : le temps
Exemple : le pourcentage de bacheliers en France par génération • Que voit-on en particulier ? Source Enquêtes Emploi 1969 - 2000 , INSEE archives LASMAS – Quételet Sources 70% 60% 50% 40% 30% 20% 10% 0% % de bacheliers 1900 1920 1940 1960 1980 Cohorte de naissance (génération)
Il faut : • - repérer les accélérations, • - repérer les stagnations, • - caractériser les pentes et leur changement (les « inflexions ») • - etc. etc. et puis donner un sens à tout cela … (nous sommes là pour interpréter, tout en restant prudents) • Un grand problème de représentation • Est-ce la même chose de rajouter 10 points à 20 % que 20 points à 40 % ?
Les graphiques à échelle logarithmique • Le graphique à une échelle logarithmique En ordonnée : le « log » d’une variable continue(moyenne, % ou autre…) En abscisse : le temps
Exemple : le pourcentage de bacheliers en France par génération • Que voit-on en particulier ? Source Enquêtes Emploi 1969 - 2000 , INSEE archives LASMAS – Quételet 1900 1920 1940 1960 1980 100% 80% 60% 40% 20% % de bacheliersen échelle log 10% 1900 1920 1940 1960 1980 Cohorte de naissance (génération)
Deux possibilités pour comparer deux nombres : différence ou rapport • Exemple : proposer une augmentation des salaires de 0.5% (rapport) ou une augmentation uniforme de 100 euros (différence) relève de choix politiques très différents ! • Autre exemple : le record du monde du 100 mètres a été amélioré d ’un centième de seconde (différence); le coût de la vie a augmenté de 1% (rapport)
Ces deux modes de comparaison conduisent à deux échelles de mesure : • Une échelle qui autorise des comparaisons par différences : échelle d ’intervalle (statistique) ou échelle arithmétique (mathématique) • Une échelle qui autorise des comparaisons par quotients : échelle de rapport (statistique) ou échelle logarithmique (mathématique)
d1 d1 d2 d2 1/2 1 2 4 8 16 32 x1 y1 x2 y2 -1 0 1 2 3 4 5 x1 y1 x2 y2 Echelle arithmétique : d1=d2 y1-x1 = y2-x2 Echelle logarithmique : d1=d2 y1/x1 = y2/x2 Traduction graphique de ces deux échelles
Sur une échelle arithmétique, la longueur du segment [0 x] est égale à x • Sur une échelle logarithmique, la longueur du segment [1 x] est le logarithme de X
Rappels : • - Le logarithme de 1 est 0 • - Le nombre dont le logarithme est 1 est la base du logarithme. • - La propriété fondamentale des logarithmes, quelle que soit la base, est de transformer la multiplication en addition (et le quotient en différence) : • Log(x*y)=Log(x) + Log(y) • Log(x/y)= Log(x)-Log(y)
- Les logarithmes les plus utilisés (quand il n ’y avait pas d ’ordinateurs) étaient les logarithmes de base 10 (logarithmes décimaux). Mais les plus utilisés aujourd’hui en statistique sont les logarithmes de base e(=2.71828), appelés logarithmes népériens. • - Si l ’échelle arithmétique est l ’échelle des phénomènes additifs, l ’échelle logarithmique est l ’échelle des phénomènes multiplicatifs ou exponentiels.
Que fait l’échelle logarithmique ? • Elle « tasse » le graphique sur les valeurs les plus élevées et permet de repérer les petites variations sur les faibles valeurs…Elle permet surtout de repérer des variations non plus additives mais multiplicatives => exemple de la « loi de Moore »
La loi de Moore (fondateur de Intel) : Le nombre de transistors sur une puce double tous les 18 mois
Gordon E. Moore (cofondateur de Intel) La loi de Moore : « Le nombre de transistors sur une puce double tous les 18 mois » Génération Itanium 3 Doublement en 18 mois Doublement en 3 ans (*) Génération Itanium 3 • =>En réalité, c’est plutôt tous les 24 mois
Deux applications : • - La France va-t-elle bien ? (croissance en berne ou pas?) • - La notion d’élasticité-revenu http://www.insee.fr/fr/ppp/publications/intfrcbref.pdf Source : LA FRANCE EN BREF FRANCE IN FIGURES « Cette publication a été réalisée par l’Institut National de la Statistique et des Études Économiques avec le concours de la Direction de la Communication et de l’Information du ministère des Affaires étrangères. NB : nominal = euros courants ; réel = euros constants (contrôle de l’inflation)
« Never lie, just take advantage of reality » (Charles Tilly, U Columbia) • Deux applications : • - La France va-t-elle bien ? (croissance en berne ou pas?) Pente 1,3 % par an Pente 3,9 % par an
Exemple : l’élasticité revenu de l’alimentation • « .. Je ärmer eine Familie ist, einen desto gröβeren Anteil von Gesamtausgabe muβ Beschaffung der Nahrung aufwenden » (E. Engel, 1857) • Loi d’Engel (sans « s », Ernest est son prénom) : plus les gens sont pauvres, plus ils consacrent une forte part de leur revenu à l’alimentation (le coefficient bubgétaire du poste « alimentation » décroît avec le revenu). • En termes d’élasticité : si le budget total s’accroît de X %, de combien Y % le budget alimentaire s’accroît-il? l’élasticité revenu de l’alimentation ERA = Y / XERA>1 => bien supérieurERA<1 => bien inférieur
Exemple : l’élasticité revenu de l’alimentation Chaque point matérialise un vingtile du budget total=> consommation totale en abscisse et alimentation en ordonnée En ordonnée : Budget alimentaire En abscisse : le budget total Source Enquête Budget des ménages 2000, INSEE archives LASMAS – Quételet
Exemple : l’élasticité revenu de l’alimentation l’élasticité revenu de l’alimentation ERA = 0,711 % de croissance du budget accroît la consommation alimetaire de 0,7 % En ordonnée : Budget alimentaire En abscisse : le budget total
Dans le cas général : faites toujours attention à l’échelle des ordonnées … pourcentage de bacheliers en France par génération Croissance massive = Peut mieux faire