420 likes | 557 Views
Chapitre 2. Les indices. Chapitre 2 : Les indices. 1. Définition et propriétés En sciences sociales, les grandeurs varient dans l’espace et dans le temps : Dans le temps, puisqu’elles prennent des valeurs différentes à différentes dates.
E N D
Chapitre 2 Les indices
Chapitre 2 : Les indices 1. Définition et propriétés En sciences sociales, les grandeurs varient dans l’espace et dans le temps : • Dans le temps, puisqu’elles prennent des valeurs différentes à différentes dates. • Dans l’espace, puisqu’elles prennent des valeurs différentes d’une région à l’autre. Ce n’est pas toujours facile de pouvoir comparer des grandeurs. EX :
Chapitre 2 Pour faciliter la comparaison, on a recours à la notion d’indice. Définition : Un indice, c’est un rapport positif ou nul Il existe des indices synthétiques, qui sont des rapports obtenus avec des grandeurs complexes (composés de plusieurs indices simples). Ex: l’indice des prix est un indice qui résume l’évolution des prix de grandeurs hétérogènes (prix du chocolat et prix d’un vidéoprojecteur). La difficulté est l’agrégation de ces grandeurs si différentes.
Chapitre 2 2. Les indices simples Notons la date t=0 : date de base (situation de base) et la date t : date ou période courante. Soit deux valeurs V0 (valeur de départ) et Vt (valeur d’arrivée), on appelle • indice simple ou élémentaire - indice simple base 100 :
Chapitre 2 Exemple : Evolution d’un prix entre 2000 et 2005 (base 100 en 2000)
Chapitre 2 Exemple : Rapport d’un prix entre la Région parisienne (RP) et la France entière(FR) (base 100 pour l’ensemble de la France)
Chapitre 2 3. Décomposition d’indices
Chapitre 2 3.1 Propriétés des indices élémentaires - La circularité entre t=1 et t=2 En généralisant :
Chapitre 2 On se ramène à l’expression précédente : Pour comparer deux grandeurs simples, il suffit de faire le rapport de leurs indices. Généralisation :
Chapitre 2 - La réversibilité Quand on inverse le rôle de la base et de la période courante, l’indice élémentaire s’inverse à près.
Chapitre 2 Propriété secondaire : Produits d’indices Si a=bxc EX : RT=PxQ (indice des prix et indice des quantités=indice de la recette totale)
Chapitre 2 4. Les indices synthétiques Un indice synthétique résume une série d’indices élémentaires Les indices synthétiques les plus utilisés Valeur=prix x quantité L’indice de la valeur s’écrit :
Chapitre 2 Le problème de cet indice, c’est qu’on ne peut attribuer la cause de l’évolution : ce peut être toute combinaison des prix ou des quantités. Il faut ainsi éliminer l’influence des prix pour calculer un indice des quantités et éliminer l’influence des quantités pour calculer un indice des prix. Par exemple pour un indice simple des prix d’un bien :
Chapitre 2 Indice synthétique des prix Indice synthétique des quantités
Chapitre 2 Exemple de calculs d’indices synthétiques (de prix et de quantités) avec trois biens
Chapitre 2 • Calculer l’indice d’évolution de la valeur de B1 • Calculer l’indice synthétique des prix • Calculer l’indice synthétique des quantités
Chapitre 2 Exemple de la propriété de circularité : trouver IND2007/2006 ou
Chapitre 3 Le modèle Linéaire Simple (La méthode des moindres carrés ordinaires)
1. PRESENTATION DU MODELE Définition La régression est l’outil le plus utilisé pour estimer une équation linéaire. La régression permet de décrire et d’évaluer la relation entre une variable dépendante et une (ou plusieurs) variable(s) indépendante(s). La variable dépendante est définie par y et la variables indépendantes par x. • Dans le modèle de régression simple, k=1. • Dans le modèle de régression multiple, k>1.
I. PRESENTATION DU MODELE Définition Quelques noms pour les variables y et x. yx variable dépendante variable indépendante variable de contrôle variable à expliquer variable explicative (régresseur) Dans une régression, la variable y et la ou les variables x sont traitées de manière asymétrique. • La variable y est supposée être aléatoire ou ‘stochastique’. Elle possède une distribution de probabilité. • La ou les variables x sont supposée(s) avoir des valeurs fixes d’un échantillon à l’autre (elles ne sont pas aléatoires).
I. PRESENTATION DU MODELE Définition Dans le modèle de régression simple, il n’y a qu’une une seule variable x (k=1). Le modèle de régression linéaire simple peut être spécifié de la manière suivante: • Pour des données temporelles (t=1,…,n) • yt = a0 + a1xt + εt • Pour des données en coupe transversale (i=1,…,N) • yi = a0 + a1xi + εi
I. PRESENTATION DU MODELE Le Rôle de e La relation spécifiée entre y et x ne peut pas être déterministe. • Il nous est impossible de connaître le modèle ‘vrai’ de régression pour y: E(y|x) = a0 + a1x : Il est (souvent) impossible (ou trop coûteux) d’observer la totalité de la population de Y et X. Comme le modèle spécifié ne sera jamais rigoureusement exact, un terme aléatoire e (aussi appelé ‘terme d’erreur’) est ajouté. • Ce terme est et restera inconnu. On ne pourra en obtenir qu’une estimation (e).
I. PRESENTATION DU MODELE Le Rôle de e Le terme aléatoire synthétise: • Une erreur de spécification • La variable explicative peut ne pas être suffisante pour rendre compte de la totalité du phénomène expliqué. (Le terme aléatoire synthétise l’ensemble des informations non explicitées dans le modèle) • Une erreur de mesure • Les données ne représentent pas exactement le phénomène. • Il y a des données manquantes. • Une erreur de fluctuation d’échantillonnage Les observations comprises dans l’échantillon, et donc les estimations, peuvent être différentes.
I. PRESENTATION DU MODELE Conséquence du terme aléatoire Comme les valeurs vraies de a0 et a1 ne sont pas connues, elles doivent être estimées. • On dérive les formules des estimateurs de a0 et a1, notés respectivement â0 et â1. • L’estimation de a est la valeur particulière que prend l’estimateur â pour un échantillon donné. • Le modèle de régression linéaire estimé peut s’écrire: • y = â0 + â1x + e â0 et â1 possèdent une distribution de probabilité : ( a0 et a1 sont des constantes). â0 et â1 suivent les mêmes lois de distribution que y et e.
II. ESTIMATION DES PARAMETRESLa méthode des MCO (moindres carrés ordinaires) • La méthode la plus souvent utilisée pour estimer les paramètres a0 et a1 est la méthode des Moindres Carrés Ordinaires (MCO/OLS). • Elle consiste à ajuster un nuage de points à l’aide d’une droite en minimisant la distance au carré entre chaque valeur observée et la droite. • Cette distance mesure le résidu (l’erreur/la partie non expliquée)pour chaque observation:
De manière analytique, il s’agit de minimiser la Somme des Carrés des Résidus (SCR/RSS), c.à.d. : • Minimisons la fonction L, évaluée en â1 et â2, en dérivant par rapport à chacun des deux paramètres:
II. ESTIMATION DES PARAMETRESLa méthode des MCO On obtient l’estimateur de a0 à partir de la première équation comme suit :
Calcul des estimateurs L’estimateur de a1 est obtenu à partir de la seconde comme suit:
Calcul des estimateurs • On formule l’estimateur de a1 en terme de variance-covariance :
Calcul des estimateurs • En remplaçant A et B par leur valeur, on obtient: Car en divisant chaque terme par (n-1), on a
Calcul des estimateurs • Le coefficient de régression mesure l’impact d’une variation (c.à.d. l’effet propre/partiel) de la variable indépendante sur la variable dépendante. • â1=DY/DX (coefficient de régression de Y sur X)
Régression ≠ corrélation • En matière de corrélation, les variables sont traitées de manière SYMETRIQUE (elles sont aléatoires). • Le coefficient de corrélation, r, ne dépend pas de la manière dont sont traitées X et Y. • Si y = a0 + a1x + e, rY,X = • Si x = a’0 + a’1y + e, rX,Y = • â1, le coefficient de régression de y sur x, n’est pas égal à r, le coefficient de corrélation entre y et x.
ANALYSE DE LA VARIANCE L’équation fondamentale de l’analyse de la variance est: • SCT = Somme des Carrés Totaux = variabilité totale(SST = Total Sum of Squares). • SCR = Somme des Carrés des Résidus = variabilité non expliquée (SSR = Residual Sum of Squares). • SCE = Somme des Carrés Expliqués = variabilité expliquée (SSE = Explained Sum of Squares).
ANALYSE DE LA VARIANCE Plus la variabilité expliquée (SCE) est proche de la variabilité totale (SCT), meilleur est l’ajustement du nuage de points par la droite des MCO. => La variabilité de y autour de sa moyenne est bien expliquée par la variable explicative . Une mesure de la qualité d’ajustement est le coefficient de détermination, R2 (avec R=ρ, le coefficient de corrélation linéaire). • R2=SCE/SCT • R2=1-(SCR/SCT)
ANALYSE DE LA VARIANCE • Les cas limites où R2=0 et R2=1
Exercice 1 Calcul d’un « trend » par les MCO. Estimer l’équation yt = a0 + a1xt + εt avec les données suivantes.
Exercice 2 La relation prix/demande.
Exercice 2 • Passer en Log. On pose u=log(x) et v=log(y) • Calculer le coefficient de corrélation linéaire • Calculer les estimateurs de a et b en estimant V=aU+b+ε • Calculer la quantité demandé pour un prix égal à 75 €
Exercice 3 Corrélation et équation d’analyse de la variance
Exercice 3 • Calculer le coefficient de corrélation linéaire • Calculer les estimateurs de a et b en estimant Y=aX+b+ε • Calculer les variance expliquées et résiduelles