1.38k likes | 2.33k Views
La Méthodologie de Box-Jenkins. Michel Tenenhaus. 1. Les données. Une série chronologique assez longue (n 50). Exemple : Ventes d’anti-inflammatoires en France de janvier 1978 à juillet 1982. Objectif : Prévoir les ventes d’août à décembre 1982. Marché total des anti- inflammatoires.
E N D
La Méthodologie de Box-Jenkins Michel Tenenhaus
1. Les données • Une série chronologique assez longue (n 50). • Exemple : Ventes d’anti-inflammatoires en France de janvier 1978 à juillet 1982. • Objectif : Prévoir les ventes d’août à décembre 1982.
Marché total des anti- inflammatoires
2. Stabiliser la série Il faut TRANSFORMER la série observée de manière à - enlever la tendance, - enlever la saisonnalité, - stabiliser la variance.
Pour enlever la tendance Faire des différences régulières d’ordre d : d = 1 d = 2 Différence régulière d’ordre d : Dans la pratique d = 0,1, rarement 2
Marché total des anti-inflammatoires : Différence régulière d’ordre d = 1
Pour enlever la saisonnalité Ordre de la saisonnalité : s = 12 (mois) ou 4 (trimestre) Faire des différences saisonnières d’ordre D : D = 1 D = 2 Différence saisonnière d’ordre D : Dans la pratique D = 0,1, très très rarement 2
Marché total des anti-inflammatoires : Différence saisonnière (s = 12) d’ordre D = 1
Pour enlever tendance et saisonnalité Formule générale : On peut choisir d et D minimisant l’écart-type de wt. Application Marché total :s = 12, d = 1, D = 1
Marché total des anti-inflammatoires : Différence régulière/saisonnière (s = 12, d = 1, D = 1)
Calcul des écarts-types s = 12, d = 1, D = 1
évaluation de la tendance 1 an avant valeur 1 an avant terme aléatoire Développement de zt De On déduit On va modéliser la série « stationnaire » wt.
Pour stabiliser la variance On utilise souvent les transformations
Indépendant de la période t 3. Le modèle statistique On suppose que la série stabilisée (w1,…,wN) provient d’un processus stationnaire (wt) : Dans des conditions assez générales tout processus stationnaire peut être approché par des modèles AR(p), MA(q) ou ARMA(p,q).
Remarque : AR(p) : Auto-régressif d’ordre p où at est un bruit blanc :
MA(q) : Moyenne Mobile d’ordre q Remarque :
Remarque : ARMA(p,q)
Question Comment choisir le modèle correspondant le mieux aux données étudiées ? Réponse On utilise les autocorrélations k et les autocorrélations partielles kk.
Exemple : Marché TotalDifférence régulière/saisonnière : d = 1, D = 1 Autocorrélations calculées
Exemple : Marché TotalDifférence régulière/saisonnière : d = 1, D = 1 Corrélogramme observé Formule de Bartlett
Formule de Bartlett (Hypothèse : h= 0 pour h k) Variance des autocorrélations rk Formule de Box-Jenkins pour un bruit blanc (Hypothèse : h= 0 pour h 1)
k 1 0 k Corrélogramme théorique Test : H0 : k = 0 On rejette H0 : k = 0 au risque = 0.05 si Application Marché total : 1 = 0, k = 0 pour k > 1
Autocorrélation partielle d’ordre k : 5. Autocorrélation partielle Régression de wt sur wt-1,…,wt-k: C’est une corrélation partielle:
Calcul pratique de estimation de kk Soit : Etc… On obtient les estimations des kken remplaçant les kpar rk.
Rejet de H0 : kk = 0 si: Exemple : Marché TotalDifférence régulière/saisonnière : d = 1, D = 1 Autocorrélations partielles calculées
Corrélogramme partiel observé Corrélogramme partiel théorique kk 1 14 2 0 k
AR(1) (a) : (b) : 6. Autocorrélations et autocorrélations partielles des modèles AR(p) et MA(q)
AR(2) (a) : (b) : Le dernier pic significatif du corrélogramme partiel donne l’ordre p du modèle AR(p).
MA(1) (a) : (b) :
(a) : q = 2 (b) : q = 5 (c) : q = 6 MA(q) Le dernier pic significatif du corrélogramme donne l’ordre q du modèle MA(q).
7. Étude de la série Marché Total • Les autocorrélations suggèrent un modèle MA(1). • Les autocorrélations partielles suggèrent un modèle AR(14).
7.1 Étude de la voie moyenne mobile On suppose que wtsuit un modèle MA(1) : et on a = E(wt) = . On choisit les paramètres , et 2 à l’aide de la méthode du maximum de vraisemblance.
Maximum de vraisemblance • On suppose que le vecteur aléatoire • w = (w1,…,wN) suit une loi multinormale. • Densité de probabilité de w : • On recherche maximisant • la vraisemblance
Qualité de l’ajustement dans ARIMA où r est le nombre de paramètres (hors 2). On recherche le modèle minimisant SBC.
évaluation de la tendance 1 an avant choc aléatoire en t choc aléatoire en t-1 marché 1 an avant Modélisation de zt De On déduit
Modèle : Prévision de zt réalisée en t-1 : Erreur de prévision à l’horizon 1 : Calcul pratique des prévisions et des erreurs sur l’historique: Calcul des prévisions et des erreurs
Résultats (fin) Vérifier les calculs pour
Validation du modèle Étude des
Validation du modèle Corrélogramme des Formule de Box-Jenkins Corrélogramme théorique des erreurs bt k(bt) 12 0 k
Validation du modèle : Utilisation de la statistique de Ljung-Box La statistique de Ljung-Box suit une loi du khi-deux à m-r ddl lorsque les résidus forment un bruit blanc. On accepte le modèle étudié si les niveaux de signification sont > .05 pour différentes valeurs de m.