340 likes | 584 Views
Prédiction multi-step de la volatilité : le modèle ARIMA-GARCH appliqué aux séries temporelles d’affaiblissement par la pluie sur les liaisons Terre-Satellite. L. de Montera , C. Mallet and L. Barthes Centre d’Etudes des Environnements Terrestre et planétaires (CETP)
E N D
Prédiction multi-step de la volatilité : le modèle ARIMA-GARCH appliqué aux séries temporelles d’affaiblissement par la pluie sur les liaisons Terre-Satellite L. de Montera, C. Mallet and L. Barthes Centre d’Etudes des Environnements Terrestre et planétaires (CETP) Vélizy-Villacoublay, France SAMA – 21/03/2008 1/29
I/Le problème à résoudre II/ Rappels et modèles classiques de type ARMA III/ Modélisation ARIMA et limitations IV/ Modélisation GARCH des erreurs V/ Prédiction multi-step et performances 2/29
Le problème à résoudre 44 GHz ↑ 20 GHz ↓ Affaiblissement par la pluie des liaisons Terre-Satellite en bade EHF (20-50 Ghz): Solution : adaptation de la puissance d'émission en fonction des conditions de propagation En raison du temps de réaction de la boucle de contrôle, => Il faut prédire l'affaiblissement à t+10secondes pour éviter que la liaison ne soit coupée 3/29
les données L'affaiblissement (en dB) de la balise 20 GHz du satellite OLYMPUS a été mesuré à Gometz-la-Ville pendant 15 mois. Cette base de données, échantillonée à 1seconde, contient 67 évènements de pluie. Exemple d'affaiblissement pendant un orage. 4/29
I/Le problème à résoudre II/ Rappels et modèles classiques de type ARMA III/ Modélisation ARIMA et limitations IV/ Modélisation GARCH des erreurs V/ Prédiction multi-step et performances 5/29
La notion de stationnarité (1) Définition - Un processus Xt est dit stationnaire au sens fort si, quelque soit n, t, h, on a l’égalité en loi : Définition - Un processus Xtest dit stationnaire au second ordre, ou au sens faible, si la moyenne du processus est constante et si les autocovariances ne dépendent que de la l’intervalle entre les observations : La dernière propriété implique en particulier que la variance de Xtest constante 6/29
La notion de stationnarité (2) Définition – Un processus Xt est non-stationnaire de type déterministe s’il peut s’écrire : La moyenne dépend de t où f(t) est un tendance déterministe, dans ce cas, on a : Définition – Un processus Xt est non-stationnaire de type stochastique lorsqu’il est intégré d’ordre d, c’est-à-dire que le processus résultant de d différenciations est stationnaire: est stationnaire La variance dépend de t Marche aléatoire (d=1) : non-stationnaire (déterministe) non-stationnaire (stochastique) stationnaire 7/29
Les modèles classiques stationnaires Soit εt un bruit blanc gaussien N(0,σ) au sens fort (i.i.d.). • Le modèle AR(p) (Auto Regressive): • Le modèle MA(q) (Moving Average): • Le modèle ARMA(p, q): 8/29
Les modèles classiques non stationnaires Soit εt un bruit blanc gaussien N(0,σ) au sens fort (i.i.d.). • La marche aléatoire: • Le modèle ARIMA(p, d, q) (Auto Regressive Integrated Moving Average): 9/29
I/Le problème à résoudre II/ Rappels et modèles classiques de type ARMA III/ Modélisation ARIMA et limitations IV/ Modélisation GARCH des erreurs V/ Prédiction multi-step et performances 10/29
Stationarisation (1) On applique le test de stationnarité de Box & Jenkins: si l'autocorrélation reste proche de 1 pour un nombre élevé de retard, le processus est intégré. Il faut travailler sur la première différence: autocorrélation 11/29
Stationarisation (2) série différenciée L'autocorrélation des différences montre que le processus est maintenant stationarisé. Une seule différenciation est suffisante. autocorrélation 12/29
Modélisation ARMA des différences Identification des ordres par la méthode du 'coin' (basée sur l'autocorrélation) Estimation des paramètres par OLS (Ordinary Least Squares) Modélisation complète ARIMA(2,1,2): avec 13/29
Validation La validation se fait par l'étude des résidus εt qui doivent être un bruit blanc gaussien fort (i.i.d.). • Les résidus sont de moyenne nulle et ne sont pas corrélés, on peut parler de bruit blanc faible, MAIS: • phénomène de "volatility clustering" • distribution à queues épaisses (Kurtosis=12) 14/29
Hétéroscédasticité conditionnelle Ces propriétés (classiques en finance) sont due au fait que la variance conditionnelle n'est pas constante (hétéroscédasticité, du grec "hetero" → different et "skedastios" → dispersion) On voit que les résidus sont non-corrélés mais pas indépendants. L'hypothèse de processus ARIMA(2,1,2) pur est donc rejetée. Autocorrélation des résidus au carré 15/29
I/Le problème à résoudre II/ Rappels et modèles classiques de type ARMA III/ Modélisation ARIMA et limitations IV/ Modélisation GARCH des erreurs V/ Prédiction multi-step et performances 16/29
Modélisation GARCH des erreurs • En pratique, l'hétéroscédasticité conditionnelle pose deux problèmes: • Le modèle ARMA pur sous-estime les risques pendant les périodes de forte volatilité, car la variance de l'erreur augmente. • L'estimation des paramètres est biaisée car l'algorithme OLS suppose que les résidus ont une variance constante. On est donc amené à modéliser la variance des erreurs. Le modèle le plus populaire est le modèle GARCH(1,1) (Generalized Auto Regressive Conditionnal Heteroscedasticity): σt est une estimation de la variance conditionnelle de l'erreur, elle change à chaque instant et ne se réalise qu'une seule fois. 17/29
Propriétés des processus GARCH • Pour qu'un processus GARCH soit stationnaire, il faut α+β<1 • La variance non-conditionnelle est alors k/(1- α-β) • GARCH permet de reproduire l'autocorrélation des erreurs au carré et donc la 'volatility clustering' • GARCH produit des distribution 'leptokurtique' (à queues épaisses, K>3) 18/29
Modélisation ARIMA-GARCH L'estimation des paramètre ARIMA et GARCH doit se faire conjointement: On initialise les paramètres ARIMA et GARCH par OLS puis on les 'rafine' conjointement par Maximum de Vraisemblance. 19/29
Validation Les résidus ηt du modèle ARIMA-GARCH doivent être un bruit blanc gaussien de variance 1 Le modèle ARIMA-GARCH est validé. 20/29
I/Le problème à résoudre II/ Rappels et modèles classiques de type ARMA III/ Modélisation ARIMA et limitations IV/ Modélisation GARCH des erreurs V/ Prédiction multi-step et performances 21/29
Prédiction multi-step (1): l'espérance du processus à t+h Le modèle est basé sur le processus différencié d'où: Principe - Pour calculer les on itère h fois le modèle en remplaçant les erreurs futures par leur espérance, soit 0. 22/29
Prédiction multi-step (2): la variance l'erreur à t+h Principe - On itère h fois l'équation ARMA en conservant les erreurs futurescar leur variance n'est pas nulle. Les coefficients λi,j n'ont pas d'expression simple et sont calculés numériquement avec la suite: C'est l'équation ARMA mais avec uniquement les erreurs futurs, on peut en effet les séparer grâce à la linéarité de l'équation. 23/29
Prédiction multi-step (2): la variance de Xt à t+h On remplace les dans la première équation (différentiation) pour obtenir l'erreur de prédiction et+h à t+h: Comme les erreurs sont décorrélées, on peut distribuer l'opérateur variance: 24/29
Prédiction multi-step (2): la variance de Xt à t+h Principe - Les sont par définition les σt+j2. Pour le calculer leur espérance, on itère l'espérance de l'équation GARCH. On calcule le terme générale de cette suite puis on remplace dans l'expression de la variance. Finalement : 25/29
Prédiction multi-step (3): La marge d'erreur à t+h On sait que la distribution de l'erreur à t+h est gaussienne centrée, car c'est une somme de gaussienne centrée, d'où 26/29
Mesure des performances On sait que la distribution de l'erreur à t+h est gaussienne centrée, car c'est une somme de gaussienne centrée, d'où Coût Link failure 27/29
Comparaison Le modèle ARIMA-GARCH permet de réduire le coût de la majoration en estimant dynamiquement l'intervalle de confiance • Autres modèles de prédiction: • Persistance (At+10=At) • ONERA (chaîne de Markov à deux échantillons) • NASA (équation stochastique du premier ordre) • Portsmouth Univ. (ARMA adaptatif) • Glamorgan Univ. (neurone linéaire ADALINE) 28/29
Conclusion Le modèle ARIMA-GARCH permet d'améliorer la gestion des risques en modélisant la variance de l'erreur de prédiction. Ce modèle a déjà fait ses preuves dans de nombreux domaines et est couramment utilisé, que ce soit en finance, en architecture (force du vent), en hydrologie (débits des cours d'eau), ou en infrastructures réseau (traffic routier ou internet). Ce modèle semble adapté aux processus ayant un lien avec les turbulences ou avec des systèmes organisés complexes (comportement fractal) qui sont fréquents en géophysique. 29/29