1 / 27

par Maxim Sytchev 27 novembre 2004 Université de Sherbrooke

Mémoire M.Sc. Prévisions multivariées dynamiques non paramétriques de l’indice S&P/TSX Total Return par le biais de l’analyse des composantes indépendantes (« ICA »). par Maxim Sytchev 27 novembre 2004 Université de Sherbrooke. Plan.

sunila
Download Presentation

par Maxim Sytchev 27 novembre 2004 Université de Sherbrooke

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Mémoire M.Sc.Prévisions multivariées dynamiques non paramétriques de l’indice S&P/TSX Total Return par le biais de l’analyse des composantes indépendantes (« ICA ») par Maxim Sytchev 27 novembre 2004 Université de Sherbrooke

  2. Plan • Justifications de l’utilisation des modèles non paramétriques multivariés pour des prévisions boursières • Présentation de résultats des tests chaotiques • Hurst • Dimension de corrélation • Lyapunov • Présentation du modèle de prévisions • l’analyse en composantes indépendantes (Independent Component Analysis (« ICA ») avecla régression non paramétrique par noyau (« Kernel ») • Analyse d’efficacité des prévisions selon les critères suivants: • Risque / rendement • Direction • Statistiques • Sans test de l’inférence • Avec test de l’inférence (Diebold-Mariano 1995) • Applications futures de notre méthodologie • Conclusion

  3. Notre méthodologie est nettement distinctive • Utilisation de l’ICA pour extraire des facteurs • Prévisions non-paramétriques: amalgamation de ICA et la régression par noyau

  4. Justifications de l’utilisation des modèles non paramétriques multivariés pour des prévisions boursières • Le marché boursier est influencé par des événements « non prévisibles » du monde physique où la linéarité est rare (Gleick 1987) • Barnett and Serletis (2002): “… the economy is subject to shocks from the surrounding nonlinear or chaotic physical environment… “ • Les outils statistiques linéaires ne sont pas suffisamment proche de la réalité selon nos tests linéaires + chaotiques • Régression linéaire • ARIMA • Analyse en composante principales (« PCA ») • Le marché canadien (S&P/TSX Total Return) ne conforme pas à la normalité + démontre la dépendance à longue terme

  5. Marché canadien (titres individuels et S&P/TSX Total Return) • Description de données: • 1. Jan 1952-Dec 1961 (138 titres) • 2. Jan 1962-Dec 1971 (215 titres) • 3. Jan 1972-Dec 1981 (188 titres) • 4. Jan 1982-Dec 1991 (268 titres) • 5. Jan 1992-Dec 2001 (249 titres)

  6. S&P/ TSX Total Return (février 1956-decembre 2001) standardisé 70 60 50 40 30 20 10 0 -1.25 -5.25 -4.25 -3.25 -4.75 -3.75 -2.75 -2.25 -1.75 1.25 2.25 2.75 1.75 3.25 -.75 .75 .25 -.25

  7. Test de dépendance - Hurst Conclusion: il y a une dépendance à long terme

  8. Test de complexité – dimension de corrélation Conclusion: Moins complexe qu’aléatoire, peu de chance d’être chaotique

  9. Test de i.i.d – BDS Conclusion: Non i.i.d.

  10. Test de chaos – Lyapunov selon NEGM (’92;’96) Conclusion: Non chaotique si les ajustements adéquats sont fait

  11. ICA en principe • x sont des vecteurs multivariés utilisés pour rentrer dans ICA ({xi(t)}, i=1,…, n). Nos vecteurs sont des rendements totaux des titres i au temps dans période n (5 période d’extraction) • Assumons que peuvent être reconstruit par le biais d’une mixture linéaire de j facteurs(composantes indépendantes). La mixture est déterminée par la matrice de « factor loading » (sensibilité de chaque titre à une composante). Dérivation des composantes inconnues est faite en trouvant une matrice W • telle que S(t) = y(t) = Wx(t) = WAs(t),ou A est une matrice inconnue • Nous supposons que A est une matrice carrée. Si W=A-1, il y a une séparation parfaite des signaux. En réalité, la matrice W est telle que WA=PD, ou P est une matrice de permutation et D est une matrice diagonale (Tong et al., 1991). Les itérations arrêtent quand les composantes sont complètement indépendantes l’une de l’autre. Ceci est accompli par une minimisation des mesures d’ordres élevés: • kurtosis, • information mutuelle, • negetropies, et • d’autres mesures provenant d’une théorie de l’information

  12. Kernel régression (méthodologie) • Nous adhérons à la théorie de Takens (1981) pour faciliter le lien entre la kernel régression et la théorie des systèmes dynamiques. • Une série scalaire { } ( ) est enclavé (“embedded”) dans un espace à m dimensions ou espaces d’états (“phase space”): ou • = le retard temporel • m = le nombre de dimension de l’espace d’états • t = 1, T-m+1 est la longueur de la série scalaire • Pour faire des prévisions non paramétriques, • identifions l’état présent du système, c’est à dire le vecteur de dimension • Trouvons s < t = 1, T-m+1 espace qui sont “proches” du vecteur présent en terme de proximité spatiale.

  13. Kernel régression (méthodologie) continue • Dès que nous avons obtenues des vecteurs proches, nous évoluons des « images » de ces s vecteurs j pas à la fois: • a la forme générale = • Pour produire des images fidèles, il faut identifier: • Le nombre s des vecteurs • le type de proximité • Le type de noyau (kernel) • L’identification est faite par le biais d’une méthodologie de contre-validation: • La série temporelle est séparée en deux • La première partie est utilisée pour calibrer • La deuxième partie est utilisée pour estimer la correction des prévisions • Un poids différant à partir de noyau (« kernel ») est assigné à chaque de s images • «La moyenne » de s images devient une prévision pour l’état présent du systeme

  14. Proximité Noyaux (« kernels ») Type de proximité et type de noyau

  15. Model de prévision • Extraire des facteurs avec ICA dans 5 periodes • Rassembler les facteurs de chaque période en facteurs continus (« global independent components » = GLIC), qui se repend tous les 5 périodes: • c’est-à-dire composante 1 de période 1 est imbriquée avec composante n de période 2, etc. • Identifier une période d’entraînement – 24 mois (« in-sample out-of-sample ») ou l’optimisation de paramètres est fait de type: • Nombre de s vecteurs • Type de proximité • Type de noyau (« kernel ») • Optimisation de Newton pour déterminer le poids attribués à chacune des GLICs ainsi que S&P/TSX Total Return dans une période d’entraînement • = modèle à 4 variables (3 GLICs et l’indice S&P/TSX Total Return) • Faire des prévisions – 24 mois (« out-of-sample ») de chaque série (3 GLIC et S&P/TSX Total Return avec des régressions à noyau tenant compte des même paramètres que déterminés pendant la période d’entraînement. Combiner les prévisions selon la formule:

  16. Résultats • Nous évaluons nos prévisions en créant une stratégie de « trading » sur 24 mois (Jan 2000 – Dec 2001). • Biais d’une période relativement courte de l’évaluation des prévisions est minimisé par une décision d’investissement chaque mois (24 mois) – position « long » ou « court ». • Notre modèle de trading est évalué contre 12 modèles: • 8 - dynamique non paramétriques multivarié • 1 - dynamique non paramétrique univarié • Naïf • AR(1) • ARMA avec erreurs modélisés par GARCH

  17. Caractéristiques dynamiques du modèle

  18. Stratégie de « trading » mensuelle

  19. Prévisions - sans test de l’inférence

  20. Divergence directionnelle des prévisions

  21. Comparaison entre modèle naïf et univarié

  22. Diebold-Mariano (NN-TSX NN-GLICS)

  23. Prévisions non-paramétriques: conclusions • Surperformance du modèle non-paramétrique NN-TSX NN-GLICS (EUCLIDIAN 1-month) selon des critères: • Non-inferentielle, sauf (MPE), • Directionnelle, • Rendement/risque • Diebold-Mariano: • Erreurs carrés – pas de différence contre aléatoire • Erreurs absolus – différence contre aléatoire, mais pas dynamique univarié

  24. Interprétation des facteurs ICA (GLICs) selon la théorie financière et économiques par le biais de régression « step-wise » • Liquidité domestique et internationale du Canada • Commodités • Le taux d’échange US/Can. • Le portefeuille du marché (S&P/TSX Total Return)

  25. Futures études • Autres algorithmes ICA avec notre modèle de prévision • Analyse des donnés d’autre fréquences (ex. journaliers) ou dans les autres marchés • Corrélation de facteurs ICA avec variables fondamentales (Book/Market, Size, momenum, etc.), momentum ou Fama-French

  26. Conclusion • Les prévisions financières qui incorporent la non linéarité et des outils non paramétriques sont plus performant que les modèles stochastiques paramétriques selon les critères risque / rendement. • Application de ICA en finance doit être de plus en plus répendu car sa performance est hautement supérieure à celle de l’analyse factorielle et PCA (*). • Futurs modèles de prévision devraient incorporer des algorithmes de plus en plus performant de ICA. • Le succès de notre méthodologie confirme indirectement l’utilité de l’analyse technique (Clyde et Osler, ’97; Auloos ’00). (*) Sytchev 2004.

More Related