710 likes | 1.05k Views
Úvod do analýzy časových řad. Doc. Ing. Jana Hančlová, CSc. Katedra matematických metod v ekonomice Ing. Lubor Tvrdý Katedra regionální ekonomiky Ekonomická fakulta, VŠB-TU Ostrava. Obsah prezentace. Cíl analýza časových řad Teoretické základy základní pojmy úpravy časových řad
E N D
Úvod do analýzy časových řad Doc. Ing. Jana Hančlová, CSc. Katedra matematických metod v ekonomice Ing. Lubor Tvrdý Katedra regionální ekonomiky Ekonomická fakulta, VŠB-TU Ostrava
Obsah prezentace • Cíl analýza časových řad • Teoretické základy • základní pojmy • úpravy časových řad • problémy časových řad • Metody analýza časových řad • Diskuse, dílčí závěr
Cíl analýzy časových řad • konstrukce vhodného modelu za účelem: • porozumění mechanismu generující hodnoty časové řady • pochopení podmínek a vazeb působících na vznik těchto hodnot • simulace pomocí modelu • předpověď budoucího chování (historie se opakuje)
Základní pojmy - časová řada Časovou řadou se rozumí posloupnost hodnot ukazatelů, měřených v určitých časových intervalech (zpravidla ekvidistantních) , kde t=1, 2, …, n y = ukazatel t = časová proměnná
Základní pojmy - druhy časových řad Dle charakteru ukazatele • okamžikové • intervalové Dle druhu ukazatele • absolutní • odvozené
Základní soubor (populace) Výběrový soubor Základní pojmy
Základní pojmy - popisné charakteristiky • charakteristiky polohy • charakteristiky variability • míry dynamiky • korelace
Charakteristiky polohy • prostý aritmetický průměr • vážený aritmetický průměr • modus • medián
Základní soubor m - populační průměr x - výběrový průměr - populační směrodatná odchylka s - výběrová směrodatná odchylka Výběrový soubor Interval spolehlivost pro průměr u1-a- pravděpodobnostní kvantil (např. u0,95 = 1,96)
Charakteristiky variability • Rozptyl • směrodatná odchylka
Statistická deskripce Průměrná Odpracované hodiny za rok hodinová mzda N Platná 105808 105808 Chybná 0 0 Průměr 88,46 1668,78 Směr. chyba průměru ,18 1,50 Medián 77,02 1824,00 Modus 40,00 1997,50 61,04 488,94 Směrodatná odchylka Šikmost 9,58 -1,41 Špičatost 230,36 1,92 Minimum 12,67 4,00 Maximum 2843,93 4176,00
Průměrná hodinová mzda počet
Příklad 2 - vývoj míry nezaměstnanosti (u) – Karviná, Znojmo (měsíčně _1995 – 2002)
Příklad 2: Popisné charakteristiky EXCEL Nástroje – Analýza dat – Popisná statistika
Míry dynamiky = str. 4 • absolutní přírůstek (první diference) • koeficient (tempo) růstu • meziroční koeficient růstu • průměrný koeficient růstu • relativní přírůstek
Korelace • Vyjadřuje relativní míru závislosti ve vzájemném vývoji dvou časových řad
Příklad 2_ závislost u_KI a u_ZN Korelace (u_KI, u_ZN)= 0,908 • EXCEL: • CORREL(u_KI;u_ZN) • Nástroje • Analýza dat • Korelace
Stacionární a nestacionární časová řada Stacionární časová řada : • konstantní průměr • konstantní variabilitu • korelace dvou časově posunutých pozorování závisí na délce posunu
Základní úpravy časových řad • doplnění chybějících hodnot • časový posun • sezónní diference • kumulativní součet • vyhlazování časových řad
Doplnění chybějících hodnot Možné přístupy nahrazení: • nulou (např. u bílého šumu) • průměrem či mediánem (okolí či celý soubor) • lineární interpolací • regresí vhodnou křivkou • odhadem na základě známého modelu chování procesu
Časový posun • Časový posun znamená vytvoření časové řady opožděné resp. předbíhající časovou řadu, ale jinak s ní totožnou. Představuje to vlastně posunutí časové řady “dopředu” případně “dozadu” oproti původní časové řadě. Nově vytvořené proměnné mají ovšem na začátku, resp. na konci tolik chybějících hodnot, o kolik kroků se posun prováděl.
Sezónní diference • Sezónní diference je diference mezi okamžiky, vzdálenými o celistvý násobek délky periody. • Diference vyjadřuje velikost změny, ke které došlo mezi dvěma časovými okamžiky měření. Je-li kladná, řada v daném čase roste, je-li záporná, řada klesá. Diferencí se data zbavují lineárního trendu, sezónní diferencí sezónních vlivů.
Kontingenční tabulka EXCEL: Data – kontingenční tabulka a graf
Základní pojmy = kumulativní součet • Opačnou operací k diferenci je kumulativní součet časové řady. = součet pozorování za určitý časový úsek. • Kumulativním součtem bílého šumu = náhodná procházka,protože nikdy nelze předvídat, zda tato funkce se obrátí vzhůru nebo dolů (tzv. procházka “opilého námořníka”). Náhodná procházka je hladší nežli bílý šum, jelikož integrace potlačuje vyšší frekvenční složky a zvýrazní nižší frekvence.
Vyhlazování časových řad • Předpoklad:nahodilá chyba očekávanou hodnotu jednou zvětší a jindy zase zmenší ( tj. její střední hodnota je nulová) a jednotlivé chyby nejsou vzájemně závislé (tj. nekorelované), můžeme pak očekávat, že zprůměrováním několika po sobě následujících pozorování budou se chyby mít tendenci navzájem rušit, zatímco skutečná sledovaná hodnota procesu tím vynikne. Na tomto pozorování jsou založeny metody vyhlazování časových řad.
Problémy časových řad · s volbou časových bodů: o okamžikové, o intervalové; • s kalendářem: o různá délka měsíců (viz vyrovnání různého počtu dní v měsíci str. 9) o různý počet víkendů v měsíci , o různý počet pracovních dnů v měsíci , o pohyblivé svátky; · s délkou časových řad; · nesrovnatelností dat(výběrový vzorek a jeho reprezentativnost v čase)
Příklad 3:Postup analýzy ukazatelů na úrovni obce • Základní deskripce • Analýza vztahů • Závěr
Výběr metody analýzy časových řad • účel analýzy • typ časové řady, · zkušenosti statistika, · dostupná databáze, · softwarové a hardwarové vybavení.
Metody analýzy časových řad • dekompozice časové řady, • Boxova-Jenkinsova metodologie, • lineární dynamické modely, • spektrální analýza časových řad.
Dekompozice časové řady a) trend (Trt), b) sezónní složku (Szt). c) cyklickou složku (Ct). d) náhodnou složku (Et).
Lineární dynamické modely • příčinné (kauzální) modely, v- míra volných pracovních míst u- míra nezaměstnanosti