1 / 35

Modely s kvalitatívnymi vysvetľujúcimi premennými

Modely s kvalitatívnymi vysvetľujúcimi premennými. Kvalitatívne premenné. Kvalitatívne premenné môžmeme „kvantifikovať“ vytvorením takzvaných umelých premenných , ktoré nadobúdajú hodnoty 0 a 1 0 indikuje absenciu sledovaného atribútu 1 indikuje prítomnosť sledovaného atribútu

zena
Download Presentation

Modely s kvalitatívnymi vysvetľujúcimi premennými

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Modely s kvalitatívnymi vysvetľujúcimi premennými

  2. Kvalitatívne premenné • Kvalitatívne premenné môžmeme „kvantifikovať“ vytvorením takzvaných umelých premenných, ktoré nadobúdajú hodnoty 0 a 1 • 0 indikuje absenciu sledovaného atribútu • 1 indikuje prítomnosť sledovaného atribútu • Napríklad premenná rozlišujúca pohlavie môže byť kvantifikovaná ako žena=1 a muž=0 alebo opačne. • Umelé premenné sú často nazývané aj kategorickými premennými alebo kvalitatívnymi premennými. • Príklady: pohlavie, náboženstvo, národnosť, geografický región, politická príslušnosť

  3. Pasca umelých premenných (dummy variable trap) • Pokiaľ model obsahuje lokujúcu konštantu a kvalitatívna premenná má m kategórii, potom do modelu zavádzame len (m-1) umelých premenných. • Napr. pohlavie má len dve kategórie takže do modelu zavedieme len jednu umelú premennú. • Je tomu tak pretože umelá premenná pri ženách nadobúda hodnotu 1 a pri mužoch 0 • Pokiaľ by sme skúmali napr. politickú príslušnosť v USA medzi Demokratmi, Republikánmi a nezávislými stranami zaviedli by sme do modelu dve umelé premenné ktoré by reprezentovali príslušnosť k trom stranám • Pokiaľ toto pravidlo nieje dodržané, dôjde k tomu čo sa niekedy nazýva aj ako pasca umelých premenných (dummy variable trap)-situácia dokonalej závislosti medzi vysvetlujúcimi premennými

  4. Referenčná kategória • Kategória pri ktorej premenná nadobúda hodnotu 0 je často označovaná ako referenčná kategória. • Všetky porovnania sú robené vo vzťahu k referenčnej kategórii. • Pokiaľ je v modeli viac umelých premenných venujte zvýšenú pozornosť sledovaniu referenčnej kategórie, inak bude obtiažne interpretovať výsledky.

  5. Čo si treba pamätať o umelých premenných • Pokiaľ je v regresnom modeli zahrnutá lokujúca konštanta, počet umelých premenných musí byť o jedno menej ako počet obmien kvalitatívnej premennej. • Pokiaľ je model odhadnutý bez lokujúcej konštanty, je možné do neho zahrnúť taký počet umelých premenných aký je počet kategórií kvalitatívnej premennej. • Koeficient pri umelej premennej je vždy interpretovaný vo vzťahu k referenčnej kategóri. • Umelá premenná môže byť v interakcii s kvantitatívnymi vysvetľujúcimi premennými rovnako tak ako aj s kvalitatívnymi vysvetľujúcimi premennými. Pokiaľ model obsahuje niekoľko kvalitatívnych premenných s rôznymi kategóriami, zavedenie premenných pre všetky kombinácie spotrebuje veľký počet stupňov voľnosti-

  6. Interpretácia umelých premenných • Koeficient pri umelej premennej znamená rozdiel v lokujúcich konštantách medzi kategóriou pri ktorej sa umelá premenná rovná 1 a referenčnou kategóriou • Lokujúca konštanta z modelu s umelými premennými je konštantou kategórie ktorá je označená ako 0.

  7. Interpretácia umelých premenných • Ak: Yi = B1 + B2 Fi kdeY = mzda aF = umelá premenná rozlišujúca pohlavie • potom, v priemere, ženy zarábajú mzdu (B1 + B2) a zarábajú mzduB1. (všimnite si že B2môže byť negatívne) • Takže ženy zarábajú o B2 viac ako muži.

  8. Neviem štatistiku ale vôbec to nevadí, pretože aj tak nemám žiadne údaje.

  9. Časové rady

  10. Čo je časový rad?? Údaje o skúmanomsociálno- ekonomickomjave - chronologickyusporiadané v čase  správnezostavenýčasovýradúdajovmusíspĺňaťporovnateľnosťúdajov: • v čase ( zarovnakodlhéobdobia, resp. rovnakévzdialenostimedziskúmaním) • v priestore ( rovnakéúzemnécelky, regióny) • a vecnúporovnateľnosť (metodologickú, obsahovú)

  11. Označme hodnoty skúmanéhoukazovateľa: y1, y2 , y3 , ... yt …… yT,kde t = 1, 2, ….T, pričom T je počet období, t je teda formálna časová premenná, ktorá udáva poradie hodnoty skúmaného ukazovateľa , napr. HNP SR na obyv. V rr.95-99 v US$

  12. Z hľadiska dĺžky obdobiaza ktoré skúmamehodnoty ukazovateľa, resp. dĺžky intervalu medzi jednotlivými skúmaniami ČR členíme na: • dlhodobé- ročné údaje, resp. päťročné • krátkodobé- kvartálne, mesačné údaje, resp.Jednodňové a pod.

  13. Ak niečo skúmate takto z blízka riskujete že stratíte prehľad o celkovom kontexte

  14. Základnécharakteristikyrozboručasovýchradov • Absolútne miery rastu (poklesu): • absolútny prírastok (pokles) - prvé diferencie  y t = y t - y t -1 • druhé druhé diferencie (zrýchlenie)  y t 2 =  y t -  y t -1

  15. Relatívnemieryrastu • koeficientrastu : k t = y t / y t - 1 (bezrozmernéčíslo, napr. 1, 05, resp. 0.86) • koeficientprírastku : k t  = k t - 1 • tempo rastu (koef. Rastu v %): Tt= k t . 100 , ( hovorínakoľko %vzrástol, resp. poklesolukazovateľ, napr. 105%, alebo 86% • tempo prírastku: Tt =Tt - 100, resp. Tt = (k t - 1 ) . 100 (hovorí o koľko % vzrástol / poklesolukazovateľ v aktuálnomobdobíoprotíprechádzajúcemu)

  16. Vývoj HNP SR za rr.95-99 v US$ na obyv. a rok. V roku 1997 oproti r. 96 vzrástol HNP na obyv. na 108,12% V roku 1997 oproti r. 96 vzrástol HNP na obyv. o 8,12%

  17. Z jednotlivých koeficientov rastu možnovypočítaťpriemerný koeficient rastu _ 4 k = (1,148.1,081. 1,003 . 0,974)= 1.0493 Za obdobie rr. 95-99 HNP v SR rástol ročne približne o 4,9%

  18. Rozborjednotlivýchzložiekčasovéhoradu Časové rady vznikajú ako dôsledok pôsobenia podstatných aj nepodstatných činiteľov na skúmaný sociálno ekonomický jav. Tieto činitele môžeme rozdeliť na: trendové - vývojové, ktoré pôsobia neustále a určujú hlavný smer vývoja, t.j. trend v ČR (Tt )periodické, ktoré spôsobujú pravidelné kolísanie hodnôt ČR okolo trendu, môžeme ich rozdeliť na • cyklické (C t )- v dlhodobých ČR (hospodárske cykly) • sezónne (S t )- krátkodobých ČR (sezónne kolísanie cien, sezónny dopyt…..),

  19. náhodnéčinitele(E t ) - pôsobianáhodne, nepravidelne. Tietočinitelepôsobianavývojkaždéhoskúmanéhoukazovateľa v štatistike Na základetohtorozčleneniamôžmedekomponovať - rozložiť ČR na tri zložky: • trendovú(Tt) • periodickú(C t ), resp. (S t ) • náhodnú(E t ) Medzizložkamimôžebyť : • aditívnyvzťah : Yt = T t+ St + Et • multiplikatívnyvzťah: Yt = T t. St . Et

  20. Analýzatrendu v časovomrade Pridekompozičnomprístupe je analýzatrenduzaložená: • naanalytickomvyrovnanívývojahodnôtskúmanéhoukazovateľavhodnoutrendovoufunkciou • ide o analógiujednoduchejregresnejanalýzy, pričomodhadovanéhodnotysúfunkcioučasovejpremennejt, yt, = f (t) • trendováfunkcia je potompoužitánielenkuhodnoteniukvalityprognózy “ex-post”, ale ajnaprognózy “ex-ante”

  21. Historické údaje Oblasť prognózy “ex-ante”

  22. Štatistické posúdenie vhodnosti trendovej funkcie: • pomocou indexu korelácie i yt, resp. • indexu determinácie iyt2 • ktoré vyjadrujú kvalitu prognózy “ex-post” • Prioritné je však vecné posúdenie vhodnosti trendovej • funkcie, pretože je potrebné zvažovať ako sa “asi” môže • skúmaný ukazovateľ v budúcich obdobiach vyvíjať

  23. Analýza sezónnej zložky v časovom rade Dekompozičný prístup predpokladá sa: • multiplikatívny model ČR: Yt = Tt . St . Et • analýzu trendu v ČR (ak je prítomný) vhodnou trendovou funkciou: Tt = yt, = f(t) • analýzu sezónnej zložky potom pomocou sezónnych indexov: kde y t , sú hodnoty získané vyrovnaním časového radu vhodnou trendovou funkciou pre t = 1,2…T

  24. Postup analýzy a konštrukcie prognózy: • Najskôranalyzujeme trend vyrovnanímčasovéhoraduvhodnoutrendovoufunkciou (pomocou regresnej analýzy) • Podľatrendovejfunkcievypočítame “vyrovnané” hodnotytrendu (uskutočnímeprognózutrenduajnakvartályprognózovaného r. 1990) • Indexysezónnosti S t vypočítamedelenímskutočnejhodnotytržieb y t hodnotou y t ‘ vypočítanou podľa trendovej funkcie • Indexy sezónnosti spriemerníme (aby sme objektivizovali sezónnu zložku a potom korigujeme na súčet 4 (korekcia na presnosť)

  25. Analýza sezónnosti a prognóza Prognóza Y t ‘ . Stpriem. Indexy sezónnosti Vyrovnané hodnoty trendu Výsledná Prognóza trendu a sezónnosti Prognóza trendu

  26. Vzťah medzi množstvom prognóz a šancou že aspon jedna bude správna

  27. Použitie umelých premenných pri sezónnych dátach • Proces odstránenia sezónnej zložky z časového radu výsledný časový rad je očistený o sezónnosť • Uvažujme nasledujúci model predikujúci tržby z predaja oblečenia: KdeD2 =1 pre druhý kvartál, D3 =1 pre tretí kvartál, D4= 1 pre 4thkvartálSales = reálne tržby na tisíc štvorcových stôp priestoru predajne.

  28. Použitie umelých premenných v sezónnych údajoch • Proces očistenia časového radu od sezónnosti je nasledujúci: • 1. Z odhadnutého modelu získame eohadovaný objem tržieb. • 2. Odhadovaný objem tržieb odčítame od skutočných tržieb a získame reziduá. • 3. K získaným reziduám pripočítame (výberovú) priemernú hodnotu tržieb. Výsledné hodnoty sú časovým radom tržieb ktorý je očistený od sezónnosti.

  29. FRISCH-WAUGHOVTEORÉM • Zavedením umelých premenných do modelu očistíme od sezónnosti všetky časové rady použité v danom modeli. • Ak použijeme v regresii časové rady sezónne očistených údajov, získané odhady sú rovnaké ako odhady koeficientov z regresia ktorá používa neočistené údaje ale umelé premenné pre zohľadnenie setónnosti.

  30. Miery presnosti prognóz

  31. Miery presnosti prognóz • Chybou prognózy sa nazýva rozdiel: • Priemerná chyba: • Môže byť kladná alebo záporná podľa toho či prognózy častejšie podhodnocujú (yt>predikované y), alebo nadhodnocujú (yt<predikované y) skutočnosť.Táto miera sa považuje za mieru skreslenia a interpretuje sa podľa znamienka ME>0 model systematicky podhodnocuje ME<0 nadhodnocuje skutočnosť

  32. Priemerná absolútna chyba: • Vyjadruje priemernú absolútnu odchýlku skutočných hodnôt od odhadnutých hodnôt v rovnakých merných jednotkách v akých je vyjadrený pôvodný časový rad • Priemerná štvorcová chyba – rozptyl chýb: • -citlivé na veľké chyby

  33. Percentuálne miery • Priemerná percentuálna chyba: • Priemerná percentuálna miera skreslenia, ak je kladná znamená to že model systematicky podhonocuje skutočnosť (väčšina chýb je kladná) a naopak.

  34. Priemerná absolútna percentuálna miera chyba: • Vyjadruje v percentách priemernú veľkosť chýb prognóz v porovnaní so skutočnými hodnotami na celom úseku prognózovania, t=1,2,....,n

  35. Štatistika pre testovanie hypotéz a vašej trpezlovosti ;-)

More Related