180 likes | 368 Views
Metoda najmniejszych kwadratów dla jednej zmiennej objaśniającej. dr Grzegorz Szafrański pokój B106 Termin konsultacji: poniedziałek 13.30-15.00 16.30-17.00. Modelowanie – podstawy. Wykorzystanie faktu korelacji zmiennych: przyczynowej (związek przyczynowo-skutkowy i jego stabilność),
E N D
Metoda najmniejszych kwadratów dla jednej zmiennej objaśniającej dr Grzegorz Szafrański pokój B106 Termin konsultacji: poniedziałek 13.30-15.00 16.30-17.00
Modelowanie – podstawy Wykorzystanie faktu korelacji zmiennych: • przyczynowej (związek przyczynowo-skutkowy i jego stabilność), • symptomatycznej (ukryty mechanizm, wspólne przyczyny różnych zjawisk i przybliżenie ich działania przez związaną z nimi zmienną tzw. proxy np. jak np. przyczyny jednokierunkowo zmieniające się w czasie – trend, wykazujące wahania – modele AR, analiza spektralna), • przypadkowej – bezzasadne.
Budowa modelu • Sformułuj problem ekonomiczny • Zilustruj go danymi empirycznymi • Podaj jego teoretyczne rozwiązanie (hipotezy, model ekonomiczny) • Dobierz zmienne objaśniające • Sprawdź teorię za pomocą modelu ekonometrycznego
Weryfikacja modelu • Budowa postaci modelu (liniowy, potęgowy, inny nieliniowy?) • Estymacja modelu (wybór metody, MNK, MNW czy inna?) • Weryfikacja ekonomiczna (czy zgodny z teorią?) • Weryfikacja statystyczna (na ile zgodny z teorią?) • Propozycje poprawy modelu
Problem ekonomiczny Krótki opis problemu: Im większa produkcja tym wyższe koszty, ale rosną one coraz wolniej. Dlaczego? Odpowiedzi szukamy w teorii ekonomicznej: W produkcji występują koszty stałe (nie zależą od wielkości produkcji) i zmienne (zależne). • Jak je wydzielić, gdy mamy dane: Y – koszt całkowity, w mln zł X – ilość produktów, w tys. szt.
Model ekonomiczny • Formułujemy teorię ekonomiczną w postaci „Y zależy od X”: Y = f(X) • Zależność ta może mieć postać liniową Y= a0+a1X i a0>0, a1>0 a0,a1to parametry modelu • Czy istnieje empiryczna zależność między X a Y? • Czy jest ona zgodna z teorią (np. czy a1>0)?
Model ekonometryczny • Przedstawiamy teorię ekonomiczną z dokładnością do zmiennej losowej et i badamy, czy zachodziła w pewnym okresie czasu: t=1,...,T • Sprawdzamy zależność stochastyczną: yt=a0+a1xt + et E(et) = 0, xt nielosowe, stądE(yt) =a0+a1xt D2(et) = E(et2)=s2, E(etet-i) = 0 Zwykle przyjmuje się również postać rozkładu zmiennej et ~ N(0, s2)
Metoda najmniejszych kwadratów model stochastyczny (jedna zmienna objaśniająca): • zależność korelacyjna między zmiennymi • yt=a0+a1xt + et • gdzie t=1,2,...,T • oraz • E(et) = 0, D(et) = s i etdla różnych t nie są skorelowane • Dochodzimy do funkcji regresji I rodzaju: • E(yt) =a0+a1xt
MNK • Estymacja – szacowanie nieznanych parametrów modelu na podstawie próby wg określonego kryterium • Funkcja regresji II rodzaju – wartość teoretyczna: • pt=a0+a1xt • To co zostaje to reszta: et= yt – (a0+a1xt) • Kryterium MNK: minimalizacja sumy kwadratów reszt SSQ dla różnych wartości ocen parametrów a0, a1 • SSQ(a0, a1) = St et2 min
Metoda regresji • Próbujemy poznać nieznane parametry modelu yt=a0+a1xt + et • Poprzez estymację: yt=a0+a1xt + et • Estymator to przepis na a0i a1 np: • a1 =St [(xt - xśrednie)(yt - yśrednie)]/St (xt - xśrednie)2 • a0 =yśrednie -a1xtśrednie
Zadanie • Dokonaj estymacji modelu: • Problemy dostępności danych • Dane w pliku jedna_zmienna.xls Y – koszty w mln złotych, X – ilość w tys. sztuk
Konwencja • Model zwykle zapisujemy: próba: 2001.001 – 2002.008
Miara błędu SEE yt = pt + et Opieramy miarę błędu na sumie kwadratów reszt: Stet 2=St (yt -pt)2 Nieobciążony estymator wariancji składnika losowego otrzymujemy podobnie jak wariancję reszt z próby: S2 = Stet 2 /(ilość stopni swobody) Ilość stopni swobody obliczamy jako różnicę ilości obserwacji i ilości szacowanych parametrów. błąd standardowy SEE to pierwiastek z tej wariancji
Miary dokładności MNK Na całkowitą zmienność igreka SST=St (yt -yśrednie)2 składa się: SST=SSR+SSE St(yt -yśrednie)2 = St(pt-yśrednie)2 +Stet 2 bo (yt -yśrednie)= (pt -yśrednie)+ et i reszty nie są skorelowane z p Współczynnik determinacji R-kwadrat to R2 = SSR/SST=1-SSE/SST R2 = (corr(yt ,pt))2
Źródła danych Rocznik Statystyczny GUS Biuletyn Statystyczny GUS inne materiały GUS i oficjalne informacje rządowe Biuletyn Informacyjny NBP inne materiały NBP (informacja wstępna, dane o inflacji, podaży pieniądza, instrumentach polityki pieniężnej) International Monetary Statistics (rocznik statystyczny MFW) Eurostat, OECD Economic Outlook i wiele innych
Źródła danych Miejsca publikacji danych w internecie: www.stat.gov.pl www.nbp.pl http://europa.eu.int/ European Commission/Eurostat www.oecd.orgwww.worldbank.org portale www.money.plwww.onet.plwww.bossa.pl
Model a rzeczywistość • Jak dalekie uproszczenie rzeczywistości ? • Model niezgodny z rzeczywistością czy na odwrót? • Błędy w obserwacjach – przykłady. • Dane realne czyli wolumeny: • indeksy łańcuchowe • indeksy jednopodstawowe • deflatory deflatory_doit.xls
Do domu Zrobić przykład dla trendu liniowego Przeczytać o założeniach i warunkach stosowalności estymatora KMNK