730 likes | 1.1k Views
Ekonometrija 1D. Ekonometrija, Doktorske studije Predavač: Aleksandra Nojković Beograd, školska 2012/13. Struktura predavanja. • Uvodna razmatranja • Jednostavna regresiona analiza i metod običnih najmanjih kvadrata (metod ONK) • Klasi č ni jednostavni linearni regresioni model (KLRM)
E N D
Ekonometrija 1D Ekonometrija, Doktorske studije Predavač: Aleksandra Nojković Beograd, školska 2012/13
Struktura predavanja • Uvodna razmatranja • Jednostavna regresiona analiza i metod običnih najmanjih kvadrata (metod ONK) • Klasični jednostavni linearni regresioni model(KLRM) • Svojstva ocena dobijenih primenom metoda ONK u KLRM • Statisticko zaključivanje u KLRM • Klasični višestruki linearni regresioni model • Pokazatelji kvaliteta ocenjenog modela • Testovi linearnih ograničenja na parametre •Testovi stabilnosti
Neke definicije termina ekonometrija • Naucna disciplina koja se bavi merenjima u ekonomiji. • Nastanak se vezuje osnivanje Ekonometrijskog društva 1930 godine (1933. god. pokreće se časopis “Econometrica”). • Nauka koja primenjuje metode matematičke statistike na ekonomske podatke u cilju analize valjanosti postavki ekonomske teorije (Samuelson, Koopmans,Stone, 1954). • Osnovni zadatak ekonometrije jeste oživljavanje (engl. “to put empirical flesh and blood”)teorijskih struktura (Kennedy, 1998).
Još neke definicije • Ekonometrija označava primenu statistickih metoda na probleme koji interesuju ekonomiste (Ashenfelter, Levine and Zimmerman, 2003) • Problemi se javljaju: - makroekonomiji - mikroekonomiji i - finansijskoj ekonomiji.
Osnovni ciljevi ekonometrije • Utvrdivanje kvantitativne zavisnosti veličina u ekonomskoj relaciji - Modeliranje ekonomskih velicina: koliko se promeni jedna veličina sa promenom druge. • Ispitivanje valjanosti postavki ekonomske teorije - Testiranje konkurentnih hipoteza. • Predvidanje buduceg kretanja ekonomskih veličina na osnovu utvrđene kvantitativne veze.
Ekonometrijska istraživanja se zasnivaju na rezultatima sledećih naučnih disciplina: • Ekonomska teorija (matematicka ekonomija): teorijei ideje su formulisane u formi matematičkih jednacina (bez brojeva). • Ekonomska statistika: prikupljanje i obrada podataka. • Matematička (teorijska) statistika: izvodenje zaključaka o ekonomskim odnosima primenom statistickih metoda (merenje i testiranje hipoteza) na konkretne podatke.
Veza ekonometrije sa drugim naučnim disciplinama • Ekonomija vs. Ekonometrija: Prilagođavanje problemima ekonomskog života se se sastoji u specifikovanju stohastičkih elemenata u ekonomskom ponašanju. • Statistika vs. Ekonometrija: Korišćeni podaci se mogu interpretirati kao slučajan uzorak, na koji se primenjuju statistički metodi prilagođeni radu sa ekonomskim podacima (korigovani metodi statističke nalaize).
Metodologija (faze) ekonometrijskog istraživanja 1. Izbor teorijskog modela 2. Postavka ekonometrijskog modela 3. Prikupljanje podataka 4.Ocena parametara modela 5. Ispitivanje valjanosti ocenjenogmodela 6. Predviđanje
Vrste podataka • Podaci vremenskih serija - Godišnji, kvartalni mesecni, dnevni, kako se obavi transakcija. • Podaci preseka (strukture, uporedni) - Vrednosti različitih promenljivih koje definišu strukturu u datom trenutku vremena. • Podaci panela - Kombinacija podataka vremenskih serija i podataka preseka.
Jednostavna regresiona analiza • Regresiona analiza predstavlja osnovni metodološki okvir ekonometrijskog modeliranja. • Pretpostavimo da raspolažemo podacima o potrošnji i dohotku za odredeni broj slučajnih ispitanika period i da želimo da otkrijemo prirodu njihove međusobne povezanosti (primer: Asteriou and Hall (2007), str.47, tabela 4.2). • Cilj regresione analize jeste utvrđivanje prirode i forme povezanosti između promenljivih.
Primena jednostavne regresije • Pretpostavljamo da je veza između potrošnje i dohotka pozitivna. Hoćemo da opišemo potrošnju kao funkciju dohotka. - Potrošnja: zavisna promenljiva/varijabla (Y) - Dohodak: nezavisna promenljiva/varijabla (X) • U regresionoj analizi zavisna (Y) i nezavisna (X) promenljiva imaju potpuno razlicitu poziciju (razlika sa korelacionom analizom). – Promenljiva Y je stohastickog tipa, što znaci da je slucajna promenljiva koju karakteriše odredena raspodela. – Promenljiva X uzima fiksirane vrednosti iz ponovljenih uzoraka. Ona nije stohasticke prirode. • – Postoji jednosmeran pravac uzrocnosti: samo X utice naY, dok Y ne utice na X.
Populaciona i uzorackaregresiona prava (jednačina) • Populaciona regresiona prava označava stvarnu stohastičku vezu izmedu datih promenljivih (sadrži stvarno b0 i b): za i=1,2,..., n. • Uzoračka regresiona prava opisuje vezu prema datom uzorku: • Stvarni nivo zavisne promenljive je zbir ocenjenog nivoa i onoga što model nije ocenio (reziduala, obeležavaju kao ei). • Uzoracka regresiona prava (jednacina) se koristi za donošenje zakljucaka o parametrima populacione regresione jednacine.
Metod običnih najmanjih kvadrata(metod ONK) • Najcešce korišcen metod postavljanja prave i izbora regresionih koeficijenata jeste metod obicnih najmanjih kvadrata (ONK). • Ideja metoda: minimizirati zbir kvadrata odstupanja podataka od prave.
Ocene metodom ONK • Izvođenje ocena... • Ocene ONK:
Interpretacija ocena bo i b? • b oznacava prirast zavisne promenljive po jedinici prirasta nezavisne. • bo oznacava nivo zavisne promenljive kada je nivo objašnjavajuće promenljive nula (dohodak je nula). • Sa rastom dohotka za jednu jedinicu potrošnja raste za 0.61 jedinica. • Ukoliko je nivo dohotka nula, potrošnja iznosi 15.12 jedinica.
Pretpostavke klasicnog linearnogregresionog modela (KLRM) • Pretpostavke KNLRM/KLRM o εi : • E(εi)=0, za svako i. • Var(εi)=E(εi2)=σ2, za svako i. • Cov(εi,εj)=E(εiεj)=0, za svako i,j, tako da i≠j. • E(εiXi)=0, za svako i. • εi ~ N(0, σ2).
Implikacije navedenih pretpostavki • Ocena b je linearna funkcija slucajne promenljive Yi. • Posledice: – Ocena b je slucajna promenljiva – Ocena b ima normalnu raspodelu.
Svojstva ocena koje su dobijeneprimenom metoda ONK • Ako su zadovoljene pretpostavke KLRM od 1. do 4. tada se primenom metoda ONK dobijaju najbolje linearne nepristrasne ocene (NLNO). • Šta to znaci? • Ocena: b je ocena stvarne vrednosti parametra β. • Linearna: b je linearna funkcija raspoloživih podataka. • Nepristrasna: u proseku ocena b je jednaka parametru β. • Najbolja: ocena je efikasna (nepristrasna ocena sa najmanjom varijansom).
Nepristrasnost/Efikasnost/Konzistentnost • Nepristrasnost Ocene metoda ONK su nepristasne. To znaci da su ocene u proseku jednake parametrima koji se ocenjuju: E(b0)=β0i E(b)= β. • Efikasnost Ocene metoda ONK su efikasne ocene. Ocena je efikasna ako je nepristrasna i ako ne postoji druga nepristrasna ocena koja poseduje manju varijansu. To je nepristrasna ocena sa najmanjom mogućom varijansom. • Konzistentnost Ocene metoda ONK su konzistentne. To znaci da sa porastom obima uzorka ocena konvergira u verovatnoci ka stvarnoj vrednosti parametra. Nepristrasna ocena je konzistentna ako njena varijansa teži nuli sa porastom obima uzorka.
Asimptotska svojstva ocena • Asimptotska nepristrasnost: • Ocena je asim. Nepristrasna ako postaje nepristrasna sa rastom uzorka. • Konzistentana - ako konvergira u verovatnoći ka pravoj vrednosti parametra, kada n teži ka nuli: • Konzistentna: varijansa i pristrasnost (SKG) teže ka nuli kada obim uzorka teži ka beskonačnosti. • Asimptotska efikasnost: konzistentna ocena sa najmanjom asimptotskom varijansom (najbrže konvergira u verovatnoći ka β).
Osobine ocena dobijenih metodom NK i metodom MV • Ocene dobijene metodom NK imaju sve poželjne osobine u malim uzorcima. • Metod maksimalne verodostojnosti (MV) daje ocene parametara koje imaju poželjne asimptotske osobine: konzistentost i asim. efikasnost. • Metod MV se koristi kada su na raspolaganju veliki uzorci i kada se pretposavka o normalnoj distribuciji grešaka može smatrati opravdanom (u opštem slučaju pristrasne u malim uzorcima).
Kako merimo preciznost ocena? • Svaki drugi uzorak daje nove ocene parametara bo i b. Ako se sa promenom uzorka ocene malo razlikuju, onda one imaju malu varijansu i obratno. • Preciznost ocene se meri na osnovu ocene varijanse ocena. • Kvadratni koren iz ocene varijanse je standardna greška ocene. • Da bi se izračunale standardne greške ocena potrebno je prethodno oceniti varijabilitet slučajne greške modela. • U pitanju je ocena parametra (s2).
Ocena varijanse slučajne greške modela (σ2) i ocene varijansi ocena parametara bo i b • Nepristrasna ocena σ2 je: • Sada možemo da analiziramo ocene varijansi ocena parametara bo i b:
Standardne greške ocena parametara biće manje ukoliko je: • Manji stepen stohastičnosti između Xi i Yi, odnosno manja ocena varijanse s2 (manji varijabilitet modela). • Veći varijabilitet objašnjavajuće promenljive Xi (suma kvadrata odstupanja X od aritmetilčke sredine). • Veći uzorak (n). • Standardna greška ocene slobodnog člana zavisi i od aritimeticke sredine podataka za X. (Podaci su udaljeniji od y-ose što je vrednost ove aritmetičke sredine veća. Rezultat: nepreciznija ocena slobodnog člana).
Statističko zakljucivanje u KLRM • Izvođenje zaključaka o svojstvima parametara osnovnog skupa na osnovu ocenjenih regresionih parametara. • Primer: Ocenjen je model oblika: (6.57) (0.04) • Ocena 0.35 je (tackasta) nepoznatog parametra nagiba. Koliko je ta ocena pouzdana? • Odgovor na to pitanje daje standardna greška ocene.
Testiranje hipoteze: osnovni elementi • Interesuje nas da li parametar nagiba uzima tacno odredenu vrednost. • Postavljamo dve hipoteze: nultu (oznaka H0) i alternativnu hipotezu (oznaka H1). • Nulta hipoteza je iskaz ciju valjanost ispitujemo, odnosno testiramo. Alternativna hipoteza obuhvata sva alternativna tvrđenja. • Na primer, interesuje nas da li se zavisna promenljiva menja uistom obimu kao i objašnjavajuca, odnosno da li je β jednako 1. • Koristimo sledeću notaciju: H0 : β =1 H1 : β ≠1
Raspodela verovatnoće ocenadobijenih metodom ONK • Standardizovanjem slučajnih promenljivih b i b0 dobijamo: • Medutim, varijanse ocena su su nepoznate velicine. Ako ih zamenimo odgovorajućim ocenama, tada dobijamo slučajne promenljive sa t-raspodelom (proveriti!)
Testiranje hipoteza: algoritam • Posmatramo model oblika: • Testiramo vaidnost hipoteze: H0: β= β*, H1:β≠ β* • Koraci u postupku testiranja: 1.Ocenjujemo: b, b0, sb, sbona poznati nacin. 2. Racunamo test-statistiku koristeci sledeću formulu: gde je β * vrednost β u uslovima važenja nulte hipoteze.
Testiranje hipoteza: algoritam (nastavak) 3. Sastavni deo testiranja hipoteze je izbor nivoa značajnosti, koji se cesto oznacava saTo jeverovatnoća odbacivanja nulte hipoteze u situaciji kada je ona tačna. Uobičajeno se koristi nivo značajnosti 5%. 4. Definišemo pravilo odlučivanja, kriterijum po kojem odbacujemo nultu hipotezu. Ako je: Odbacujemo H0 kao netačnu uz nivo značajnosti 5%. 5. Konačno sprovodimo testiranja. Ako izračunata test statistika leži u oblasti prihvatanja nulte hipoteze, tada se nulta hipoteza ne odbacuje. Obratno, ako izračunata teststatistika pripada kritičnoj oblasti testa, tada nultu hipotezu odbacujemo za dati nivo značajnosti.
Specijalni tip hipoteze: t-odnos • Pretpostavimo da nas interesuje: H0: β= 0, H1:β≠ 0. Ako je tačna nulta hipoteza, tada objašnjavajuća promenljiva ne utiče na kretanje zavisne promenljive. Na ovaj način proveravamo opravdanost postavke modela. • U tom slučaju opšti oblik test statistike postaje t-odnos, zapravo odnos ocene i odgovarajuce standardne greške ocene:
Klasicni višestruki linearni regresioni model • Analiticki oblik višestrukog linearnog regresionog modela: • Parametri β1, β2,...,βksu parcijalni koeficijenti nagiba. Na primer: ako se X1i poveća za jednu jedinicu, očekivana promena Yi jeβ1 jedinica, pod pretpostavkom da se ne menja uticaj ostalih objašnjavajućih promenljivih X2,X3,...,Xk.
Pretpostavke KLRM (višestrukog) • E(εi)=0, za svako i. • Var (εi)=E(εi2)=σ2, za svako i. • Cov(εi,εj)=E(εiεj)=0, za svako i,j, tako da i≠j. • E(εiXi)=0, za svako i. • εi ~ N(0, σ2). • Ne postoji tačna linearna zavisnost izmedu objašnjavajucihpromenljivih (ni jedna od objašnjavajucih promenljivih se nemože predstaviti kao linearna kombinacija ostalih).
Klasicni višestruki linearni regresioni model (matrična notacija) • U matričnoj notaciji: y=Xβ+ ε, gde su: y (nx1) vektor kolona; X (nxk) matrica; β (kx1) vektor kolona; ε (nx1) vektor kolona. • Matrica X: svaki red predstavlja vrednost svih eksplanatornih prom. koje odgovaraju jednoj opservaciji, a svaka kolona predstavlja sve vrednosti jedne eksplanatorne prom. u uzorku.
Pretpostavke KLRM u matričnoj notaciji • ε ~ N (0,Σ), gde je nula vektor kolona sa elementima jednakim nuli, a Σ je matrica (nxn). • E(εε’)=σ2In, gde je In jedinična matrica tipa (nxn), sa jedinicama na glavnoj dijagonali, sve ostalo su nule. • Elementi matrice X su nestohastički, sa vrednostima fiksiranim u ponovljenim uzorcima, a matrica (1/n)(X’X) je nesingularna i njeni elementi su konačni za bilo koju veličinu uzorka.
Pretpostavke KLRM u matričnoj notaciji (nastavak) • Po prvoj pretpostavci, greška je N distribuirana, a očekivana vrednost je nula za sve opservacije. • Po drugoj pretpostavci, matrica varijansi i kovarijansi grešaka različitih opservacija definisana je kao: -Pretpostavka sadrži dve ranije pretpostavke: odsustvo autokorelacije i homoskedstičnost. • Po trećoj pretpostavci, vrednosti regresora su fiksne za date opservacije, broj opservacija je veći od broja parametara za ocenjivanje i nema perfektne linearne zavisnosti između regresora.
Primena metoda ONK • Primenom metoda ONK dobijaju se najbolje linearne nepristrasne ocene. • Vektor originalnih vrednosti y se može zapisati kao zbir objašnjenih i neobjašnjenih vrednosti modelom: • Da bismo dobili ocene parametara β1, β2,...,βk potrebno je da odredimo minimum rezidualne sume kvadrata: u odnosu na ocene parametara β1, β2,...,βk.
Primena metoda ONK (nastavak) • Izvođenje ocena.... • Vektor ocena je:
Određivanje standardnih grešakaocena u višestrukom modelu • U višestrukom modelu ocenevarijanse σ2je: • U višestrukom modelu ocene varijansi vektora ocena je:
Specifičan tip t-testa: t-odnos • Kao i u slucaju jednostavnog modela, i u višestrukoj regresiji se koristi test-statistika oblika: • Pretpostavimo da je hipoteza od interesa: H0: βi= 0, H1:βi≠ 0i=1,2,...,k. • U uslovima validnosti nulte hipoteze test-statistika je: • Buduci da je u pitanju kolicnik ocene i odgovarajuce standardne greške te ocene, ova statistika se naziva t-odnos. Na ovaj način se proverava značajnost pojedinačnog uticaja svake od objašnjavajucih promenljivih na zavisnu promenljivu.
Korelacija u jednostavnom i višestrukom modelu • Za jednostavni model važi: • U višestrukom modelu sa npr. dve objašnjavajuće promeljive X1 i X2, važi da koeficijent parcijalne korelacije između Y i X1(koeficijent prvog reda ili koef. korelacija po odbitku uticaja X2) odgovara znaku ocenjenog regresionog koeficijenta : • Videti Primer 2, zavinost Y od X1 i X2.
Pokazatelj kvaliteta regresije: koeficijent determinacije • Koji deo varijacija zavisne promenljive je objašnjen modelom, odnosno varijacijama nezavisne promenljive? • Odgovor na to pitanje daje koeficijent determinacije R2. • Ukupni varijabilitet zavisne promenljive definiše se na sledeći način: • Ukupni varijabilitet zavisne promenljive može se predstaviti kao zbir dve komponente: 1. Varijabilitet zavisne promenljive koji je objašnjen modelom: 2. Varijabilitet zavisne promenljive koji nije objašnjen modelom, rezidualna suma kvadrata).
Koeficijent determinacije R2 (III) • Dakle, USK = OSK + RSK • Koeficijent determinacije predstavlja udeo objašnjenog u ukupnom varijabilitetu: • Kako je: OSK = USK - RSK, imamo: • R2 se uvek nalazi u intervalu od 0 do 1.
Ograničenja u primeni R2 kao pokazatelja kvaliteta regresije 1. R2se uvek povećava sa dodavanjem novih objašnjavajućih promenljivih: Regresija 1: yi = β0+ β1x1i + β2x2i + εi Regresija 2: yi = b0 + β1x1i + β2x2i+ β3x3i +εi R2će uvek biti veći u regresiji 2, bez obzira na to kakva je eksplanatorna snaga nove objašnjavajuće promenljive. To je sasvim jasno iz sledećih izraza:
Ograničenja u primeni R2 kao pokazatelja kvaliteta regresije (nastavak) • Odnosno, izraženo preko parcijalnih koeficijenata korelacije: 2. R2je krajnje nepouzdan pokazatelj u regresionoj analizi vremenskih serija kada vrednost, na primer 0.999, ne mora nužno pokazivati ništa.
Korigovani koeficijent determinacije R2 • Koriguje se koeficijent determinacije sa ciljem dobijanja pokazatelja koji se neće neopravdano povećavati sa rastom broja objašnjavajućih promenljivih. • Novi pokazatelj: korigovani koeficijent determinacije • Korigovani koeficijent determinacije je uvek manji od običnog koeficijenta determinacije. Koeficijenti su jednaki samo za jednostavni model bez slobodnog člana.