330 likes | 463 Views
Ekonometrika. Program Studi Statistika, semester Ganjil 2012/2013. Pengujian Asumsi-asumsi di dalam Regresi Linier. Galat menyebar normal Multikolinearity Heteroskedasticity Autocorrelation Misspecification: Peubah bebas yang kurang tepat Measurement errors
E N D
Ekonometrika Program Studi Statistika, semester Ganjil 2012/2013 Dr. Rahma Fitriani, S.Si., M.Sc
PengujianAsumsi-asumsididalamRegresi Linier • Galatmenyebar normal • Multikolinearity • Heteroskedasticity • Autocorrelation • Misspecification: • Peubahbebas yang kurangtepat • Measurement errors • Bentukfungsional yang salah
Asumsikenormalan • Pelanggaran, dengankemungkinanpenyebab: • Sebaranpeubaheksogenatauendogennyatidak normal • Pelanggaranasumsilinieritas • Sebarangalatmenjulurkarenaadanyapencilan • Ukuransampel yang terlalukecil • Efekpelanggaran: • Pencilanberpengaruhbesarterhadappenduga parameter (bias) • Hasilpengujiantidaksah • Selangkepercayaanterlalulebaratauterlalusempit
AsumsiKenormalan • Bagaimanamendeteksinya? • Normal probability plot • Histogram darisisaan • Chi square goodness test of fit • Anderson Darling normality test • Jarque Berra normality test • Jikadilanggar, bagaimanamemperbaikinya? • Transformasi non linier padapenyebab 1 atau 2 • Padapenyebab 3, pencilanharusdievaluasipenyebabnya • Murnikesalahan: pencilandapatdibuang • Apaadanya: pencilanmemberikaninformasitambahanpadahasilanalisis • Perbesarukuransampeluntukpenyebab 4 • Transformasi: sesuaikandenganpermasalahanteoriekonomi yang ingindianalisis • Ukuransampel yang diperbesardapatmemperbaikinya
Multikolinieritas • Terdapathubungan linier diantarapeubaheksogen • Multikolinieritassempurna: • Satupeubaheksogenadalahfungsi linier daripeubaheksogen yang lain
Multikolinieritas • Efekdarimultikolinieritas: • Sampeldipakaiuntukmendugakoefisienv1danv2
Multikolinieritas • Untukmemperolehpendugaβ1danβ2 : solusidaripersamaanberikut: • 2 persamaanuntuk3 peubah • Tidakadasolusiunikbagipenduga parameter populasi • Efekdaristrukturmatriksakibatsatukolom yang merupakanfungsi linier darikolom yang lain: Matriks singular
Karenadeterminanmatriks singular = 0 • Tidakdapatdiperoleh inverse dariX’X pada: Karena: • Koefisienregresimenjadi ‘indeterminate’
Multikolinieritastaksempurna • Terjadijikaterdapathubungan linier yang tidaksempurnaantarpeubaheksogen • Denganvsebagaigalatacak yang tidaksamadengannol • Kasusiniseringterjadipadakasusterapan • Bagaimanamengidentifikasiseberapaseriusderajatmultikolinieritas yang terjadi.
EfekdariMultikolinieritastaksempurna • Penduga OLS tetapdapatdiduga • Penduga OLS tetapbersifat BLUE • Penduga OLS tetapefisien (ragamdaripenduga paling kecildarisemuapenduga yang mungkin) • Akantetapipadanilai yang cukupbesar • Relatiflebihbesarjikatidakadamultikolinieritas
EfekdariMultikolinieritastaksempurna • Ragamdanperagamdaripenduga OLS relatifbesar • Selangkepercayaanmenjadilebihbesar • Lebihbanyakmenerimahipotesisnol (koefisientidaknyata) • Statistikuji t darisatuataubeberapakoefisienmenjaditidaknyata • WalaupunR2secarakeseluruhanbesar • Tandabagipendugakoefisienberkebalikandenganteori a priorinya
StrukturRagamPeragamdenganadanyaMultikolinieritas • Padamultiple regression: • Dengan 2 peubaheksogen:
StrukturKorelasidinamakandengan Variance Inflation Factor (VIF) • SemakinbesarmultikolinieritasmakasemakinbesarVIF • Semakinbesar VIF semakinbesarragampenduga OLS
Untukregresilebihdari 2 peubahdefinisidari VIF: Koefisiendeterminasidariauxiliary regression • Auxiliary regression: regresidenganXjsebagaipeubah endogen, danXselainnyasebagaipeubaheksogen
Nilai VIF berdasarkanKoefisienDeterminasidari Auxiliary Regression • VIF yang naikseiringdengankenaikankoefisiendeterminasi • VIF yang lebihdari 10: bukticukupuntukmultikolinieritas
PendeteksianMultikolinieritas • Dari koefisienkorelasisederhana • Efektifuntukregresidengan 2 peubaheksogen • Dari VIF, multikolinieritasseriusjikar ≥ 0.9 • Dari koefisiendeterminasi auxiliary regression • Efektifuntukregresidengan 3 peubaheksogenataulebih • Peubaheksogenpadaauxiliary regression : peubah yang mempunyaimasalahmultikolinieritas • Hasildariauxiliary regression: • Standar error yang kecil • Statistikujit yang nyatabagimasing-masingkoefisien
Contoh: • Model regresidengan 2 peubaheksogen, • Duapeubaheksogentsbmempunyaikorelasitinggi: • Dari matrix korelasiberikut: • KeduaXberkorelasipositifdenganY • AntarXberkorelasipositif
Output daripendugaan Model RegresidenganKeduaPeubah Model 1: OLS, using observations 1-25 Dependent variable: Y coefficient std. error t-ratio p-value ------------------------------------------------------- const 35.8677 19.3872 1.850 0.0778 * X2 -6.32650 33.7510 -0.1874 0.8530 X3 1.78976 8.43832 0.2121 0.8340 Mean dependent var 169.3680 S.D. dependent var 79.05857 Sum squared resid 39658.40 S.E. of regression 42.45768 R-squared 0.735622 Adjusted R-squared 0.711587 F(2, 22) 30.60702 P-value(F) 4.41e-07 Log-likelihood -127.5882 Akaike criterion 261.1765 Schwarz criterion 264.8331 Hannan-Quinn 262.1907
Output model regresidenganmemakaiX2saja Model 2: OLS, using observations 1-25 Dependent variable: Y coefficient std. error t-ratio p-value -------------------------------------------------------- const 36.7186 18.5695 1.977 0.0601 * X2 0.832012 0.104149 7.989 4.39e-08 *** Mean dependent var 169.3680 S.D. dependent var 79.05857 Sum squared resid 39739.49 S.E. of regression 41.56686 R-squared 0.735081 Adjusted R-squared 0.723563 F(1, 23) 63.81897 P-value(F) 4.39e-08 Log-likelihood -127.6138 Akaike criterion 259.2276 Schwarz criterion 261.6653 Hannan-Quinn 259.9037
Output model regresidenganpeubahX3saja Model 3: OLS, using observations 1-25 Dependent variable: Y coefficient std. error t-ratio p-value -------------------------------------------------------- const 36.6097 18.5764 1.971 0.0609 * X3 0.208034 0.0260332 7.991 4.37e-08 *** Mean dependent var 169.3680 S.D. dependent var 79.05857 Sum squared resid 39721.74 S.E. of regression 41.55758 R-squared 0.735199 Adjusted R-squared 0.723686 F(1, 23) 63.85778 P-value(F) 4.37e-08 Log-likelihood -127.6082 Akaike criterion 259.2164 Schwarz criterion 261.6541 Hannan-Quinn 259.8925
Output dariauxiliary regression • RegresiX2terhadapX3 Model 4: OLS, using observations 1-25 Dependent variable: X2 coefficient std. error t-ratio p-value ----------------------------------------------------------- const -0.117288 0.117251 -1.000 0.3276 X3 0.250016 0.000164318 1522 4.83e-059 *** Mean dependent var 159.4320 S.D. dependent var 81.46795 Sum squared resid 1.582488 S.E. of regression 0.262305 R-squared 0.999990 Adjusted R-squared 0.999990 F(1, 23) 2315090 P-value(F) 4.83e-59 Log-likelihood -0.974992 Akaike criterion 5.949985 Schwarz criterion 8.387736 Hannan-Quinn 6.626113
Bagaimanamengatasinya? • Do nothing • Rule of Thumb Procedure • A priori information • Combining cross sectional and time series data • Dropping a variable(s) and specification bias • Transformation of variables • Additional or new data
Do Nothing • Multikolinieritasadalahmasalahakibatketidaksempurnaan data • Untuk data ekonomi: tidakdapatdikontroldantidakadapilihan • Pendugasecarakeseluruhantetapdapatdipakaiwalaupunpendugasecaraindividurelatifkurangefisiendantidaksignifikan
A priori information • Informasidaripenelitiansebelumnyamengenaihubunganfungsionalantar parameter peubah yang berkorelasi • DenganX2 yang berkorelasitinggidenganX3 • Misal: • X2: pendapatan, X3: Kekayaan, Y: konsumsi • Diketahuidaripenelitiansebelumnyabahwaperubahankekayaanterhadapperubahankonsumsiadalah 1/10 perubahanpendapatanterhadapperubahankonsumsi
Lakukantransformasiterhadapkeduapeubaheksogendenganhubungansesuai (*) • Lakukanpendugaanmenggunakanpeubah yang sudahditransformasi
Menggabungkan data cross section dan time series • Misalkan: • Y : jumlahpenjualanmobil • P : rata-rata hargamobil • I : pendapatan • Pada data time series, PdanIcenderungberkorelasi • β2: adalahelastisitashargaterhadapjumlahpenjualanmobil • β3: adalahelastisitaspendapatanterhadapjumlahpenjualanmobil
Jikaterdapat data cross section (padasatuwaktu) yang dapatdipakaiuntukmendugakoefisienelastisitaspedapatanβ3 • Denganasumsibahwapadasatuwaktuhargatidakterlalubervariasi • Gunakanpendugabagiβ3untukmelakukantransformasiterhadapY
Dropping a variable(s) and specification bias • Membuangsalahsatudaripeubah yang berkorelasi • Masalah: • Jikasemuapeubahsecaraekonomiharusadadidalam model: specification bias • Jikapendapatandankekayaanmemangharusadadidalam model konsumsi • Tujuanperbaikanmultikolinieritasdapatmemunculkanmasalahbaru: specification bias • Tetapgunakandua-duanya
Transformation of variables • Contohpada data time series pada • X2: pendapatan, X3: Kekayaan, Y: konsumsi • DenganX2 yang berkorelasitinggidenganX3seiringdenganwaktu • Padawaktutberlaku: • Model yang samadapatberlakupadawaktut-1
Untukmeminimumkanmultikolinieritas, dilakukanpembedaandari model diwaktutdanwaktut-1 • First difference form • Regresidilakukanpadamasing-masingpeubah yang sudahdibedakan • Korelasidiantarapeubahbeda (∆X2 dan∆ X3) tidaksebesarkorelasidaripeubahaslinya
Additional or new data • Jikamultikolinieritasterjadiakibatpengambilansampel • Penambahanukuransampeldapatmengurangiefekdarimultikolinieritas Ragamlebihkecil/lebihefisien Komponeninidiasumsikantetap Sampelbertambahakanmemperbesarnilaikomponenini