230 likes | 472 Views
REGRESI LINIER. Disampaikan pada pelatihan analisis data Umm Inn 3 Juli 2011.
E N D
REGRESI LINIER Disampaikan pada pelatihan analisis data Umm Inn 3 Juli 2011
Pada umumnya ilmu ekonomi mempelajari hubungan-hubungan antara variabel ekonomi. Hubungan-hubungan yang fungsional tersebut mendefinisikan ketergantungan variabel terikat pada variabel-variabel bebas dalam bentuk yang spesifik --- linear, kuadratik, logaritma, eksponensial atau hiperbola. Hubungan antara X dan Y yang berbentuk Y = f(x) dikatakan “deterministik” (pasti) atau “nir-stokastik”, jika setiap nilai variabel bebas (X) terdapat satu nilai variabel terikat (Y). Sedangkan suatu hubungan antara X dan Y dikatakan “stokastik”, jika suatu nilai X tertentu terdapat distribusi probabilitas menyeluruh dari nilai Y.
Dalam kasus stokastik, setiap nilai X tertentu, variabel terikat (Y) dapat memiliki beberapa nilai dengan probabilitas yang tertentu. MODEL REGRESI LINIER SEDERHANA Bentuk paling sederhana dari hubungan stokastik antara dua variabel X dan Y disebut “model regresi linear” Alasan penyisipan faktor “e” antara lain adalah : • Karena kesalahan persamaan • Karena kesalahan dalam pengukuran (kesalahan dalam
variabel) --- faktor gangguan dapat mewakili kesalahan-kesalahan dalam pengukuran baik dalam pencatatan, pengumpulan maupun pengolahan data. • Karena ketidaksempurnaan spesifikasi bentuk matematis model --- mungkin persamaan yang sebenarnya bukan linear atau kesalahan yang berkaitan dengan jumlah persamaan model. Bentuk persamaan di atas merupakan bentuk persamaan yang paling sederhana. Dengan menambahkan satu atau lebih variabel bebas, pada model persamaan regresi linear sederhana akan berbentuk model regresi linear berganda.
Pembentukan model empiris akan sangat ditentukan oleh bentuk model teoritis yang melandasi kerangka analisa serta keberadaan data / fakta yang terjadi pada keadaan realitanya. Sejumlah model linear tersaji, baik linear dalam variabel dan linear dalam parameter, dapat diturunkan menjadi model estimasi. Adapun bentuk-bentukalternatif model terpilih dapat dirumuskan sebagai berikut : a) Model linear, b) Model Log Linear, c) Model Log Lin, d) Model Lin Log, Model Reciprocal
ASUMSI-ASUMSI KLASIK DAN KONSEKUENSINYA Sejumlah asumsi terhadap penggunaan pendekatan OLS (Ordinary Least Square) sebagai salah satu alat estimasi guna mencapai parameter yang BLUE (Best Linear Un-biased Estimator) antara lain adalah : Tetapnya nilai varian (asumsi homoskedastisitas), tidak berkorelasinya antar variabel bebas (non Multikolinearitas), tidak berkore-lasinya antara variabel pengganggu (non serial correlation)/
non otokorelasi) dan asumsi normalitas. ASUMSI HOMOSKEDASTISITAS Salah satu asumsi klasik dalam model regresi linear adalah bahwa variabel pengganggu (e) mempunyai varians yang sama dari satu pengamatan ke pengamatan lainnya, yakni sebesar 2. Apabila variansnya berbeda disebut heteroske-dastisitas. Kondisi hetero ini timbul apabila kita menggunakan data cross section. Cara mengetahui Heteroskedastisitas : (a) dengan cara me-lihat nature of problem, yaitu sifat dari masalah yang di-teliti, misalnya dengan melihat hasil penelitian terdahulu / pengalaman masa lalu, (b) dengan menggunakan metode
grafik (graphical method) yaitu dengan menyusun scatter diagram antara : Apabila scatter diagram itu semakin melebar atau me-nyempit, maka ada kemungkinan terjadi heteroskedasti-sitas, (c) melalui pengujian-pengujian. Untuk pengujian dapat dilakukan dengan :*) Atau antara • Data yang tidak dikelompokkan : Uji Park, Uji Gleyser dan Uji korelasi jenjang Spearman • Data yang dikelompokkan : Uji Chi-Square
*) berdasarkan uji Park, hasil analisis regres untuk menak-sir model Yi = + Xi + i diperoleh = 36,429; R2 = 0,845; = 0,0589 dengan Sb = 0,011 dan tb hitung = 5,231; artinya ada hubungan yang bermakna antara X dengan Y. Sedangkan berdasarkan hasil regres untuk menaksir ln e2i dengan menggunakan ln Xi (model ln e2i = + Xi + i) diperoleh = - 0,076; R2 = 0,027; = 0,394 dengan Sb = 1,067 dan tb hitung = 0,370; artinya tidak ada hubungan yang bermakna antara ln e2i dengan ln Xi yang berarti tidak terjadi heteroskedastisitas dan model tersebut dapat dipergunakan untuk peramalan.
Berdasarkan uji Korelasi Rank Spearman (dapat diterap-kan pada sampel yang berukuran kecil) dengan rumus : Yang dikorelasikan adalah antara kesalahan pengganggu (dalam nilai mutlak) dengan variabel X. Apabila korelasi jenjang Spearman mendekati 1 dan mempunyai makna melalui uji t, maka dianggap ada heteroskedastisitas. Uji t untuk korelasi ini adalah :
Diperoleh hasil : t hitung lebih kecil dari pada t tabel, maka hipotesis yang menyatakan ada heteroskedastisitas ditolak (Ha ditolak, Ho diterima). Untuk regresi berganda, pengujian dilakukan untuk sewtiap X terhadap variabel pengganggu secara terpisah.
Apabila ada pengaruh heteroskedastisitas, di mana varians berbeda, maka model itu akan : • Mempunyai koefisien regresi yang masih BLUE • Varians b tidak lagi minimum • Kemampuan prediksi rendah • Terjadi misleading, misalnya t, F, R tinggi tapi heteros-kedastis atau t, F dan R rendah yang juga heteroske-dastis. Jalan keluar yang bisa ditempuh apabila ada heteroske-dastis adalah melakukan transformasi model.
OTOKORELASI Dalam suatu model regresi asumsi yang harus dipenuhi adalah tidak adanya oyokorelasi antara kesalahan peng-ganggu periode t dengan kesalahan pengganggu pada pe-riode (t – 1) atau tidak ada serial korelasi. Sebab-sebab terjadinya otokorelasi antara lain adalah : (1) kelambanan : besar kemungkinan terjadi pada data histo-ris. Perubahan situasi ekonomi biasanya tidak terjadi de-ngan segera, biasa lamban, dan tergantng besarnya penga-ruh variabel-variabel yang ikut menentukan panjangnya si-klus dan kecepatan perubahan; (2) spesifikasi bias : apabila dalam suatu model tidak mengikutsertakan suatu atau beberapa variabel, padahal variabel tersebut relevan, maka dapat menimbulkan otokorelasi (penghilangan sejumlah
variabel penjelas); (3) kesalahan spesifikasi bentuk model matematis yang dipilih sebagai model empiris : misalnya yang seharusnya model itu non linier, tetapi dipaksa secara linier, maka akan menimbulkan otokorelasi pada kesa-lahan pengganggu; (4) pengaruh time lag : apabila variabel dependen tidak hanya dipengaruhi oleh variabel indepen-den, tetapi juga oleh variabel dependen pada periode sebe-lumnya. Pengujian Nonotokorelasi Cara untuk menguji apakah model tersebut bersifat otoko-relasi atau tidak dapat dipergunakan Uji Durbin – Watson.
Untuk mendeteksi adanya otokorelasi Durbin – Watson mempergunakan rumus : Cara pengujian : (a) Uji otokorelasi positif, (b) Uji otokore-lasi negatif, (c) Uji otokorelasi dua sisi.
Uji otokorelasi positif Durbin – Watson menyatakan bahwa apabila angka statis-tik d 0, maka ada otokorelasi positif. Ho : Tidak otokorelasi positif Ha : Ada otokorelasi positif Di mana : d < dL berarti d adalah bermakna (signifikan) sehingga menerima hipotesis alternatif yang menyatakan ada otokorelasi positif. d > dU berarti d adalah tidak bermakna (tidak signifikan) sehingga menerima hipotesis nol yang menyatakan tidak ada otokorelasi positif. dL < d < dU berarti pengujian tidak dapat memberikan keputusan (inconclusive --- ragu-ragu)
Uji otokorelasi negatif Pada kasus otokorelasi negatif , pengujiannya adalah : d > 4 – dL berarti d adalah bermakna (signifikan) sehingga menerima hipotesis alternatif yang menyatakan ada otokorelasi negatif. d < 4 – dU berarti d adalah tidak bermakna (tidak signi- fikan) sehingga menerima hipotesis nol yang menyatakan tidak ada otokorelasi negatif. 4 – dU < d < 4 – dL berarti pengujian tidak dapat membe- rikan keputusan (inconclusive --- ragu-ragu)
Uji otokorelasi dua sisi Pada kasus otokorelasi uji dua sisi , pengujiannya adalah : d < dL berarti d adalah bermakna (signifikan) sehingga me- nerima hipotesis yang menyatakan ada otokorelasi. d > 4 – dL berarti d adalah bermakna (signifikan) sehingga menerima hipotesis yang menyatakan ada otokore- lasi. dU < d < 4 – dU berarti ?????
MULTIKOLINEARITAS Multikolinearitas atau kolinearitas ganda merupakan suatu keadaan di mana hubungan linier yang sempurna antara variabel-variabel penjelas atau variabel bebas. Untuk mendeteksi atau mengetahui suatu model regres mempunyai kolinearitas ganda atau tidak dapat dilakukan : • Berdasarkan tanda-tanda : (a) koefisien determinasi gan-da tinggi; (b) koefisien korelasi tinggi; (c) nilai F hitung tinggi; (d) tidak satupun (sedikit sekali) variabel-variabel bebasnya memiliki uji t yang siginifikan. • Jika hanya ada dua variabel bebas, apabila korelasi antar dua varaiebl tersebut tinggi, maka ada indikasi dalam kodel tersebut terdapat kolinearitas. Akan tetapi apabila
model tersebut mempunyai lebih dari dua variabel bebas, dan diperolej korelasi antara dua variabel rendah tidak berati model tersebut tidak ada kolinearitas ganda. • Apabila nilai determinan dari (X – X) adalah sangat kecil, dapat dijadikan petunjuk terjadinya kolinearitas ganda dan apabila sama dengan nol, berati kolinearitas ganda itu adalah sempurna. • Apbila koefisien determinasi gandanya tinggi, tetapi koefisien determinasi partialnya rendah dibandingkan dengan koefisien determinasi simultannya, berarti ada kolineraitas ganda. • Mengadakan uji F antar variabel penjelas. Jika ternyata signifikan, maka dapat dianggap ada kolinearitas ganda. Jika tidak siginifikan, maka variabel –variabel bebas dapat dipertahankan.
Akibat adanya multikolinearitas antara lain adalah : • Dengan semakin meningkatnya kolinearitas, probabili-tas melakukan kesalahan tipe 2 pada hipotesis (meneri-ma hipotesis yang pada hakekatnya salah) akan semakin besar. • Pengujian masing-masing koefisien regresi tidak satupun yang bermakna --- atau hanya satu yang bermakna (walaupun koefisien determinasinya tinggi) Terapi yang dapat digunakan dengan adanya multikoli-nearitas antara lain adalah : • Mengadakan penggabungan antara data cross-section dan time series, yang disebut dengan pooling data
Mengeluarkan salah satu variabel bebasnya dari model. • Mentransformasi variabel yang ada dalam model. • Menambah data baru atau memperbesar ukukran sampel.