420 likes | 850 Views
Korelasi & Regresi. Oleh: Bambang Widjanarko Otok. Klasifikasi Pemodelan Regresi. Model Regresi: Satu variabel independent Regresi Linear Sederhana Lebih dari satu variabel independent Regresi Linear Berganda. Tujuan:
E N D
Korelasi & Regresi Oleh: Bambang Widjanarko Otok
Model Regresi: Satu variabel independent Regresi Linear Sederhana Lebih dari satu variabel independent Regresi Linear Berganda. • Tujuan: • mendapatkan pola hubungan secara matematis antara variabel X dan Y • mengetahui besarnya perubahan variabel X terhadap Y • memprediksi Y jika nilai X diketahui
Tahap-Tahap dalam Analisis Regresi • Plot data identifikasibentuk hubungan secara grafik • Koefisien Korelasi identifikasihubungan linear dengan suatu angka 3. Pendugaan (estimasi) model regresi 4. Evaluasi (diagnostic check) kesesuain model regresi 5. Prediksi (forecast) suatu nilai Y pada suatu X tertentu , -1 rxy 1
Korelasi : .Hubungan antara dua variabel (misal X dengan Y) • Nilai Korelasi: • Bila r = 0,atau mendekati 0, Berarti hubungan antara variabel independen dengan variabel dependen sangat lemah atau tidak terdapat hubungan sama sekali. • Bila r = 1,atau mendekati 1, Berarti terdapat hubungan positif antara variabel independen dengan variabel dependen yang sangat kuat. • Bila r = –1,atau mendekati – 1, Berarti terdapat hubungan negatif antara variabel independen dengan variabel dependen yang sangat kuat.
Pengujian Koefisien Korelasi ( r ) Hipotesis Ho : = 0 H1 : 0 Statistik Uji • dimana : r = koefisien korelasi • n = jumlah sampel • Daerah Penolakan • Mencari nilai t tabel untuk tingkat signifikansi () dan derajat bebas sebesar n-2. Sehingga | t0 | > t (/2, n-2) • Kesimpulan: • Ho ditolak jika t0 > t (/2, n-2)atau t0 < t(/2,n-2) • Ho diterima jika t0 > t (/2,n-2) atau t0 < t (/2,n-2)
Korelasi Korelasi Plot antara X dengan Y 40 20 Uji Korelasi 0 0 10 20 [start Matlab demo lecture2.m]
REGRESI LINIER SEDERHANA dimana: Yi = variabel dependent/respon/output Xi = variabel independent/prediktor/input/fixed = intercept i = slope/gradien/koefisien regresi i = unsur gangguan yang diasumsikan identik, independen dan berdistribusi normal atau i ~ IIDN(0,2)
DENGAN Ordinary Least Squares (OLS): Persamaan Regresi:
PENGUJIAN KOEFISIEN REGRESI SECARA SERENTAK HO : model tidak signifikan H1 : model signifikan Statistik Uji: Tolak Ho, jika F-Rasio > F(1,n-2;)
Problem: Regresi Linear Sederhana Biaya Iklan, Jumlah Outlet, Area Pema-saran dan faktor lain yang dapat dikontrol dalam kondisi TETAP Bagaimana pengaruh harga terhadap sales suatu produk ? Dapatkah meramal sales suatu produk berdasarkan harganya ? Controllable Factors F1, F2, …, Fq Process (Model Regresi) Output (Y) Input (X) Z1, Z2, …, Zq Harga Produk Sales Produk Uncontrollable Factors Harga Pesaing, Selera Konsumen, Kondisi Ekonomi Nasional (inflasi dll) dan faktor lain yang tidak dapat dikontrol dalam kondisi TETAP
Regresi Linier 40 26 24 Temperature 22 20 20 30 40 20 30 20 10 0 10 0 10 20 0 0 Given examples Predict given a new point [start Matlab demo lecture2.m]
26 24 22 20 30 40 20 30 20 10 Prediction 10 0 0 40 Temperature 20 0 0 20
Sum squared error Ordinary Least Squares (OLS) Error or “residual” Observation Prediction 0 0 20
Probabilistic interpretation 0 0 20 Likelihood
Minimize the sum squared error Sum squared error Linear equation Linear system
Problem : Data hasil pengamatan …(continued) Plot antara Harga dan Sales Pengamatan dilakukan dengan mengambil secara random data 10 minggu penjualan
Problem : MINITAB output …(continued) MTB > Correlation 'Harga' 'Sales'. Pearson correlation of Harga and Sales = -0.863 P-Value = 0.001 MTB > Regress 'Sales' 1 'Harga' The regression equation is Sales = 32.1 – 14.5 Harga Predictor Coef SE Coef T P Constant 32.136 4.409 7.29 0.000 Harga -14.539 3.002 -4.84 0.001 S = 2.725 R-Sq = 74.6% R-Sq(adj) = 71.4% Analysis of Variance Source DF SS MS F P Regression 1 174.18 174.18 23.45 0.001 Residual Error 8 59.42 7.43 Total 9 233.60
Model Regresi Linier Berganda dimana: Yi = variabel dependent/respon/output Xi = variabel independent/prediktor/input/fixed i = parameter/koefisien regresi i = unsur gangguan yang diasumsikan identik, independen dan berdistribusi normal atau i ~ IIDN(0,2)
KOEFISIEN DETERMINASI • KEGUNAAN: • Mengukur ketepatan atau kecocokan suatu garis regresi yang diterapkan terhadap suatu kelompok data hasil observasi. Makin besar nilai R2 dikatakan model regresi semakin tepat atau cocok, sebaliknya makin kecil nilai R2 dikatakan model regresi tidak tepat untuk mewakili data hasil observasi. • Mengukur proporsi atau prosentase dari jumlah variasi Y yang dapat diterangkan oleh model regresi.
KOEFISIEN KORELASI PARSIAL Korelasi parsial merupakan ukuran hubungan linier antara variabel Y dengan X1 dan X2 dibuat tetap atau sebaliknya. Nilai koefisien korelasi parsial ry1,2 artinya korelasi Y dengan X1 dikontrol dengan X2.
RESIDUAL IDENTIK INDEPENDEN DISTRIBUSI NORMAL
DISTRIBUSI NORMAL • Penerapan metode kuadrat terkecil (Ordinary Least Squares/OLS) tidak memerlukan / membuat asumsi apapun mengenai distribusi pada residualnya. Asumsi pada residual yang diperoleh diharapkan mempunyai nilai (rata-rata) nol, tak berkorelasi dan mempunyai varians konstan. Dengan adanya asumsi ini, penaksir OLS memenuhi beberapa sifat statistik yang diinginkan, seperti ketidakbiasan (unbiased) dan varians minimum. • Karena hal tersebut di atas dan tujuan penarikan kesimpulan mengenai persamaan regresi populasi, dalam konteks regresi biasanya resudal diasumsikan mengikuti distribusi normal. • Pengujian ini dilakukan untuk mengetahui apakah residual dari model berdistribusi normal dengan mean nol dan varians 2.
PEMERIKSAAN DISTRIBUSI NORMAL • Tentukan residual ei dari persamaan regresi • Sortir ei dari urutan yang terkecil sampai yang besar • Hitung Pi yang sesuai dengan ei yang telah disortir 4. Plot Pi dengan ei Jika pola tersebut membentuk sudut mendekati 450, maka asumsi normal terpenuhi.
PEMERIKSAAN IDENTIK (HOMOSKEDASTISITAS) HOMOSKEDASTISITAS HETEROSKEDASTISITAS
Apakah Y=Perubahan Laba Bank dipengaruhi Oleh:X1 = Gross Profit Margin X2 = Interest Margin on Loans X3 = Operating Efficiency Ratio X4 = Ratio Non Performing Loans to Total Loans
Persamaan Regresi: Y=-5,633 + 0,637X1 – 37,41X2 + 8,680 X3 + 17,531X4
Pemeriksaan ASUMSI pada Error
DAFTAR PUSTAKA • Mason Robert D, 1996, Teknik Statistika untuk BISNIS & EKONOMI, Jilid I dan II, PT Gelora Aksara Pratama • Spiegel, M.R., 1961, Theory and Problem of Statistics, McGraw-Hill. Company. • William Mendenhall dan James E.R., 1993, Statistik untuk Manajemen dan Ekonomi, penerbit Erlangga, Jilid I dan II. • Suharyadi & Purwanto, S.K.2000. Statistika Untuk Ekonomi & Keuangan Modern, Salemba Empat.