590 likes | 933 Views
KORELASI DAN REGRESI Pertemuan 10-11. KORELASI. Analisis korelasi bertujuan untuk mengetahui pola dan keeratan hubungan antara dua atau lebih variabel. “ C orrelation does not imply causation”, atau korelasi tidak mengisyaratkan kejadian sebab akibat. ARAH KORELASI.
E N D
KORELASI • Analisis korelasi bertujuan untuk mengetahui pola dan keeratan hubungan antara dua atau lebih variabel. • “Correlation does not imply causation”, atau korelasi tidak mengisyaratkan kejadian sebab akibat.
ARAH KORELASI • Arah korelasi menunjukkan pola gerakan variabel Y terhadap gerakan variabel X. Terdapat tiga arah korelasi, yaitu 1. Positive correlation. 2. Negative correlation. 3. Nihil correlation.
ARAH KORELASI • Inverse Correlation (Negative Correlation)
KOEFISIEN KORELASI • Koefisien korelasi sering dilambangkan dengan huruf (r). Koefisien korelasi dinyatakan dengan bilangan, bergerak antara 0 sampai +1 atau 0 sampai -1. • Notasi positif (+) atau negatif (-) menunjukkan arah hubungan antara kedua variabel. • Notasi positif (+) berarti hubungan antara kedua variabel searah (positive correlation), jika variabel satu naik maka variabel yang lain juga naik. • Notasi negatif (-) berarti kedua variabel berhubungan terbalik (negative correlation), artinya kenaikan satu variabel akan dibarengi dengan penurunan variabel lainnya.
KOEFISIEN KORELASI • Jika nilai r > 0, artinya telah terjadi hubungan yang linier positif (positive correlation), yaitu makin besar nilai variabel X makin besar pula nilai variabel Y, atau makin kecil nilai variabel X makin kecil pula nilai variabel Y. • Jika nilai r < 0, artinya telah terjadi hubungan yang linier negative (negative correlation), yaitu makin besar nilai variabel X makin kecil nilai variabel Y, atau makin kecil nilai variabel X maka makin besar pula nilai variabel Y. • Jika nilai r = 0, artinya tidak ada hubungan sama sekali antara variabel X dan variabel Y. • Jika nilai r = 1 atau r = -1, maka dapat dikatakan telah terjadi hubungan linier sempurna, berupa garis lurus, sedangkan untuk r yang makin mengarah ke arah angka 0 (nol)maka garis makin tidak lurus.
KORELASI PRODUCT MOMENT • Analisis korelasi Pearson digunakan untuk jenis statistik parametrik. • Beberapa asumsi yang digunakan apabila dilakukan analisis korelasi product moment atau korelasi Pearson,antara lain : • Distribusi nilai dari variabel berdistribusi normal atau mendekati normal. 2. Dua variabel yang akan dicari korelasinya adalah variabel kontinu yang bersifat rasional atau minimal bersifat interval. 3. Hubungan dari kedua variabel yang akan dikorelasikan adalah linier.
Contoh :Berikut data umur domba produktif, dengan produksi susu yang diteliti. Hasil penelitian sebagai berikut :
Langkah-langkah SPSS adalah sebagai berikut : 1. Entrilah data ke lembar kerja SPSS. 2. Klik Analyze, Correlate, Bivariate. • Pindahkan variabel umur dan susu ke kolom Variables, pada Correlation Coefficients, pilih Pearson. • Test of Significance, pilih Two-tailed. • Aktifkan Flag significant correlations, ini berguna untuk menampilkan tanda apabila hasilnya signifikan.
Langkah-langkah SPSS 3. Klik Options. Aktifkan pilihan Means and Standard deviations. 4. Klik Continue, OK.
INTERPRETASI • Angka koefisien korelasi adalah 0,951, sangat signifikan artinya hubungan antara umur dengan susu sangat erat. Koefisien korelasi bertanda positif (+) artinya terdapat hubungan antara umur dengan susu sangat erat. Koefisien korelasi bertanda positif (+) artinya terdapat hubungan positif antara umur domba dengan produksi susu, semakin tua domba pada umur produktif maka produksi susu juga meningkat. • Tanda ** menunjukkan bahwa koefisien korelasi tersebut signifikan pada taraf kepercayaan 99%. Kalau tanda bintangnya hanya satu (*) menunjukkan signifikan pada level kepercayaan 95%.
Soal Latihan • Berikutini data mengenaihubunganantarahasilpenjualandanbiayaiklandarisebuahperusahaan. • Buatlah diagram pencardari data-data tersebut! • Denganmenggunakankorelasi Pearson, carilahnilaikorelasidantentukanjenisnya!
KORELASI RANK SPEARMAN • Metode ini mengukur keeratan hubungan berdasarkan ranking dari masing-masing data sehingga disebut rank correlation coefficient. • Sebelum dianalisis, terlebih dahulu data disusun berdasarkan ranking terhadap data lain.
Contoh :Akan diteliti hubungan antara tinggi semai (cm) dengan jumlah helai daun (helai) pada suatu persemaian.
Penyelesaian dengan SPSS : 1. Entrilah data ke lembar kerja SPSS. 2. Klik Analyze, Correlate, Bivariate 3. Pindahkan variabel tinggi dan daun ke kolom Variables pada Correlation Coefficients pilih Spearman. 4. Klik OK.
INTERPRETASI • Koefisien korelasi antara tinggi dengan jumlah daun adalah 0.943, biasanya angka yang mendekati nilai 1 atau (-1) berarti sangat signifikan. • Tanda ** menunjukkan bahwa koefisien korelasi tersebut signifikan pada taraf kepercayaan 99%. Nilai 0,943 (positif), artinya bahwa semakin tinggi semai akan mempunyai jumlah daun yang lebih banyak (positive correlation).
Soal Latihan • Berikutini data mengenainilaimatematikadanstatistikadari 10 mahasiswa. • Hitunglahkoefisienkorelasiranknya (dengankorelasi Spearman)! • Sebutkanjeniskorelasinyadanapaartinya!
REGRESI • Analisis regresi menjadi sangat terkenal dan banyak digunakan karena ada beberapa yang istimewa di dalam analisis regresi, di antaranya : • Di dalam analisis regresi sudah termasuk analisis korelasi antara variabel independen (X) yang juga sering disebut faktor-faktor penyebab, dengan variabel dependen (Y). • Selanjutnya dengan persamaan regresi yang didapat kita bisa membuat peramalan apa yang akan terjadi dengan Y apabila terjadi perubahan pada X, sebaliknya jika kita menginginkan nilai Y tertentu, kita dapat mengestimasi seberapa besar faktor-faktor X akan diubah untuk mewujudkan tujuan kita.
ASUMSI DALAM REGRESI Beberapa asumsi yang harus dipenuhi dalam melakukan analisis regresi adalah : • Variabel random diasumsikan independen terhadap X. Artinya bahwa nilai kovarian adalah nol antara variabel independen dan tingkat kesalahan yang berhubungan untuk tiap pengamatan. • Variasi random diasumsikan terdistribusi secara normal. Artinya bahwa untuk masing-masing variabel independen kesalahan dari prediksi diasumsikan terdistribusi normal. • Variabel random diasumsikan memiliki varian yang terbatas. • Rata-rata variabel random sama dengan nol. • Kesalahan prediksi terhadap X tidak bergantung dari masing-masing variabel X. • Variabel-variabel independen tidak saling berkorelasi. • Jumlah data harus lebih besar dari jumlah variabel.
REGRESI LINIER SEDERHANA Disebut regresi sederhana karena analisis ini hanya berkaitan dengan dua variabel saja, satu disebut variabel independen atau variabel bebas, biasanya diberi notasi X, sedangkan variabel satunya disebut sebagai variabel dependen atau variabel bergantung yang biasa diberi notasi Y. Regresi linier sederhana mengikuti persamaan di bawah ini : Y = a + bX + e Dimana : Y = merupakan variabel bergantung (dependent variable) X = sebagai variabel bebas (independent variable) a = sebagai konstanta regresi b = slope atau kemiringan garis regresi e = error
Contoh :Sebuah perusahaan yang bergerak di bidang perikanan sedang menganalisis tingkat keasinan atau salinitas tambak dengan produktivitas tambaknya, data-datanya sebagai berikut :
PENYELESAIAN DENGAN SPSS • Entrilah data ke lembar kerja SPSS. • Klik Variable View di pojok kiri bawah. • Pada kolom Name isikan sesuai dengan nama variabelnya, variabel pertama diberi nama Salinitas dan variabel kedua diberi nama Produksi. • Klik Analyze, Regression, Linear. • Pindahkan variabel Salinitas sebagai variabel bebas ke kolom independent(s), dan variabel Produksi sebagai variabel tergantung ke kolom dependent. • Klik menu Statistics, tandai Estimates, Confidence intervals, Model fits dan Descriptives. Kemudian klik Continue.
PENYELESAIAN DENGAN SPSS Pada kotak Regression Coefficients terdapat beberapa item yaitu : • Estimates, berguna untuk memperkirakan hasil analisis regresi. Jika pilihan ini tidak diaktifkan, koefisien regresi tidak akan ditampilkan sehingga kita sulit membuat persamaan regresinya. • Confidence intervals, merupakan interval taraf kepercayaan dari persamaan regresi yang didapat. Pada interval taraf kepercayaan akan ditampilkan lower bound dan upper bound kurva normal. • Covariance matrix, akan menampilkan matrik varian/kovarian. • Model fit, akan menampilkan analisis regresi yang disertakan analisis varian atau uji F regresi. Uji F ini berguna untuk mengetahui semua variabel independen (variabel bebas) yang berpengaruh terhadap variabel dependen (variabel bergantung).
PENYELESAIAN DENGAN SPSS 7. Klik Options. • Use probability of F digunakan untuk menentukan taraf kesalahan berapa variabel independen yang akan dikeluarkan dari persamaan dan taraf kesalahan berapa variabel independen yang akan dimasukkan dalam persamaan. Pada kondisi default, variabel independen akan masuk dalam persamaan jika kesalahannya kurang dari 0.05 (5%) dan dikeluarkan jika lebih dari 0.1 (10%). • Use F value juga digunakan untuk menentukan taraf kesalahan berapa variabel independen yang akan dikeluarkan dari persamaan dan taraf kesalahan berapa variabel independen yang akan dimasukkan dalam persamaan. Kalau pada Use probability of F, angka yang digunakan adalah angka probabilitas, Use F value menggunakan nilai F pada tabel. • Include constant in equation digunakan untuk menampilkan konstanta persamaan garis regresi. 8. Pada pilihan Missing Values pilih Replace with mean artinya data-data yang hilang digantikan dengan rata-rata. 9. Klik Continue, OK
OUTPUT Tabel Descriptive Statistics Produktivitas tambak rata-rata = 68,63 ton Salinitas/Kadar garam rata-rata = 285,63 Standar deviasi produktivitas = 10,059 ton Standar deviasi kadar garam = 87,785 n (jumlah seluruh data) = 16 data
OUTPUT Tabel Correlation Korelasi Pearson (Pearson Correlation) = 0,891 Nilai 0,891 adalah nilai r hitung. Angka tersebut menunjukkan terjadi korelasi yang sangat kuat antara kadar garam dengan produktivitas udang di tambak. Hubungan bersifat positive correlation, artinya penambahan kadar garam akan menambah produktivitas udang. Sig (1-tailed) atau probabilitas = 0,000 Untuk mengetahui apakah nilai r hitung tersebut signifikan atau tidak, maka perlu dibandingkan dengan r tabel atau dengan melihat probabilitasnya. Korelasi dikatakan signifikan, jika r hitung lebih besar dari r tabel (r hitung > r tabel) atau nilai probabilitas kurang dari taraf kesalahan (0,05). Terlihat probabilitasnya 0,000 < taraf signifikansi 0,05,berarti menunjukkan korelasi/hubungan yang signifikan. n atau jumlah yang dianalisis = 16
INTERPRETASI Tabel Variables Enteres/Removed • Variables Entered (variabel yang masuk persamaan). Variabel independen akan dimasukkan dalam persamaan berdasarkan kriteria Use Probability of F Entry 0,05 dan Removal 0,10. Dari hasil analisis, dapat dilihat bahwa variabel salinitas memenuhi syarat sehingga dimasukkan dalam persamaan. • Variables Removed (variabel yang dikeluarkan dalam persamaan). Dapat dilihat tidak ada variabel predictor yang dikeluarkan. • Method (metode) merupakan pilihan metode yang digunakan dalam hal ini yaitu metode Enter. Sebenarnya masih terdapat beberapa metode lain, tetapi akan lebih relevan jika metode-metode tersebut dibahas dalam bagian regresi berganda. Tabel Model Summary • Salah satu tabel yang mempunyai arti sangat penting dalam analisis regresi adalah Tabel Model Summary, karena menyangkut nilai koefisien korelasi dan koefisien determinasi. • Rdisebut juga dengan koefisien korelasi. Nilai R menerangkan tingkat hubungan antara variabel independent (X) dengan variabel dependent (Y). Dari hasil analisis didapat nilai koefisien korelasi sebesar 0,891, berarti bahwa hubungan antara salinitas dan produksi adalah sebesar 89,1% (pada tabel ini tidak dituliskan nilai korelasi tersebut positif atau negatif). • R Square disebut koefisien determinasi. Koefisien determinasi menerangkan seberapa variasi Y yang disebabkan oleh x. Dari tabel dapat dibaca nilai R square (R2) sebesar 0,793, artinya bahwa variasi yang terjadi terhadap banyak produktivitas tambak sebesar 79,35 disebabkan oleh variasi kadar garam di tambak dan sisanya hanya sebesar 20,7% dipengaruhi oleh hal-hal lain di luar persamaan ini. • Adjusted R square merupakan nilai R2 yang disesuaikan sehingga gambarannya lebih mendekati mutu penjajakan model dalam populasi. Dimana n = jumlah sampel k = jumlah parameter • Std. Error of the Estimation merupakan kesalahan standar dari penaksiran, bernilai 4,372.
INTERPRETASI Tabel Anova Pada analisis kali ini kita menggunakan model regresi linier sederhana dengan model persamaan Y = a + bX. Apakah pilihan model tersebut sudah tepat? Dapat diterima? Mengapa tidak menggunakan model lain saja? Pertanyaan tersebut dijawab dengan melihat nilai F hitung pada tabel ANOVA di atas. Dari hasil komputasi didapat nilai F hitung sebesar 53,791. • Untuk menguji apakah model linier Y = a + bX tersebut sudah tepat atau belum, maka F hitung pada tabel anova perlu dibandingkan dengan F tabel. F hitung = 53,791 F tabel dilihat pada : Taraf signifikansi 5% -df pembilang = jumlah variabel – 1 = (2 – 1) = 1 -df penyebut = jumlah data – jumlah variabel = (16 – 2) = 14 F tabel = 4,60 Karena F hitung > F tabel, dapat disimpulkan bahwa model linier Y = a + bx sudah tepat dan dapat digunakan. • Selain membandingkan F hitung dengan F tabel ada cara yang lebih mudah untuk menentukan ketepatan model di atas, yaitu dengan membandingkan probabilitas (pada tabel Anova tertulis Sig) dengan taraf nyatanya (α = 0,05 atau 0,01). Jika probabilitas > 0,05 maka model ditolak. Jika probabilitas < 0,05 maka model diterima. • Dapat dilihat nilai probabilitas (Sig) adalah 0,000 < 0,05 berarti model diterima atau dapat disimpulkan bahwa bentuk persamaan linier Y = a + bX sudah tepat dan dapat dipertanggungjawabkan.
INTERPRETASI • Tabel Coefficients Kolom Unstandardized Coefficients Constant (Konstanta) = 39,471 Konstanta untuk X (salinitas) = 0,102 Dari sini didapatkan persamaan regresi Y = 39,471 + 0,102X • Kolom t Uji t berguna untuk menguji signifikansi koefisien regresi (b), apakah variabel independent (X)berpengaruh secara nyata atau tidak. • Hipotesis Ho = kadar garam tidak berpengaruh nyata terhadap produktivitas tambak. Ha = kadar garam mempengaruhi produktivitas tambak. • Pengambilan Keputusan Jika –t tabel < t hitung < t tabel, maka Ho diterima. Jika t hitung < -t tabel atau t hitung > t tabel, maka Ho ditolak. t hitung sebesar 7,334 t tabeltingkat signifikansi 0,05 derajad bebas = jumlah sampel – jumlah variabel = (16 – 2) = 14 dimana dilakukan 2 sisi (2 tailed) t tabel (0.05; 14) = 2,510 Karena t hitung > t tabel maka Ho ditolak, artinya bahwa kadar garam berpengaruh secara nyata (signifikan) terhadap produktivitas tambak. Pengambilan keputusan juga dapat dengan melihat probabilitasnya dimana nilainya 0,000 < 0,05.
Soal Latihan • Berikutini data mengenaipengalamankerjadanpenjualan. X : pengalamankerja (tahun) Y : omzetpenjualan (ribuan) • Apakahpengalamankerjaberpengaruhsecarasignifikanterhadapomzetpenjualan? • Tentukannilai a dan b sertatentukanpersamaanregresinya! • Berapaomzetpenjualandariseorangkaryawan yang pengalamankerjanya 3,5 tahun?
REGRESI LINIER BERGANDA • Membahas hubungan antara satu variabel dependen dengan beberapa variabel independen atau yang sering disebut sebagai regresi berganda. Dinamakan berganda bukan berarti variabel bebasnya berjumlah dua, tetapi bisa berjumlah dua atau lebih. • Rumus matematis untuk regresi berganda adalah sebagai berikut : Y = a +b1X1 + b2X2 + b3X3 + … + bnXn Atau secara lengkap dapat juga ditulis sebagai berikut : Y = a +b1X1 + b2X2 + b3X3 + … + bnXn + e • Dimana : Y = variabel dependen (bergantung) a = koefisien/konstanta regresi b1,2,3 = koefisien untuk variabel X1, X2, X3 dan seterusnya X1,2,3 = variabel independen pertama, kedua, ketiga dan seterusnya. e = error
Contoh :Faktor utama yang mempengaruhi produktivitas padi tadah hujan adalah curah hujan dan dosis pemupukan. Berbasis data yang telah dikumpulkan, seseorang ingin mengetahui seberapa besar curah hujan dan pemupukan berpengaruh terhadap produktivitas padi.
PENYELESAIAN DENGAN SPSS • Entrilah data dalam lembar kerja SPSS. • Klik Variable View di sebelah kiri bawah lembar kerja. • Kolom label digunakan untuk memperjelas informasi tentang variabel yang dimaksud. Pada kolom Label, berilah nama produktivitas untuk variabel Y, curah hujan untuk X1, dan pemupukan untuk X2. • Klik Analyze, Regression, Linear. Pindahkan variabel produktivitas (Y) sebagai variabel bergantung ke kolom Dependent serta variabel curah hujan (X1) dan pemupukan (X2) sebagai variabel bebas ke kolom Independent(s).
Perhatikan pada kolom Method. Menu ini merupakan menu pilihan metode regresi yang hendak digunakan, terdapat beberapa metode yang disajikan dalam SPSS, yaitu : Metode Enter Adalah metode analisis biasa dimana semua variabel bebas dimasukkan sebagai variabel prediktor, tidak memandang pengaruh apakah variabel tersebut berpengaruh besar atau kecil pada variabel bergantung (kriterium). 2. Metode Stepwise Digunakan untuk analisis regresi secara bertahap dengan tujuan pokok untuk mencari variabel yang paling dominan. 3. Metode Remove Digunakan untuk mencari prediktor yang dominan dan bila variabel prediktor tidak berpengaruh, akan dibuang(di-remove). 4. Metode Backward Menganalisis variabel dari belakang, artinya semua variabel dianalisis kemudian dilanjutkan menganalisis pengaruh variabel-variabel bebasnya lalu variabel yang tidak berpengaruh dibuang. 5. Metode Forward Menganalisis variabel dari depan, maksudnya semua variabel pertamanya dianggap tidak berpengaruh semua, kemudian variabel yang berpengaruh dimasuk-masukkan.
PENYELESAIAN DENGAN SPSS 5. Klik Options • Use Probability of F menunjukkan nilai probabilitas dimana sebuah variabel akan dimasukkan dalam persamaan atau dikeluarkan dari persamaan harga entry di sini adalah 0,05. Artinya, jika nilai probabilitas X1 atau X2 kurang dari 0,05, akan dimasukkan dalam persamaan. Harga removal 0,1 artinya jika nilai probabilitas X1 dan X2 lebih dari 0,1, variabel tersebut akan dikeluarkan dari persamaan. • Use F Value, jika memilih opsi ini, Anda harus memasukkan harga entry dan harga removal. Nilai entry harus lebih besar daripada nilai removal. Dalam keadaan default, harga entry = 3,84 dan harga removal 2,71. • Exclude cases listwise menganalisis case-case yang hanya memiliki harga valid dari semua variabel. • Exclude cases pairwise menganalisis koefisien korelasi dari seluruh case yang berharga valid dari semua variabel yang dikorelasikan. • Replace with mean menggantikan missing value dengan rata-rata variabel. 6. Pilih probabilitas entry 0,05 dan harga removal 0,1; exclude case listwise, kemudian klik Continue. 7. Klik Statistic. 8. Aktifkan kotak estimates dan model fit, abaikan yang lain,klik continue. 9. Klik OK.
INTERPRETASI • Tabel Variables Entered/Removed Tabel ini memberikan informasi tentang variabel-variabel independen yang kurang berpengaruh terhadap variabel dependen sehingga akan dikeluarkan dari persamaan. Dapat dilihat pada kolom variables removed tidak terdapat variabel yang dikeluarkan. • Tabel Model Summary • Menerangkan besarnya korelasi (R), koefisien determinasi (R2), koefisien determinasi yang disesuaikan (adjusted R2) dan standar error. • Koefisien korelasi (R) sebesar 0,975, mendekati nilai1 artinya hubungan antara variabel-variabel independen (X1, X2) dan dependen (Y) sangat erat. Korelasi antara variabel dependen dan independen bersifat positif. Artinya, jika nilai X naik, maka akan direspon dengan kenaikan nilai Y. • Koefisien determinasi (R2) sebesar 0,951, artinya bahwa 95,1% produksi padi tadah hujan dipengaruhi oleh faktor curah hujan dan pemupukan. Sedangkan 4,9% (100% - 95,1%) karena faktor-faktor lain yang tidak dapat dijelaskan dalam persamaan regresi tersebut. • Koefisien determinasi dapat dihitung dengan mengkuadratkan koefisien korelasi.
INTERPRETASI • Tabel ANOVA Persamaan regresi yang kita gunakan adalah : Y = a + b1X1 + b2X2 Apakah model hubungan antara X1, X2 dan Y hanya ada model linier seperti di atas? Jelas tidak, sebenarnya model-model persamaan masih sangat banyak. Jadi, mengapa kita menggunakan persamaan linier? Apakah model tersebut sesuai? Pertanyaan tersebut akan terjawab dari tabel ANOVA. F hitung digunakan untuk menguji apakah model persamaan Y = a + b1X1 + b2X2 yang diajukan dapat diterima atau tidak. Caranya dengan membandingkan F hitung tersebut dengan F tabel. Jika F hitung > F tabel, maka model di atas dapat diterima dan sebaliknya. -F hitung = 115,62 -F tabel dapat dilihat pada α = 0,05 dengan Derajad bebas pembilang = (k – 1)= 3 – 1 = 2 Derajad penyebut = (n – k) = 15 – 3 = 12 -F tabel 0,05 (2;12) = 3,89 Karena F hitung > F tabel, dapat disimpulkan bahwa modelyang digunakan sudah tepat. Untuk lebih mudahnya dapat dengan melihat probabilitasnya. Jika probabilitas < taraf signifikansi (α =0,05),maka model diterima. Dan sebaliknya, dapat dilihat probabilitasnya adalah 0,000 < 0,05 maka model persamaan Y = a + b1X1 + b2X2 yang digunakan dapat diterima.
INTERPRETASI • Tabel Coefficients Setelah menguji signifikansi persamaan regresi, selanjutnya perlu diuji apakah masing-masing variabel independen (X1, X2) mempunyai pengaruh yang nyata terhadap Y. Untuk itu dilakukan uji t. • Hipotesis : Ho : Variabel independen tidak mempengaruhi variabel dependen secara nyata. Ha : Variabel bebas berpengaruh nyata terhadap variabel dependen. • Pengambilan Keputusan : Jika –t tabel < t hitung < t tabel, Ho diterima. Jika t hitung < -t tabel atau t hitung > t tabel, Ho ditolak. t tabel dilihat dengan derajad bebas = n – k n = jumlah sampel dalam hal ini = 15 k = jumlah variabel yang digunakan = 3 sehingga derajad bebasnya = 15 – 3 = 12 Uji t dilakukan uji dua arah (2 tailed) sehingga cara membaca t tabelnya sedikit berbeda, t tabel dibaca pada t ½ α atau t ½ (0,05) atau t 0,025. -t tabel = 2,560 -t hitung (X1) =4,062 -t hitung (X2) = 4,741
INTERPRETASI • Keputusan : • Variabel Curah Hujan (X1) Karena t hitung (4,062) > t tabel (2,560) maka Ho ditolak, artinya curah hujan berpengaruh nyata terhadap produktivitas padi. • Variabel Pemupukan (X2) Karena t hitung (4,741) > t tabel (2,560) maka Ho ditolak, artinya produktivitas dapat dipengaruhi secara nyata oleh faktor pemupukan.
INTERPRETASI Persamaan regresi dapat diperoleh pada kolom B pada tabel coefficients. Baris pertama menunjukkan konstanta (a), baris kedua adalah konstanta untuk faktor X1, dan baris ketiga adalah konstanta untuk faktor X2. Persamaan dasarnya adalah : Y = a + b1X1 + b2X2 Dengan melihat hasil pada tabel coefficients,maka : Persamaan regresi Y = 8,754 + 0,078X1 + 0,327X2 Dimana ; Y = Produksi Padi X1 = Curah Hujan X2 = Pemupukan Dari persamaan dapat diuraikan sebagai berikut : • Konstanta (a) = 8,754, artinya jika padi tidak dilakukan pemupukan dan tidak ada hujan, produksi padi adalah 8,754 kuintal. • Koefisien regresi X1 (b1) = 0,078, artinya jika terjadi curah hujan sebanyak 1 satuan, produksi padi akan meningkat sebesar 0,078 kuintal. • Koefisien regresi X2 (b2) = 0,327, artinya jika padi dipupuk sebesar 1 satuan, produksi padi meningkat sebesar 0,325 kuintal.
Soal Latihan • 12 orangmahasiswadi Jakarta ditanyatentangberatbadan, tinggidanumurmereka. Y = beratbadandalam kg. X1 = tinggidalam cm. X2 = umur, dibulatkandalamtahun. Hasilwawancaraadalahsbb. • Carilahnilai a, b1 dan b2 sertatentukanpersamaanregresiberganda! • Apakahtinggidanumurmasing-masingberpengaruhsignifikanterhadapberatbadan? • Berapaberatseseorang yang tingginya 153 cm danumurnya 23 tahun?
REGRESI LINIER DENGAN VARIABEL BONEKA (DUMMY VARIABLE) • Dalam menganalisis data, terkadang kita dihadapkan pada data-data yang bukan data rasio tetapi berupa data-data kategori yang bersifat kualitatif. Data-data kategori misalnya jenis kelamin,pekerjaan,pendidikan dan lain-lain. Jenis kelamin kita hanya mempunyai dua laki-laki atau perempuan, pendidikan misalnya dibedakan menjadi SD, SMP, SMA dan sarjana, data-data tersebut bukan data yang berbentuk angka dan tidak mempunyai nilai kuantitatif. • Analisis regresi tidak serta merta dapat menganalisis data-data semacam ini. Untuk menganalisis data-data kategori,maka data-data tersebut harus “diangkakan” sehingga mempunyai nilai. Misalnya untuk variabel jenis kelamin, laki-laki diberi angka 1 sedangkan perempuan diberi angka 0. Angka 1 dan angka 0 tersebut bukan merupakan nilai sebenarnya, angka tersebut hanya berupa kategori sehingga disebut sebagai variabel boneka atau dummy. • Regresi dummy digunakan dalam persamaan regresi dimana variabel independennya (X) berupa variabel kualitatif. Sebaliknya, jika yang merupakan variabel kualitatif adalah variabel dependennya (Y), regresi yang digunakan adalah regresi logistik.
Contoh :Perusahaan Silva Wood Industries, merupakan produsen bubur kertas (pulp). Selama bertahun-tahun perusahaan telah memproduksi pulp dengan kualitas “prima” Perusahaan telah berhasil meningkatkan kualitas produksi menjadi kualitas “super”. Dengan kekuatan promosi perusahaan telah merambah dunia ekspor. Perusahaan hendak mengetahui peranan kualitas, produksi dan promosi di dalam meningkatkan pendapatan perusahaan. Data-datanya sebagai berikut.