1.02k likes | 1.27k Views
REGRESSI LINIER SEDERHANA. Oleh Prof. Dr.dr.Buraerah H abd Hakim, MSc Program Magister Kesehatan Masyarakat Program Pasca sarjana FKM Universitas Hasanuddin. MATERI PERKULIAHAN. PENDAHULUAN REG. LINIER SEDERHANA REG. LINIER BERGANDA REG. LINIER BERGANDA LOGISTIK
E N D
REGRESSI LINIER SEDERHANA Oleh Prof. Dr.dr.BuraerahH abd Hakim, MSc Program Magister KesehatanMasyarakat Program PascasarjanaFKM UniversitasHasanuddin
MATERI PERKULIAHAN • PENDAHULUAN • REG. LINIER SEDERHANA • REG. LINIER BERGANDA • REG. LINIER BERGANDA LOGISTIK • KORELASI
REGRESSI LINIER Adalahprosedur yang digunakanuntukmenilaihubunganantara var. indpendendenganvariabeldependennyamelaluipersamaangarislurus. Persayaratan yang senantiasadituntutdalamsuatuanalisisdenganmenggunakanujistatistik (terutamaRegressi linier) ialahDistribusinyaharus normal. Alasantersebutdisebabkankarena, sebuahsampel yang diambildaripopulasitidak normal, distribusi mean sampelnyabisamendekati normal asalkanukuransampelnyacukupbesar.
REGRESSI LINIER TUJUAN MengujihubunganantaravariabelIndependendengandependennya. Hubungan linier satu var. independendengansatu var. dependen “Regressi Linier Sederhana “ Hubungan linier lebihdarisatuvariabelindependendengansatu var. dependen“ Regressi Linier berganda “
REGRESSI LINIER • Hubungan linier lebihdarisatu var. independendengansatu var. dependendenganmenggunakanprinsiplogarithma “Regressi Linier bergandalogistik.“ • Hubungan non linier lebihdarisatuvariabelindependendengansatu var. dependen“Regressi non Linier berganda “
PERSYARATAN • Data yang digunakandiukurmenurutskala Ratio • Minimal diukurdalamskala Interval. • Interval denganskalasama ( dari data kontinu) • Interval denganskalatidaksama (dari data Diskret) • Skala 1, 0 untukRegresilogistik.
REGRESSI LINIER SEDERHANA MODEL DAN RUMUS UMUM MEMILIH GARIS REGRESSI ANALISIS KORELASI GENERALISASI POPULASI
REGRESSI LINIER SEDERHANA RUMUS UMUM Y = a + bx Keterangan : Y = VariabelDependen X = VariabelIndependen a = Intercepts b = Slope atauKoefisienarah
MODEL PERSMAAN REGRESSI LINIER SEDERHANA (SAMPEL) Var.Y Y = a + bx Slope b a Intercept 0 Var.X
RUMUS UMUM UNTUK POPULASI Ỹ = βo + β1x1 + e Keterangan : Ỹ = VariabelDependen βo = Interceps β1 = Slope e = Random error disekitargarisregressi
MODEL PERSMAAN REGRESSI LINIER SEDERHANA (POPULASI) Var.Y Ỹ = βo + β1x1 + e Slope β1 β0 Intercept 0 Var.X
SCATTER DIAGRAM KepuasanPasien Kualitaspelayananaspek responsiveness
MEMILIH GARIS REGRESSI Dalamkenyataanhasilperpotonganantaravariabelindependen (Y) denganvariabeldependen (X) berdasarkan data hasilobservasitidaksemuanyatepatjatuhpadagarisregresitetapihanyasebagiansaja. Konsokuensinyaadalah “terjadinyapenyimpangan’ hasilobservasidaripersamaanregressi yang diduga , yang dikenaldengan “Random Error disekitarGarisRegressi”.
RANDOM ERROR SEKITAR GARIS REGRESSI 60000 50000 40000 30000 20000 10000 0 10000 20000 30000 40000
MENGHILANGKAN RANDOM ERROR • Untukmenghilangkan error tersebutdigunakan “metodekuadratterkecil” (Least Square) • (Least-Square) ialahsuatupersamaangarisdimanajumlahkuadratdarijarakvertikaltiap-tiaptitikpengamatanterhadapgaristersebut minimum. (dianggap = 0)
INTERCEP DAN SLOPE Perhitungan parameter intercepts dan slope dilakukansebagaiberikut: (∑Yi)(∑ Xi2) - (∑Xi)( ∑XiYi) a = ----------------------------------- n∑Xi - (∑ Xi2) n ∑XiYi - (∑Xi) (∑Yi) b = ----------------------------------- ∑ Xi2 - (∑ Xi)2 a = Y - bX
INTERCEP DAN SLOPE Perhitungan parameter intercepts dan slope dilakukansebagaiberikut: (∑Yi)(∑ Xi2) - (∑Xi)( ∑XiYi) c = ----------------------------------- n∑Yi2 - (∑ Yi)2 n ∑XiYi - (∑Xi) (∑Yi) d = ----------------------------------- ∑ Xi2 - (∑ Yi)2
BENTUK PESAMAAN GARIS REGRESSI Regressi Linier Y = a + bx RegressiKuadratik Ỹ = a + bx + cx2 Parabola kubik Ỹ = a + bx + cx2 + dx3 EksponenỸ = a + bx* Geometrik Ỹ = ax Gompertz Ỹ = pq 1 7. Logistik Ỹ = ------------ ab* + c 1 8. Hiperbola Ỹ = ---------- a + b
ContohHasilanalisisRegressidanKorelasi • R = r (Korelasi) = 0,626 • R2 = R-square = KoefisienDeterminasi = 0,392 • Adjusted Rsquare = 0,331 • Std.Error of the Estimate = 5,322055
ANALISIS KORELASI Garisregressidianggap parameter terbaikuntuksekumpulan data berbentuk linier. Besarnyaderajathubunganantaravariabelindependendengangdependennya (variabel x dan Y), dinyatakan“r“ yang dikenaldenganKoefisienkorelasi , yang diberisimboldengan“ R “.
RUMUS KOEFISIEN DETERMINASI R2 Keterangan : R2 = KoefisienDeterminasi (Koefisienpenentu) = R Square (R2)
RUMUS KORELASI ‘r’ atau R Keterangan : r atau R2 = KoefisienKorelasi Rumus Bentuk lain :
INTERPRTASI HASIL PRINT OUT KOMPUTER • Hasil Print Out AnalisisRegressi ------------------Variabel in Equation---------------------- Variabel B SE B Beta T Sig.T SALBEG 1.909450 0.047410 0.880117 40.276 0.0000 (Constant) 771.282303 955.471941 2.170 0.0305 ------------------------------------------------------------------------ Kofisien→ [B] (Constant) “ a “ = Intercept B =slope “b” (salbeg) darihasilanalisisregressi.
[BETA] KoefisienRegressiTerstandarisasi. ialahkoefisienregressiβ1 apabilavariabel x dan y diekspresikansebagai “skorstandar” (Z – score) • Diperolehdenganmenggunakanrumus: Sx Beta = β1 -------- Sy • Ket : • Sx : ialahstandardeviasidarivariabel X • Sy : ialahstandardeviasidarivariabelY • [SE B] Estimasistandar Error ialahestimasistandar error dari “β1β0” untukpopulasi
[T danSig.T] UjiHipotesi ialahujihipotesismengenaiadaatautidaknyahubungan linier antaravariabel X danvariabel Y. atau “slope dariregressipopulasi (β1) = 0 Rumus yang digunakan: β1 t = ---------- Sβ1
Apabilatidakadahubungan linier antaravariabel X danvaribel Y maka data darisampelakanberdistribusi “student’s t”, denganderajatkebebasan N – 2 . Ujistatistik yang digunakanuntukmengujibahwa intercept (β0) = 0 ialah : β0 t = ---------- Sβ0
GENERAISASI SAMPEL THDP POPULASI Untukmelakukanpenarikankesimpulanumumberdasarkanhasilanalisis data sampelterhadap parameter populasi, makahasilanalisis yang telahdilakukanharusmemenuhiAsumsi “ LINE ”. Yakni : • Linearity, • Independency, • Normality, • Equality variance.
LINEARITY • ialahnilai-nilai mean seluruhnyaterletakpadagarislurus yang merupakangarisregressipopulasi • Yi= β0 + β1Xi + ei → dimanaeidiasumsikanberdistribusi normal independendengan mean = 0 danvarians = σ² • Penilaiandilakukanmelaluihasilujiregressiyakni : (T dan Sig. T) • T ≥ 1,645 • Signif. (p < 0,05)
INDEPENDENCY secarastatistikmakavariabel Y harusindependenantarasatudenganlainnya. Terjadinya Independency data dalamsampeldinilaimelaluiuji“ Durbin-Watson” ‘ D ‘. dimana : • HargaDberkisarantara 0 – 4 • Jika residual berkorelasi Dmendekati 2 • Jika Residual berkorelasipositif D < 2 • Jika Residual berkorelasinegatif D > 2
NORMALITY. ialahuntuksetiapnilaivariabelindependen X makavariabeldependen Y → akanberdistribusi normal dengan mean = μy/x dan variance konstan = σ² • Penilaiandilakukanmelaluiuji : • KS • PP plot • BentukKurva normal
EQUALITY VARIANCE ialahuntuksetiapnilaivariabelindependen X makavariabeldependen Y → akanberdistribusi normal dengan mean = μy/x dan variance konstan = σ² • Penilaiandilakukanmelalui : • UjiLevene • Uji F Ratio
PENETAPAN BAIK TIDAKNYA MODEL Baiktidaknya model Garisregressi yang diperolehdarihasilanalisis data dinilaimelalui : “GOODNESS OF FIT“,Ialahsalahsatuprosedurstatistik yang digunakanuntukmenentukan/menetapkanseberapabaiksuatu model yang dipilihberdasarkan data sampeldanmemangsesuaidengankeadaannyatapadapopulasi.
Komponenpenting yang menjadipenilaian goodness of fit ialah : • [R Square = R² ] KoefisienDeterminasi. • Ialahukuran goodness of fit yang digunakanuntukmenentukan model linier untuksatupersamaangarislurus. • Nialidari R² iniberadadiantara 0 sampaidengan 1. • 0 =berartinilaiobservasitidakada / sebagiankecilsajajatuhpadagarisregressi. • 1 = berartiseluruhnilaiobservasiterletakpadagarisregressi.
Multiple R Ialahbanyaknyapersentase (%) variabilitasvariabeldependen Y yang dapatditerangkanolehvariabelindependen X. • Adjusted R Square. ialahkoreksidariR² sehinggagambarannyalebihmendekati model dalampopulasi.
Penilaian Goodness of Fit -------------------------------------------------------------- Multiple R 0.88012 R Square 0.77461 Adjusted R Square 0.77413 Standar error 3246.14226 --------------------------------------------------------------
REGRESSI LINIER BERGANDA Adalah model hubunganantarabeberapavariabelindependendenganvariabelindependenmelaluipendekatangarislurus. Garisregressidianggap parameter terbaikuntuksekumpulan data berbentuk linier. Besarnyaderajathubunganantaravariabelindependendengangdependennya (variabel x dan Y), dinyatakan“r“ yang dikenaldenganKoefisienkorelasi , yang diberisimboldengan“ R “.
MODEL PERSMAAN REGRESSI LINIER BERGANDA Ỹ = βo + β1 + β2 + β3 + ... βn + e Keterangan : Ỹ = VariabelDependen βo = Interceps β1 = VariabelIndependen
MODEL KURVA PERSMAAN REGRESSI LINIER BERGANDA Var. Y βo + β1x ei Yi Var.x1 Var. X2 Var. X3 Var. X4
PRINSIP PENERAPAN • Bagianterpentingdariprosedurstatistikialahmenilai‘seberapabaik model asumsiteoritis’ berkesesuaiandenganmodel statistikyang ditetapkanmelaluipersamaanregressi linier (sederhana / berganda) yang dikenaldengan‘’Goodness of Fit “ • Untukmenetapkan“Fit atautidaknyavariabelindependenterhadapdependendalam model asumsi”, dapatdinilaimelaluipersamaanRegressi linier sederhanamaupunberganda.
PRINSIP PENERAPAN • Data Sampel yang dianalisisharusdiperolehdaripopulasimenurutprinsip random. • Hasilujiregressi linier yang diperolehdimaksudkanuntukmelakukangeneralisasiterhadap : • Sampeldan • Populasi
GeneralisasiSampel • Hanyaberlakuuntuksampeldantidakdapatdigunakanuntukmenarikkesimpulanpopulasi. • Kesimpulan yang ditarikhanyadimaksudkanuntukmenarikkesimpulanterhadapkebenaran model asumsi /desain. • Jumlahsampel yang dibutuhkanharusmemenuhipersyaratandistribusi normal (± 30 sampel).
GeneralisasiPopulasi • Diperolehmelalui data sampel, yang ditariksecara random • Didasarkanpada 4 asumsiutama yang dikenaldenganprinsip“LINE“Yakni : • Linearity • Independency • Normality • Equality variance
Linearity Nilai-nilai mean populasi(µY/x) semuanyaterletakpadagarislurus. Nilai rata-rata variabeldependen (Y) untuksetiapkombinasitertentuvariabelIndpenden (X1, X2, …Xn) merupakansebuah“fungsi linier“ dari (X1, X2, … Xn,) Akibatnyasetiapkalimemasukkansebuahvariabelindependenkedalam model asumsi, makamodelnyaharusdapatdijelaskandengan model persamaan : Y = βo + β1X1 + e1
Penilaian Linearity Nilai R square (R2) = KoeficienDeterminasidimana : R2 = 0, berartitidakadahubungan linier . R2 = 1 berartiterdapathubungan linier sempurna Koefisienkorelasi “b” (slope) DinilaimelaluiUji F (F > 4,74; dengan Sign. p < 0.005 Nilaihasiluji student ‘t’ test. Dinilaimelaluinilai t ≥ 2,576 dengantingkatsignifikansi (p < 0,005) Nilai Scatter plot Berupagarislurusantaravariabeldependen (Y) denganvariabelIndependen (X1, X2, …Xn).
Scatter Plot • Penilaian linier tidaknya data yang diperolehmelaluissampeldapatjugadinilaimelalui“ Plot Probabilty Normal “. • Dalam plot inimasing-masingnilaiharapandarivariabel(kepuasanpasien) diplotdengannilaiobservasi(standardized observe value) daridistribusi normal. • Hasilnyapadakurvaberikut :
Scatter Plot • Penilaiankenormalan data melalui“ Plot Probabilty Normal “. Memberikanhasil yang nyata, tetapimasihdiperlukanujihipotesisuntukmembuktikannya. • Adaduajenisujihipotesis yang cukupterkenalialah: • Uji Shapiro-Wilks • UjiLiliefors.
Scatter Plot • UjiLiliefors • digunakanbilamana mean danvarianstidakdiketahuitetapiharusdiestimasidari data. • UjiShafiro-Wilks • memberikanhasil yang lebihbaikdalambanyaksituasidibandingkandenganujinormalitaslainnya. • Penolakanhipotesisyang mengatakansampelberasaldaripopulasi normal, didasarkanpadatingkatsignifikansi yang lebihkecil ( p < 0,05) • Ujilinearitaslainnya yang seringdigunakanialah“Normal P-P plot of Regression standardized Residual”.