400 likes | 742 Views
Model Logistik untuk Data Ordinal ( Ordinal Regression ). Analisis Data Kategorik Pertemuan X. Ordinal Regression. Menggunakan variabel ordinal Bisa mengurutkan nilainya tetapi jarak sebenarnya antar nilai tidak diketahui Model ordinal logistic untuk satu variabel bebas X:
E N D
ModelLogistikuntuk Data Ordinal(Ordinal Regression) Analisis Data Kategorik Pertemuan X
Ordinal Regression • Menggunakan variabel ordinal • Bisamengurutkannilainyatetapijaraksebenarnyaantarnilaitidakdiketahui • Model ordinal logistic untuksatuvariabelbebas X: • Makin tinggikoefisienmengindikasikanasosiasidenganskor yang tinggi
Ordinal Regression • When you see a positive coefficient for a dichotomous factor, you know that higher scores are more likely for the first category. A negative coefficient tells you that lower scores are more likely. • For a continuous variable, a positive coefficient tells you that as the values of the variable increase, the likelihood of larger scores increases. An association with higher scores means smaller cumulative probabilities for lower scores, since they are less likely to occur.
Ordinal Regression • Setiap logitmemiliki-nyasendiri (thresholds values) dengankoefisienyang sama, artinyaefekdarivariabelindependensamauntukfungsilogit yang berbeda(proportional odds model) • Contoh: Surveikepuasanrespondendenganpilihanjawabansangatsetujuhinggasangattidaksetuju • Ordinal variabelsebagaidependenvariabel • SPSS Ordinal Regression atau PLUM (Polytomous Universal Model)
Ordinal Regression dengan SPSS • Untuk dependent variabel, SPSS memodelkanprobabilitassetiap level ataudibawahnya (bukansetiap level atau di atasnya) • Secaraotomatis, SPSS mengambilkategoriterakhirsebagaireference category • Contoh: Level awalkelasbahasainggris(Y), dengan gender (X; boys = 0, girls = 1). LSYPE.sav • Analyses > Regression > Ordinal
We compare the final model (model with all explanatory variables) against the baseline (model without any explanatory variables) to see whether it has significantly improved the fit to the data. The statistically significantchi-square statistic (p<.0005) indicates that the Final model gives a significant improvement over the baseline intercept-only model.
The Deviance (-2LL) Statistic • Deviance, ukuranseberapabanyakvariasi yang tidakdapatdijelaskanoleh model regresilogistik • Semakintingginilai deviance semakinkurangakuratmodelnya • Jika model barulebihbaikdalammenjelaskan data daripada baseline makaseharusnyaadapengurangan yang signifikanpada deviance yang bisa di ujipadadistribusi chi-square (memberikan p-value)
Kecenderungan chi-square untuksignificantpada sample berukuranbesar • Sensitiveterhadapsel yang kosong • Gunakan p-value yang lebihrendah (misalnya 0.01) • Gunakanpseudo
These statistics are intended to test whether the observed data are consistent with the fitted model. We start from the null hypothesis that the fit is good. If we do not reject this hypothesis (i.e. if the p value is large), then you conclude that the data and the model predictions are similar and that you have a good model. Here, the pseudo R2 values (e.g. Nagelkerke = 3.1%) indicates that gender explains a relatively small proportion of the variation between students in their attainment.
Parameter estimates merupakantabelintidimanabisadilihathubunganantaravariabelpenjelasdenganvariabel outcome • Thresholds tidakdiintepretasikan, hanya intercept titik (logit) dimanapelajardiprediksikankekategori yang lebihtinggi • Odds level 6 atau di bawah level 6 (level = 6)adalahkomplemendari odds berada di level 7, level 5 atau di bawah level 5 (level = 5) adalahkomplemendari odds berada di level 6 keatasdst
Girls = reference category • y = a – bx • 1/0.53= 1.88, equally 1/1.88=0.53 Proportional odds principle
OR (girls as the base) = exp(-.629) = 0.53 • OR (boys as the base) = exp(.629) = 1.88 This test compares the ordinal model which has one set of coefficients for all thresholds (labelledNull Hypothesis), to a model with a separate set of coefficients for each threshold (labelled General). If the general model gives a significantly better fit to the data than the ordinal (proportional odds) model (i.e. if p<.05) then we are led to reject the assumption of proportional odds.
Asumsi Proportional Odds (PO) • Cumulative proportion = just the percentage • Cumulative odds = 1347/(14463-1347), odds mencapai level 7, odds berada di level 6 ataukeatas= 4918/9545 = 0.52 atau p/(1-p) • Cumulative logits = ln (cumulative odds)
Efekdarivariabelpenjelasadalahkonsistenatauproporsionalpada thresholds yang berbeda(SPSS,parallel lines assumption)
Remajaputricenderunguntukmemperoleh level yang lebihtinggidaripadaremajaputra
Secaraumum odds untukremajaputriselalulebihtinggidaripadaremajaputra • OR bervariasipada threshold kategori yang berbeda, jika OR initidakberbedasecarasignifikanmakakitabisameringkashubunganantara gender dengan level bahasainggrisdengan OR tunggaldariregresi ordinal
Ordinal Regression denganBeberapaVariabelBebas • Sebuah study dilakukanuntukmelihatfaktor-faktor yang mempengaruhiseseoranguntukmendaftarsekolahkejenjanglebihtinggi • Seorangpelajarditanyaapakahmereka: “tidakakanmendaftar”, “tidaktahu”, dan“akanmendaftar” kejenjanglebihtinggi. Variabel outcome memilikitigakategori (0,1,2) • Dikumpulkanjuga data mengenaipendidikan orang tua (apakahpendidikanterakhir orang tuaadalah S1;0,1), jenisinstitusipendidikan(public atau private;0,1), dan GPA. ologit.sav
PLUM apply with pared public gpa /LINK=LOGIT /PRINT=FIT PARAMETER SUMMARY TPARALLEL
Odds Ratio (ln Estimate) • Threshold biasanyatidakdisertakandalamintepretasi proportional OR • Untuk pared, setiapkenaikansatu unit pared (dari 0 ke 1), odds untukmendaftar2.85 kali lebihbesardaripadatidaktahudantidakmendaftar, denganasumsisemuavariabeldalam model konstan • Demikianjuga, odds antaratidaktahudanmendaftar2.85 kali lebihbesardaripadatidakmendaftar • Setiapkenaikansatu unit GPA, odds tidakmendaftardantidaktahu 1.85 kali lebihbesardaripada yang mendaftar
Pendidikan orang tuadan GPA memilikiasosiasipositifuntukkecenderunganmendaftarkejenjangsekolah yang lebihtinggi • Setiapsatu unit kenaikanpadapendidikan orang tua, ekspektasi log odds akanbertambah 1.05 setiapkenaikankategori apply yang lebihtinggi • Setiapkenaikansatu unit GPA diharapkankenaikanekspektasi log odds sebesar 0.62 padasetiapkenaikan apply yang lebihtinggi • Public tidakmemberikanefek yang signifikanpada apply
Example: • Random sample of Vermont citizens was asked to rate the work of criminal judges in the state. The scale was Poor (1), Only fair (2), Good (3), and Excellent (4). At the same time, they had to report whether somebody of their household had been a crime victim within the last 3 years(1=Yes, 2=No).(vermont.sav) • Apakah orang denganriwayatpernahmenjadikorbandan orang yang tidakmemilikiriwayatpernahmenjadikorbanmemilikipandangan yang samamengenaipenegakankeadilan?
Penambahanvariabelbaru: sex, age(duakategori), pendidikan (5 kategori)
RegresiLogistik VS Loglinier Model • Regresilogistikadalah model statistika yang digunakanuntukvariabeldependen/responkategorik • Loglinier model digunakanjika paling sedikitterdapatduavariabelrespondalamtabelkontingensi. Model akanmenjelaskanpolahubungandiantarasekumpulanvariabelresponkategorik
Loglinier Model danRegresiLogistikberbedadalamhal: • Distribusidarivariabelkategorikyaitu Poisson bukan binomial • Fungsi link yaitu log, bukanlogit • Prediksimerupkanestimasidarisel yang dihitungberdasartabelkontingensi, bukannilailogitdaridependen
Kesesuaian Model Loglinier dan Model Logit • Model loglinier dan model logitmemilikistruktur yang samauntukasosiasiantaravariabeldependen/respon dan variabel-variabelindependen/penjelas • Mengandunginteraksi yang palingumumuntukhubungan-hubungandiantaravariabel-variabelpenjelas
Kesesuaian Model Loglinier dan Model Logit • Kesesuaianantara model logitdengan model log linier padaTabel I x J x 2, : • Respon Y berasosiasidenganfaktor A dan B denganefektiapvariabelsamapadatiaplevel dari faktor yang lain • Model logliniermengandungasosiasiantara&dan untukhubunganantarafaktor • Hasilakhir model adalah (AB,AY,BY)
Kesesuaian Model Loglinier dan Model Logit • Model loglinier (AB,AY,BY) menyatakansecaratidaklangsung model logitdapatdiperlihatkansebagaiberikut: = = • Denganmengasumsikanbahwa :
Kesesuaian Model Loglinier dan Model Logit • Dengan demikianbentuksederhana dari model logitadalah:++