1 / 38

Model Logistik untuk Data Ordinal ( Ordinal Regression )

Model Logistik untuk Data Ordinal ( Ordinal Regression ). Analisis Data Kategorik Pertemuan X. Ordinal Regression. Menggunakan variabel ordinal Bisa mengurutkan nilainya tetapi jarak sebenarnya antar nilai tidak diketahui Model ordinal logistic untuk satu variabel bebas X:

Download Presentation

Model Logistik untuk Data Ordinal ( Ordinal Regression )

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. ModelLogistikuntuk Data Ordinal(Ordinal Regression) Analisis Data Kategorik Pertemuan X

  2. Ordinal Regression • Menggunakan variabel ordinal • Bisamengurutkannilainyatetapijaraksebenarnyaantarnilaitidakdiketahui • Model ordinal logistic untuksatuvariabelbebas X: • Makin tinggikoefisienmengindikasikanasosiasidenganskor yang tinggi

  3. Ordinal Regression • When you see a positive coefficient for a dichotomous factor, you know that higher scores are more likely for the first category. A negative coefficient tells you that lower scores are more likely. • For a continuous variable, a positive coefficient tells you that as the values of the variable increase, the likelihood of larger scores increases. An association with higher scores means smaller cumulative probabilities for lower scores, since they are less likely to occur.

  4. Ordinal Regression • Setiap logitmemiliki-nyasendiri (thresholds values) dengankoefisienyang sama, artinyaefekdarivariabelindependensamauntukfungsilogit yang berbeda(proportional odds model) • Contoh: Surveikepuasanrespondendenganpilihanjawabansangatsetujuhinggasangattidaksetuju • Ordinal variabelsebagaidependenvariabel • SPSS Ordinal Regression atau PLUM (Polytomous Universal Model)

  5. Ordinal Regression dengan SPSS • Untuk dependent variabel, SPSS memodelkanprobabilitassetiap level ataudibawahnya (bukansetiap level atau di atasnya) • Secaraotomatis, SPSS mengambilkategoriterakhirsebagaireference category • Contoh: Level awalkelasbahasainggris(Y), dengan gender (X; boys = 0, girls = 1). LSYPE.sav • Analyses > Regression > Ordinal

  6. We compare the final model (model with all explanatory variables) against the baseline (model without any explanatory variables) to see whether it has significantly improved the fit to the data. The statistically significantchi-square statistic (p<.0005) indicates that the Final model gives a significant improvement over the baseline intercept-only model.

  7. The Deviance (-2LL) Statistic • Deviance, ukuranseberapabanyakvariasi yang tidakdapatdijelaskanoleh model regresilogistik • Semakintingginilai deviance semakinkurangakuratmodelnya • Jika model barulebihbaikdalammenjelaskan data daripada baseline makaseharusnyaadapengurangan yang signifikanpada deviance yang bisa di ujipadadistribusi chi-square (memberikan p-value)

  8. Kecenderungan chi-square untuksignificantpada sample berukuranbesar • Sensitiveterhadapsel yang kosong • Gunakan p-value yang lebihrendah (misalnya 0.01) • Gunakanpseudo

  9. These statistics are intended to test whether the observed data are consistent with the fitted model. We start from the null hypothesis that the fit is good. If we do not reject this hypothesis (i.e. if the p value is large), then you conclude that the data and the model predictions are similar and that you have a good model. Here, the pseudo R2 values (e.g. Nagelkerke = 3.1%) indicates that gender explains a relatively small proportion of the variation between students in their attainment.

  10. Parameter estimates merupakantabelintidimanabisadilihathubunganantaravariabelpenjelasdenganvariabel outcome • Thresholds tidakdiintepretasikan, hanya intercept titik (logit) dimanapelajardiprediksikankekategori yang lebihtinggi • Odds level 6 atau di bawah level 6 (level = 6)adalahkomplemendari odds berada di level 7, level 5 atau di bawah level 5 (level = 5) adalahkomplemendari odds berada di level 6 keatasdst

  11. Girls = reference category • y = a – bx • 1/0.53= 1.88, equally 1/1.88=0.53 Proportional odds principle

  12. OR (girls as the base) = exp(-.629) = 0.53 • OR (boys as the base) = exp(.629) = 1.88 This test compares the ordinal model which has one set of coefficients for all thresholds (labelledNull Hypothesis), to a model with a separate set of coefficients for each threshold (labelled General). If the general model gives a significantly better fit to the data than the ordinal (proportional odds) model (i.e. if p<.05) then we are led to reject the assumption of proportional odds.

  13. Asumsi Proportional Odds (PO) • Cumulative proportion = just the percentage • Cumulative odds = 1347/(14463-1347), odds mencapai level 7, odds berada di level 6 ataukeatas= 4918/9545 = 0.52 atau p/(1-p) • Cumulative logits = ln (cumulative odds)

  14. Efekdarivariabelpenjelasadalahkonsistenatauproporsionalpada thresholds yang berbeda(SPSS,parallel lines assumption)

  15. Remajaputricenderunguntukmemperoleh level yang lebihtinggidaripadaremajaputra

  16. Secaraumum odds untukremajaputriselalulebihtinggidaripadaremajaputra • OR bervariasipada threshold kategori yang berbeda, jika OR initidakberbedasecarasignifikanmakakitabisameringkashubunganantara gender dengan level bahasainggrisdengan OR tunggaldariregresi ordinal

  17. Ordinal Regression denganBeberapaVariabelBebas • Sebuah study dilakukanuntukmelihatfaktor-faktor yang mempengaruhiseseoranguntukmendaftarsekolahkejenjanglebihtinggi • Seorangpelajarditanyaapakahmereka: “tidakakanmendaftar”, “tidaktahu”, dan“akanmendaftar” kejenjanglebihtinggi. Variabel outcome memilikitigakategori (0,1,2) • Dikumpulkanjuga data mengenaipendidikan orang tua (apakahpendidikanterakhir orang tuaadalah S1;0,1), jenisinstitusipendidikan(public atau private;0,1), dan GPA. ologit.sav

  18. PLUM apply with pared public gpa /LINK=LOGIT /PRINT=FIT PARAMETER SUMMARY TPARALLEL

  19. Odds Ratio (ln Estimate) • Threshold biasanyatidakdisertakandalamintepretasi proportional OR • Untuk pared, setiapkenaikansatu unit pared (dari 0 ke 1), odds untukmendaftar2.85 kali lebihbesardaripadatidaktahudantidakmendaftar, denganasumsisemuavariabeldalam model konstan • Demikianjuga, odds antaratidaktahudanmendaftar2.85 kali lebihbesardaripadatidakmendaftar • Setiapkenaikansatu unit GPA, odds tidakmendaftardantidaktahu 1.85 kali lebihbesardaripada yang mendaftar

  20. Pendidikan orang tuadan GPA memilikiasosiasipositifuntukkecenderunganmendaftarkejenjangsekolah yang lebihtinggi • Setiapsatu unit kenaikanpadapendidikan orang tua, ekspektasi log odds akanbertambah 1.05 setiapkenaikankategori apply yang lebihtinggi • Setiapkenaikansatu unit GPA diharapkankenaikanekspektasi log odds sebesar 0.62 padasetiapkenaikan apply yang lebihtinggi • Public tidakmemberikanefek yang signifikanpada apply

  21. Example: • Random sample of Vermont citizens was asked to rate the work of criminal judges in the state. The scale was Poor (1), Only fair (2), Good (3), and Excellent (4). At the same time, they had to report whether somebody of their household had been a crime victim within the last 3 years(1=Yes, 2=No).(vermont.sav) • Apakah orang denganriwayatpernahmenjadikorbandan orang yang tidakmemilikiriwayatpernahmenjadikorbanmemilikipandangan yang samamengenaipenegakankeadilan?

  22. Penambahanvariabelbaru: sex, age(duakategori), pendidikan (5 kategori)

  23. RegresiLogistik VS Loglinier Model • Regresilogistikadalah model statistika yang digunakanuntukvariabeldependen/responkategorik • Loglinier model digunakanjika paling sedikitterdapatduavariabelrespondalamtabelkontingensi. Model akanmenjelaskanpolahubungandiantarasekumpulanvariabelresponkategorik

  24. Loglinier Model danRegresiLogistikberbedadalamhal: • Distribusidarivariabelkategorikyaitu Poisson bukan binomial • Fungsi link yaitu log, bukanlogit • Prediksimerupkanestimasidarisel yang dihitungberdasartabelkontingensi, bukannilailogitdaridependen

  25. Kesesuaian Model Loglinier dan Model Logit • Model loglinier dan model logitmemilikistruktur yang samauntukasosiasiantaravariabeldependen/respon dan variabel-variabelindependen/penjelas • Mengandunginteraksi yang palingumumuntukhubungan-hubungandiantaravariabel-variabelpenjelas

  26. Kesesuaian Model Loglinier dan Model Logit • Kesesuaianantara model logitdengan model log linier padaTabel I x J x 2, : • Respon Y berasosiasidenganfaktor A dan B denganefektiapvariabelsamapadatiaplevel dari faktor yang lain • Model logliniermengandungasosiasiantara&dan untukhubunganantarafaktor • Hasilakhir model adalah (AB,AY,BY)

  27. Kesesuaian Model Loglinier dan Model Logit • Model loglinier (AB,AY,BY) menyatakansecaratidaklangsung model logitdapatdiperlihatkansebagaiberikut: = = • Denganmengasumsikanbahwa :

  28. Kesesuaian Model Loglinier dan Model Logit • Dengan demikianbentuksederhana dari model logitadalah:++

More Related