1 / 34

Tolkning av resultatene fra logistisk regresjon

Tolkning av resultatene fra logistisk regresjon. JFRYE2005. Aller først (med relevans for både OLS og logistisk regr.): Husk skillet mellom fortolkninger som fokuserer på b-verdiene (variablenes effekt på y) predikerte verdier til enheter (’resultatene’ av disse effektene)

kioko
Download Presentation

Tolkning av resultatene fra logistisk regresjon

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Tolkning av resultatene fra logistisk regresjon JFRYE2005

  2. Aller først (med relevans for både OLS og logistisk regr.): Husk skillet mellom fortolkninger som fokuserer på b-verdiene (variablenes effekt på y) predikerte verdier til enheter (’resultatene’ av disse effektene) 1: Det første viser til den generelle effekten som en variabel (x) har på en annen variabel (y) OLS: Et års ekstra utdanning fører til at inntekten stiger med 10.000 kroner 2A: Det andre viser hvilken konkret predikert verdi (y-hat) en gruppe enheter har, forutsatt en bestemt kombinasjon x-verdier… OLS: Menn på 30 år med 7 års utdanning og så videre… har 150.000 kroner i inntekt 2B …eller også relative forskjeller mellom forskjellige grupper (men fortsatt mellom konkrete grupper) OLS: Folk med 7 års utdanning har dermed 30.000 kroner høyere inntekt enn folk med 4 års utdanning JFRYE2005

  3. y = b0 + b1x1 + b2x2 + b3x3 + e JFRYE2005

  4. Først et OLS-eksempel… JFRYE2005

  5. Avhengig variabel: Inntekt i 10.000 NOK Alder: År Kjønn: Mann = 0, kvinne = 1 Utdanning: Antall år etter vgs. 1 Effekten av alder: For hvert år eldre man blir, øker inntekten med 1000 kroner 2A Kvinner på 40 år som har 3 års utdanning, har 140.000 NOK i inntekt Kvinner har 30.000 NOK lavere lønn enn menn 2B JFRYE2005

  6. HUSKEREGEL: Det første har med variabler å gjøre, Det andre har med enheter å gjøre JFRYE2005

  7. FORTOLKNING AV LOGISTISK REGRESJON Utgangspunktet: 1: Logit’en 2: Odds / oddsratioer 3: Sannsynligheter (Husk relasjonen mellom disse tre begrepene!) JFRYE2005

  8. 1: LOGIT’EN (L) Husk at det er logit’en som estimeres i den logistiske regresjonsmodellen Variablens b-verdier viser hvordan L endres ved en enhets endring i x. JFRYE2005

  9. Vanskelig å tolke direkte. 1: Fortegnene på den enkelte x (b-verdiene) + = positiv relasjon 0 = ingen relasjon - = negative relasjon 2A: Predikert L for en gruppe L > 0: p > 0,50 L = 0: p = 0,50 L < 0: p < 0,50 Ikke særlig informativt 2B: Forskjeller i predikert L mellom to grupper (relativ forskjell) Heller ikke særlig informativt JFRYE2005

  10. Avhengig variabel: Inneha sjefsstilling Alder: År Kjønn: Mann = 0, kvinne = 1 Utdanning: Antall år etter vgs. 1 Effekten av alder: Sannsynligheten for å være sjef øker med alderen 2A Kvinner på 40 år som har 3 års utdanning, har en L på 2,5 Kvinner har -1 lavere L enn menn (sier heller ikke så mye…) 2B JFRYE2005

  11. 2: ODDS / ODDSRATIO Oddsratio (OR) [eb / exp(b)] viser hvordan oddsen (O) [eL] endres ved en enhets endring i x. NB: Fortolkninger av odds/oddsratio er multiplikativ – det betyr at man må skille mellom absolutt og relativ endring i oddsen JFRYE2005

  12. Et eks.: Per har 2 i odds for bli rik. Lisa har 4 i odds for å bli rik Så skaffer de seg utdanning, og begge øker dermed oddsene sine for å bli rike med 2 (ORutd = 2). Da har Per 4 i odds for å bli rik Da har Lisa 8 i odds for å bli rik Merk følgende: Per og Lisas odds steg med det samme relativt sett (2) Lisa har fortsatt dobbel så stor sjanse for å bli rik som Per Men Lisas odds steg dobbelt så mye i absolutte verdier Pers odds steg fra 2 til 4, en økning på 2 Lisas odds steg fra 4 til 8, en økning på 4 JFRYE2005

  13. Matematisk sett… Utgangspunktet er logit-formelen: L = b0 + b1X1 + b2X2 (NB Husk at L = ln(P/1-P)) Man kan ta antilogaritmen (dvs. ’finne eksponenten’) til uttrykkene på begge sidene av denne ligningen, og uttrykket vil fortsatt være gyldig Antilogarimen til L = O Antilogarimen til b0 + b1X1 + b2X2 = eb0 + b1X1 + b2X2 = e L JFRYE2005

  14. TOLKNINGER AV ODDS OG ODDSRATIO 1: Som endring i oddsene ved en enhets endring i x (= verdien for oddsratioen) Oddratioen er oppgitt i den siste kolonnen av SPSS-utskriften (Exp)B (også skrevet som eb) (Exp)B > 1  øker oddsen (Exp)B = 1  ingen endring (samme funksjon som 0 i additive modeller) (Exp)B < 1  minsker oddsene JFRYE2005

  15. TOLKNINGER AV ODDS OG ODDSRATIO 2A: Predikerte odds: e L Hvilken odds har en bestemt gruppe for at y = 1? JFRYE2005

  16. TOLKNINGER AV ODDS OG ODDSRATIO 2B: Som prosentvis endring i odds ved en enhets endring i X Tolkning som prosent: (((Exp)B)- 1) * 100)= prosentvis økning/reduksjon i odds ved en enhets økning i X JFRYE2005

  17. TOLKNINGER AV ODDS OG ODDSRATIO 2B: Som oddsratio Direkte sammenligninger mellom to oddsene for to forskjellige grupper, f.eks. for kvinner og menn, eller for folk med høyere utdanning enn andre: JFRYE2005

  18. Avhengig variabel: Inneha sjefsstilling Alder: År Kjønn: Mann = 0, kvinne = 1 Utdanning: Antall år etter vgs. 1 Effekten av alder: Oddsene for å være sjef multipliseres med 1,11 for hvert år man blir eldre 2A Kvinner på 40 år som har 3 års utdanning, har en L på 2,5 og dermed en odds på 12,18 for å være sjef (her oppdager man at eksemplet er dårlig…) Kvinner har 63 prosent lavere odds enn menn for å være sjef, eller: oddsratioen mellom kvinner og menn er 0,37 2B JFRYE2005

  19. 3: SANNSYNLIGHETER NB: Ikke-linjær og ikke-additiv tolkning – effekten i form av sannsynligheter må identifiseres for et gitt sett av verdier på de andre variablene Dvs.: Kan ikke si noe generelt om effekten av variablene på sannsynligheter JFRYE2005

  20. TOLKNINGER AV SANNSYNLIGHETER Baseres på estimert L-verdi P = 1 / (1+ e-L) Sett inn verdier for alle andre X Maksimumsverdier Gjennomsnittsverdier Minimumsverdier Teoretisk interessante verdier Lag så en graf for hvordan Y endres for ulike X JFRYE2005

  21. Avhengig variabel: Inneha sjefsstilling Alder: År Kjønn: Mann = 0, kvinne = 1 Utdanning: Antall år etter vgs. 1 Effekten av alder: Umulig å si noe generelt 2A Kvinner på 40 år som har 3 års utdanning, har en L på 2,5 og en odds på 12,18 for å være sjef – dvs. en sannsynlighet på 0,92 Umulig å si noe generelt om forhold mellom to grupper ift. sannsynlighet 2B JFRYE2005

  22. JFRYE2005

  23. Et forslag til tolknings- og formidlingsstrategi: Bruk først og fremst odds / oddsratio til å si noe om effekten av x på y Eks.: ’Modellen viser at utdanning øker oddsen [og dermed sannsynligheten] for å inneha en sjefsstilling. For hvert år ekstra utdanning man har, øker oddsen [og dermed sannsynligheten] med 1,65.’ Bruk predikerte sannsynlighetsverdier til å anskueliggjøre hva resultatene innebærer for konkrete grupper Eks.: Kvinner på 40 år som har 3 års utdanning, har en sannsynlighet på 0,92 for å inneha en sjefsstilling [L = 2,5 og odds = 12,18] Bruk prosentvis endring i oddsratio til å si noe om forskjeller mellom konkrete grupper. Eks.: ’Resultatene viser at kvinner har 63 prosent lavere odds enn menn til å inneha en sjefsstilling.’ Eller: ’Oddsratioen mellom kvinner og menn er 0,37.’ JFRYE2005

  24. JFRYE2005

  25. Men aller viktigst – for fortolkning og spesielt kommunikasjon av logistiske regresjonsresultater: BRUK GRAFER! (Men husk: grafer sier ikke noe annet enn matematikken – det er bare et triks for å anskueliggjøre matematiske relasjoner) JFRYE2005

  26. ’Grafisk grunnlogikk’ Vise hvordan Y endrer seg når X endrer seg. Velg ut X’en som du ønsker å belyse, regn ut de ulike Y-verdiene du får for forskjellige X-verdier Lag eventuelt særskilte grafer for spesielle grupper (for eksempel kvinner og menn, eller grupper med forskjellig utdanning) JFRYE2005

  27. ’Grafisk grunnlogikk’ 4: Husk at en graf i utgangspunktet er to-dimensjonal – med med pkt 3 så ’lurer’ vi inn enn tredje dimensjon (dimensjon = variabel i denne sammenhengen) 5: Kontinuerlige variabler på X-aksen gjør seg best! 6: Logistisk: Variablene som ikke belyses i den aktuelle grafen, må settes til en bestemt verdi og inkluderes i konstant-leddet (minimum, maksimum, gjennomsnitt, teoretisk definert) JFRYE2005

  28. Og helt til slutt… Hva kan man tolke ut av konstantleddet? Ingenting – er bare med som et utgangspunkt for utregninger JFRYE2005

  29. 1: Fra p til O: O = p / q q = (1 - p) O = p / (1 - p) Hvis p = 0,4 O = 0,4 / (1 - 0,4) O = 0,4 / 0,6 O = 0,6667 SOS3003/JFRYE

  30. 2: Fra p til L: L = ln(O) = ln(p / q) = ln(p / (1 – p)) Hvis p = 0,4 L = ln (0,4 / (1 - 0,4)) L = ln (0,4 / 0,6) L = ln (0,6667) L = - 0,405 SOS3003/JFRYE

  31. 3: Fra O til p: p / (1 – p) = O p = O / (1 + O) Hvis O = 5 p = 5 / 1 + 5 p = 5 / 6 p = 0,8333 SOS3003/JFRYE

  32. 4: Fra O til L: L = ln (O) Hvis O = 5 L = ln(5) L = 1,609 SOS3003/JFRYE

  33. 5: Fra L til O: O = e L Hvis L = 1,2 O = e 1,2 O = 3,320 SOS3003/JFRYE

  34. 6: Fra L til p: p = 1 / (1 + e -L) Hvis L = 0,4 Hvis L = - 0,4 p = 1 / (1+ e -0,4) p = 1 / (1+ e –(-0,4)) p = 1 / (1 + (1 / e0,4)) p = 1 / (1 + e 0,4) p = 1 / (1 + (1 / 1,492)) p = 1 / (2,492) p = 1 / (1 + (0,670) p = 0,401 p = 1 / (1,670) p = 0,599 SOS3003/JFRYE

More Related