350 likes | 586 Views
Tolkning av resultatene fra logistisk regresjon. JFRYE2005. Aller først (med relevans for både OLS og logistisk regr.): Husk skillet mellom fortolkninger som fokuserer på b-verdiene (variablenes effekt på y) predikerte verdier til enheter (’resultatene’ av disse effektene)
E N D
Aller først (med relevans for både OLS og logistisk regr.): Husk skillet mellom fortolkninger som fokuserer på b-verdiene (variablenes effekt på y) predikerte verdier til enheter (’resultatene’ av disse effektene) 1: Det første viser til den generelle effekten som en variabel (x) har på en annen variabel (y) OLS: Et års ekstra utdanning fører til at inntekten stiger med 10.000 kroner 2A: Det andre viser hvilken konkret predikert verdi (y-hat) en gruppe enheter har, forutsatt en bestemt kombinasjon x-verdier… OLS: Menn på 30 år med 7 års utdanning og så videre… har 150.000 kroner i inntekt 2B …eller også relative forskjeller mellom forskjellige grupper (men fortsatt mellom konkrete grupper) OLS: Folk med 7 års utdanning har dermed 30.000 kroner høyere inntekt enn folk med 4 års utdanning JFRYE2005
y = b0 + b1x1 + b2x2 + b3x3 + e JFRYE2005
Først et OLS-eksempel… JFRYE2005
Avhengig variabel: Inntekt i 10.000 NOK Alder: År Kjønn: Mann = 0, kvinne = 1 Utdanning: Antall år etter vgs. 1 Effekten av alder: For hvert år eldre man blir, øker inntekten med 1000 kroner 2A Kvinner på 40 år som har 3 års utdanning, har 140.000 NOK i inntekt Kvinner har 30.000 NOK lavere lønn enn menn 2B JFRYE2005
HUSKEREGEL: Det første har med variabler å gjøre, Det andre har med enheter å gjøre JFRYE2005
FORTOLKNING AV LOGISTISK REGRESJON Utgangspunktet: 1: Logit’en 2: Odds / oddsratioer 3: Sannsynligheter (Husk relasjonen mellom disse tre begrepene!) JFRYE2005
1: LOGIT’EN (L) Husk at det er logit’en som estimeres i den logistiske regresjonsmodellen Variablens b-verdier viser hvordan L endres ved en enhets endring i x. JFRYE2005
Vanskelig å tolke direkte. 1: Fortegnene på den enkelte x (b-verdiene) + = positiv relasjon 0 = ingen relasjon - = negative relasjon 2A: Predikert L for en gruppe L > 0: p > 0,50 L = 0: p = 0,50 L < 0: p < 0,50 Ikke særlig informativt 2B: Forskjeller i predikert L mellom to grupper (relativ forskjell) Heller ikke særlig informativt JFRYE2005
Avhengig variabel: Inneha sjefsstilling Alder: År Kjønn: Mann = 0, kvinne = 1 Utdanning: Antall år etter vgs. 1 Effekten av alder: Sannsynligheten for å være sjef øker med alderen 2A Kvinner på 40 år som har 3 års utdanning, har en L på 2,5 Kvinner har -1 lavere L enn menn (sier heller ikke så mye…) 2B JFRYE2005
2: ODDS / ODDSRATIO Oddsratio (OR) [eb / exp(b)] viser hvordan oddsen (O) [eL] endres ved en enhets endring i x. NB: Fortolkninger av odds/oddsratio er multiplikativ – det betyr at man må skille mellom absolutt og relativ endring i oddsen JFRYE2005
Et eks.: Per har 2 i odds for bli rik. Lisa har 4 i odds for å bli rik Så skaffer de seg utdanning, og begge øker dermed oddsene sine for å bli rike med 2 (ORutd = 2). Da har Per 4 i odds for å bli rik Da har Lisa 8 i odds for å bli rik Merk følgende: Per og Lisas odds steg med det samme relativt sett (2) Lisa har fortsatt dobbel så stor sjanse for å bli rik som Per Men Lisas odds steg dobbelt så mye i absolutte verdier Pers odds steg fra 2 til 4, en økning på 2 Lisas odds steg fra 4 til 8, en økning på 4 JFRYE2005
Matematisk sett… Utgangspunktet er logit-formelen: L = b0 + b1X1 + b2X2 (NB Husk at L = ln(P/1-P)) Man kan ta antilogaritmen (dvs. ’finne eksponenten’) til uttrykkene på begge sidene av denne ligningen, og uttrykket vil fortsatt være gyldig Antilogarimen til L = O Antilogarimen til b0 + b1X1 + b2X2 = eb0 + b1X1 + b2X2 = e L JFRYE2005
TOLKNINGER AV ODDS OG ODDSRATIO 1: Som endring i oddsene ved en enhets endring i x (= verdien for oddsratioen) Oddratioen er oppgitt i den siste kolonnen av SPSS-utskriften (Exp)B (også skrevet som eb) (Exp)B > 1 øker oddsen (Exp)B = 1 ingen endring (samme funksjon som 0 i additive modeller) (Exp)B < 1 minsker oddsene JFRYE2005
TOLKNINGER AV ODDS OG ODDSRATIO 2A: Predikerte odds: e L Hvilken odds har en bestemt gruppe for at y = 1? JFRYE2005
TOLKNINGER AV ODDS OG ODDSRATIO 2B: Som prosentvis endring i odds ved en enhets endring i X Tolkning som prosent: (((Exp)B)- 1) * 100)= prosentvis økning/reduksjon i odds ved en enhets økning i X JFRYE2005
TOLKNINGER AV ODDS OG ODDSRATIO 2B: Som oddsratio Direkte sammenligninger mellom to oddsene for to forskjellige grupper, f.eks. for kvinner og menn, eller for folk med høyere utdanning enn andre: JFRYE2005
Avhengig variabel: Inneha sjefsstilling Alder: År Kjønn: Mann = 0, kvinne = 1 Utdanning: Antall år etter vgs. 1 Effekten av alder: Oddsene for å være sjef multipliseres med 1,11 for hvert år man blir eldre 2A Kvinner på 40 år som har 3 års utdanning, har en L på 2,5 og dermed en odds på 12,18 for å være sjef (her oppdager man at eksemplet er dårlig…) Kvinner har 63 prosent lavere odds enn menn for å være sjef, eller: oddsratioen mellom kvinner og menn er 0,37 2B JFRYE2005
3: SANNSYNLIGHETER NB: Ikke-linjær og ikke-additiv tolkning – effekten i form av sannsynligheter må identifiseres for et gitt sett av verdier på de andre variablene Dvs.: Kan ikke si noe generelt om effekten av variablene på sannsynligheter JFRYE2005
TOLKNINGER AV SANNSYNLIGHETER Baseres på estimert L-verdi P = 1 / (1+ e-L) Sett inn verdier for alle andre X Maksimumsverdier Gjennomsnittsverdier Minimumsverdier Teoretisk interessante verdier Lag så en graf for hvordan Y endres for ulike X JFRYE2005
Avhengig variabel: Inneha sjefsstilling Alder: År Kjønn: Mann = 0, kvinne = 1 Utdanning: Antall år etter vgs. 1 Effekten av alder: Umulig å si noe generelt 2A Kvinner på 40 år som har 3 års utdanning, har en L på 2,5 og en odds på 12,18 for å være sjef – dvs. en sannsynlighet på 0,92 Umulig å si noe generelt om forhold mellom to grupper ift. sannsynlighet 2B JFRYE2005
Et forslag til tolknings- og formidlingsstrategi: Bruk først og fremst odds / oddsratio til å si noe om effekten av x på y Eks.: ’Modellen viser at utdanning øker oddsen [og dermed sannsynligheten] for å inneha en sjefsstilling. For hvert år ekstra utdanning man har, øker oddsen [og dermed sannsynligheten] med 1,65.’ Bruk predikerte sannsynlighetsverdier til å anskueliggjøre hva resultatene innebærer for konkrete grupper Eks.: Kvinner på 40 år som har 3 års utdanning, har en sannsynlighet på 0,92 for å inneha en sjefsstilling [L = 2,5 og odds = 12,18] Bruk prosentvis endring i oddsratio til å si noe om forskjeller mellom konkrete grupper. Eks.: ’Resultatene viser at kvinner har 63 prosent lavere odds enn menn til å inneha en sjefsstilling.’ Eller: ’Oddsratioen mellom kvinner og menn er 0,37.’ JFRYE2005
Men aller viktigst – for fortolkning og spesielt kommunikasjon av logistiske regresjonsresultater: BRUK GRAFER! (Men husk: grafer sier ikke noe annet enn matematikken – det er bare et triks for å anskueliggjøre matematiske relasjoner) JFRYE2005
’Grafisk grunnlogikk’ Vise hvordan Y endrer seg når X endrer seg. Velg ut X’en som du ønsker å belyse, regn ut de ulike Y-verdiene du får for forskjellige X-verdier Lag eventuelt særskilte grafer for spesielle grupper (for eksempel kvinner og menn, eller grupper med forskjellig utdanning) JFRYE2005
’Grafisk grunnlogikk’ 4: Husk at en graf i utgangspunktet er to-dimensjonal – med med pkt 3 så ’lurer’ vi inn enn tredje dimensjon (dimensjon = variabel i denne sammenhengen) 5: Kontinuerlige variabler på X-aksen gjør seg best! 6: Logistisk: Variablene som ikke belyses i den aktuelle grafen, må settes til en bestemt verdi og inkluderes i konstant-leddet (minimum, maksimum, gjennomsnitt, teoretisk definert) JFRYE2005
Og helt til slutt… Hva kan man tolke ut av konstantleddet? Ingenting – er bare med som et utgangspunkt for utregninger JFRYE2005
1: Fra p til O: O = p / q q = (1 - p) O = p / (1 - p) Hvis p = 0,4 O = 0,4 / (1 - 0,4) O = 0,4 / 0,6 O = 0,6667 SOS3003/JFRYE
2: Fra p til L: L = ln(O) = ln(p / q) = ln(p / (1 – p)) Hvis p = 0,4 L = ln (0,4 / (1 - 0,4)) L = ln (0,4 / 0,6) L = ln (0,6667) L = - 0,405 SOS3003/JFRYE
3: Fra O til p: p / (1 – p) = O p = O / (1 + O) Hvis O = 5 p = 5 / 1 + 5 p = 5 / 6 p = 0,8333 SOS3003/JFRYE
4: Fra O til L: L = ln (O) Hvis O = 5 L = ln(5) L = 1,609 SOS3003/JFRYE
5: Fra L til O: O = e L Hvis L = 1,2 O = e 1,2 O = 3,320 SOS3003/JFRYE
6: Fra L til p: p = 1 / (1 + e -L) Hvis L = 0,4 Hvis L = - 0,4 p = 1 / (1+ e -0,4) p = 1 / (1+ e –(-0,4)) p = 1 / (1 + (1 / e0,4)) p = 1 / (1 + e 0,4) p = 1 / (1 + (1 / 1,492)) p = 1 / (2,492) p = 1 / (1 + (0,670) p = 0,401 p = 1 / (1,670) p = 0,599 SOS3003/JFRYE