100 likes | 292 Views
Logistisk regression. SCB September 2004 Dan Hedlin, U/MET-S. Y-variabeln binär (0 eller 1). Rösta eller ej, få cancer eller ej, leva under eller över en fattigdomsgräns, bortfall (se CBM ’Estimation in the presence of nonresponse’, avsnitt 6.1) Vid vanlig linjär regression Y ej begränsad
E N D
Logistisk regression SCB September 2004 Dan Hedlin, U/MET-S
Y-variabeln binär (0 eller 1) • Rösta eller ej, få cancer eller ej, leva under eller över en fattigdomsgräns, bortfall (se CBM ’Estimation in the presence of nonresponse’, avsnitt 6.1) • Vid vanlig linjär regression Y ej begränsad • Knep: • p är sannolikheten för cancer etc.
Alternativa uttrycksätt • Vanlig beteckning • Ekvivalent med
Olika skalor • Log-odds (additiva effekter) • Odds p/(1-p) (multiplikativa effekter) • Sannolikhet Annan skillnad mot ’vanlig’ regression: • Iterativa beräkningar och andra ev. beräkningsproblem
Tolkning av parametrarna • ’Bas-sannolikhet’ för • Kanske enklast att tolka i det fall x är intervall-variabler och nollpunkten är meningsfull
Tolkning av ß • Modell med ’ett x’: • Eller • Additiv ökning av x med 1 steg motsvaras i denna modell med multiplikation av oddset med
Klassiskt exempel • Bliss (1935), även i Agresti (1990) ’Catergorical Data Analysis’, Wiley, avsnitt 4.5.3. • Beetles, två intervall-variabler y = död/överlevt, x = log(dos koldisulfit) • Finns andra modeller för binärt y som kan vara bättre. Logistisk reg dock vanligast.
Ca 1400 kvinnor i Uganda • Självuppskattad risk för AIDS (hög/låg) Förklarande variabler bl.a. • Ålder vid giftermål (alla ip har gift sig) • Ålder vid sexdebut • F.n. gift • Har stadig partner • Stad – landsbyggd • Använder kondom
Modellbygge • Tabell låg-hög risk mot varje variabel för sig • Titta efter celler med nollor • Grovrens med t.ex. Forward selection och 25% signifikanstest • Testa var för sig • För kontinuerliga variabler: undersök linjäritet genom att kategorisera och beräkna log-odds inom kategorier • Prova samspelseffekter • Använd ämneskunskap och vett
Multiplikativ effekt Vad oddset för hög risk multipliceras med om förklarande variabel ökas med ett steg Ålder vidgiftermål(5 års intervall) F.n. Ogift/Gift Samspel Har ej/Harpartner Stad/Landsbyggd 1.31 0.45 1.04 1.44 1.18