1 / 10

Logistisk regression

Logistisk regression. SCB September 2004 Dan Hedlin, U/MET-S. Y-variabeln binär (0 eller 1). Rösta eller ej, få cancer eller ej, leva under eller över en fattigdomsgräns, bortfall (se CBM ’Estimation in the presence of nonresponse’, avsnitt 6.1) Vid vanlig linjär regression Y ej begränsad

ranger
Download Presentation

Logistisk regression

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Logistisk regression SCB September 2004 Dan Hedlin, U/MET-S

  2. Y-variabeln binär (0 eller 1) • Rösta eller ej, få cancer eller ej, leva under eller över en fattigdomsgräns, bortfall (se CBM ’Estimation in the presence of nonresponse’, avsnitt 6.1) • Vid vanlig linjär regression Y ej begränsad • Knep: • p är sannolikheten för cancer etc.

  3. Alternativa uttrycksätt • Vanlig beteckning • Ekvivalent med

  4. Olika skalor • Log-odds (additiva effekter) • Odds p/(1-p) (multiplikativa effekter) • Sannolikhet Annan skillnad mot ’vanlig’ regression: • Iterativa beräkningar och andra ev. beräkningsproblem

  5. Tolkning av parametrarna • ’Bas-sannolikhet’ för • Kanske enklast att tolka i det fall x är intervall-variabler och nollpunkten är meningsfull

  6. Tolkning av ß • Modell med ’ett x’: • Eller • Additiv ökning av x med 1 steg motsvaras i denna modell med multiplikation av oddset med

  7. Klassiskt exempel • Bliss (1935), även i Agresti (1990) ’Catergorical Data Analysis’, Wiley, avsnitt 4.5.3. • Beetles, två intervall-variabler y = död/överlevt, x = log(dos koldisulfit) • Finns andra modeller för binärt y som kan vara bättre. Logistisk reg dock vanligast.

  8. Ca 1400 kvinnor i Uganda • Självuppskattad risk för AIDS (hög/låg) Förklarande variabler bl.a. • Ålder vid giftermål (alla ip har gift sig) • Ålder vid sexdebut • F.n. gift • Har stadig partner • Stad – landsbyggd • Använder kondom

  9. Modellbygge • Tabell låg-hög risk mot varje variabel för sig • Titta efter celler med nollor • Grovrens med t.ex. Forward selection och 25% signifikanstest • Testa var för sig • För kontinuerliga variabler: undersök linjäritet genom att kategorisera och beräkna log-odds inom kategorier • Prova samspelseffekter • Använd ämneskunskap och vett

  10. Multiplikativ effekt Vad oddset för hög risk multipliceras med om förklarande variabel ökas med ett steg Ålder vidgiftermål(5 års intervall) F.n. Ogift/Gift Samspel Har ej/Harpartner Stad/Landsbyggd 1.31 0.45 1.04 1.44 1.18

More Related