1 / 22

Logistische regressie

Logistische regressie. Recap lineaire regressie:. Voorwaarden: Lineariteit: de relatie tussen Y en X is lineair (som residuen 0) Gelijke varianties: de standaardafwijking van Y is voor alle waarden van X gelijk (variantie van e constant)

alina
Download Presentation

Logistische regressie

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Logistische regressie • Recap lineaire regressie: Voorwaarden: Lineariteit: de relatie tussen Y en X is lineair (som residuen 0) Gelijke varianties: de standaardafwijking van Y is voor alle waarden van X gelijk (variantie van e constant) Normaliteit: voor elke waarde van X volgt Y een normale verdeling (e normaal) Beperkte toepasbaarheid

  2. Logistische regressie • Inleiding tot de logistische regressie: • Vorm • Karakteristieken • Toepasbaarheid • Voorbeelden

  3. Logistische regressie • Het multicausaal probleem: Multicausaliteit: ? Voorbeeld: Ziekte (Y) = coronaire hartziekte (CHD) Dichotoom: 0 = niet ziek 1 = ziek Blootstelling (X) = roken (ROK) Dichotoom: 0 = neen 1 = ja Onderzoeksvraag: Is roken geassocieerd met het optreden van coronaire hartziekte ?

  4. Logistische regressie • Het multicausaal probleem: Voor de analyse: gebruik een mathematisch model multiple regressie bij dichotome Y: gebruik een logistisch model

  5. Logistische regressie ? • Voorbeeld: Controle voor: X2 = leeftijd X3 = ras X4 = geslacht ? Onafhankelijk Afhankelijk

  6. Logistische regressie • Algemene notatie voor de onafhankelijke variabelen: Waarbij de X-en E’s, C’s of combinaties kunnen zijn. Voorbeelden:

  7. Logistische regressie Logistische functie: • Waarom is de logistische regressie zo populair?

  8. Logistische regressie • Logistisch model: Bij uitstek geschikt voor het modelleren van een probabiliteit Probabiliteit is de gemiddelde waarde van een dichotome variabele in de populatie (= individueel risico) Z = index van de combinatie van risicofactoren. drempel

  9. Logistische regressie • Het logistisch model: Om uit de logistische functie tot een logistisch model te komen wordt: We substitueren deze uitdrukking in de logistische functie:

  10. Logistische regressie • Epidemiologisch kader: We observeren op T0 bij een groep individuen de onafhankelijke variabelen X1, X2,…, Xk Voor deze individuen hebben we ook de ziektestatus bepaald (0/1) op T1 . We willen deze informatie gebruiken om de probabiliteit te schatten waarmee de ziekte in de loop van een periode (T0 - T1) voorkomt. T0 T1

  11. Logistische regressie • Definitie van het logistisch model: Korter: Ongekende parameters

  12. Logistische regressie • Toepassing van de formule aan de hand van een voorbeeld: Onderzoek naar de rol van catecholaminespiegel in het ontstaan van coronaire hartziekte, rekening houdend met leeftijd en EKG-status Y = CHD0-1 X1 = CAT0-1 X2 = LFTcontinu X3 = EKG0-1 n = 609 blanke mannen Bepaling van X1, X2, X3 op T0; Follow-up periode 9 jaar, waarin bepaling van Y

  13. Logistische regressie logistisch model: ‘FIT’: op basis van de beschikbare gegevens worden de onbekende parameters geschat.

  14. Logistische regressie Hoe P(X) berekenen? Stel: CAT = 1 LFT = 40 EKG = 0 Of : 11% risico (CI)

  15. Logistische regressie Vergelijking met: CAT = 0 LFT = 40 EKG = 0 Bereken CI CIR:

  16. Logistische regressie • Logit transformatie: Hoe kunnen we de odds ratio (OR) modelleren? LOGIT vorm: waarbij en dus

  17. Logistische regressie lineaire som Dus: waarbij

  18. Logistische regressie • Afleiding van de odds ratio (OR) formule: Algemene formule:

  19. Logistische regressie 1) CAT = 1; LFT = 40; EKG = 0 2) CAT = 0; LFT = 40; EKG = 0 X1 = (CAT = 1; LFT = 40; EKG = 0) X0 = (CAT = 0; LFT = 40; EKG = 0) • Voorbeeld van een OR berekening: Waarbij beta1 de coëfficiënt van CAT is in

  20. Logistische regressie • Algemeen: Gecorrigeerde odds ratio (OR) waarbij beta de coëfficiënt is van een dichotome (0/1) variabele Standard error en betrouwbaarheidsintervallen: cfr. statistische software

  21. Logistische regressie • Strategie bij modelbouw: • Specifiëring van de variabelen • Bepalen van de aanwezigheid van interactie • Objectivering van verstoring • Zoeken naar precisie • Onderscheid modelbouw • predictie Y (bvb diagnose) • valide beta (bvb etiognose)

  22. Logistische regressie • Voorbeeld: astma-studie • Specifiëring van de variabelen • Op basis van literatuur • Op basis van de eigen data Geslacht Q.38.1 Open kolen-, cokes- of houtvuur Leeftijd Q.38.2 Open gasvuur Roken nu Q.38.5 Gasboiler Roken gecumuleerde dosis Q.41.1 Voltapijt kamer Q.19 Roken moeder Q.41.2 Tapijt kamer Q.25 Moeder astma Q.42.2 Tapijt slappkamer Q.26 Moeder andere allergie Q.43 Slapen met open ramen Q.27 Vader astma Q.44 Ooit waterschade woning Q.31 Ernstige LWI < 5 jaar Q.44.1 Laatste 12 maanden waterschade Q.32.1 Leeftijd schoolbeëindiging Q.45.1 Water op de keldervloer Q.32.7 Blootstelling werk Q.46 Schimmelplekken woning Q.35 Ouderdom woning Q.47 Luchtbevochtiger Q.36 Beschrijving woning Q.37.1 Centrale verwarming Q.37.2 Warme luchtverwarming Q.37.3 Air conditioning

More Related