220 likes | 472 Views
Logistische regressie. Recap lineaire regressie:. Voorwaarden: Lineariteit: de relatie tussen Y en X is lineair (som residuen 0) Gelijke varianties: de standaardafwijking van Y is voor alle waarden van X gelijk (variantie van e constant)
E N D
Logistische regressie • Recap lineaire regressie: Voorwaarden: Lineariteit: de relatie tussen Y en X is lineair (som residuen 0) Gelijke varianties: de standaardafwijking van Y is voor alle waarden van X gelijk (variantie van e constant) Normaliteit: voor elke waarde van X volgt Y een normale verdeling (e normaal) Beperkte toepasbaarheid
Logistische regressie • Inleiding tot de logistische regressie: • Vorm • Karakteristieken • Toepasbaarheid • Voorbeelden
Logistische regressie • Het multicausaal probleem: Multicausaliteit: ? Voorbeeld: Ziekte (Y) = coronaire hartziekte (CHD) Dichotoom: 0 = niet ziek 1 = ziek Blootstelling (X) = roken (ROK) Dichotoom: 0 = neen 1 = ja Onderzoeksvraag: Is roken geassocieerd met het optreden van coronaire hartziekte ?
Logistische regressie • Het multicausaal probleem: Voor de analyse: gebruik een mathematisch model multiple regressie bij dichotome Y: gebruik een logistisch model
Logistische regressie ? • Voorbeeld: Controle voor: X2 = leeftijd X3 = ras X4 = geslacht ? Onafhankelijk Afhankelijk
Logistische regressie • Algemene notatie voor de onafhankelijke variabelen: Waarbij de X-en E’s, C’s of combinaties kunnen zijn. Voorbeelden:
Logistische regressie Logistische functie: • Waarom is de logistische regressie zo populair?
Logistische regressie • Logistisch model: Bij uitstek geschikt voor het modelleren van een probabiliteit Probabiliteit is de gemiddelde waarde van een dichotome variabele in de populatie (= individueel risico) Z = index van de combinatie van risicofactoren. drempel
Logistische regressie • Het logistisch model: Om uit de logistische functie tot een logistisch model te komen wordt: We substitueren deze uitdrukking in de logistische functie:
Logistische regressie • Epidemiologisch kader: We observeren op T0 bij een groep individuen de onafhankelijke variabelen X1, X2,…, Xk Voor deze individuen hebben we ook de ziektestatus bepaald (0/1) op T1 . We willen deze informatie gebruiken om de probabiliteit te schatten waarmee de ziekte in de loop van een periode (T0 - T1) voorkomt. T0 T1
Logistische regressie • Definitie van het logistisch model: Korter: Ongekende parameters
Logistische regressie • Toepassing van de formule aan de hand van een voorbeeld: Onderzoek naar de rol van catecholaminespiegel in het ontstaan van coronaire hartziekte, rekening houdend met leeftijd en EKG-status Y = CHD0-1 X1 = CAT0-1 X2 = LFTcontinu X3 = EKG0-1 n = 609 blanke mannen Bepaling van X1, X2, X3 op T0; Follow-up periode 9 jaar, waarin bepaling van Y
Logistische regressie logistisch model: ‘FIT’: op basis van de beschikbare gegevens worden de onbekende parameters geschat.
Logistische regressie Hoe P(X) berekenen? Stel: CAT = 1 LFT = 40 EKG = 0 Of : 11% risico (CI)
Logistische regressie Vergelijking met: CAT = 0 LFT = 40 EKG = 0 Bereken CI CIR:
Logistische regressie • Logit transformatie: Hoe kunnen we de odds ratio (OR) modelleren? LOGIT vorm: waarbij en dus
Logistische regressie lineaire som Dus: waarbij
Logistische regressie • Afleiding van de odds ratio (OR) formule: Algemene formule:
Logistische regressie 1) CAT = 1; LFT = 40; EKG = 0 2) CAT = 0; LFT = 40; EKG = 0 X1 = (CAT = 1; LFT = 40; EKG = 0) X0 = (CAT = 0; LFT = 40; EKG = 0) • Voorbeeld van een OR berekening: Waarbij beta1 de coëfficiënt van CAT is in
Logistische regressie • Algemeen: Gecorrigeerde odds ratio (OR) waarbij beta de coëfficiënt is van een dichotome (0/1) variabele Standard error en betrouwbaarheidsintervallen: cfr. statistische software
Logistische regressie • Strategie bij modelbouw: • Specifiëring van de variabelen • Bepalen van de aanwezigheid van interactie • Objectivering van verstoring • Zoeken naar precisie • Onderscheid modelbouw • predictie Y (bvb diagnose) • valide beta (bvb etiognose)
Logistische regressie • Voorbeeld: astma-studie • Specifiëring van de variabelen • Op basis van literatuur • Op basis van de eigen data Geslacht Q.38.1 Open kolen-, cokes- of houtvuur Leeftijd Q.38.2 Open gasvuur Roken nu Q.38.5 Gasboiler Roken gecumuleerde dosis Q.41.1 Voltapijt kamer Q.19 Roken moeder Q.41.2 Tapijt kamer Q.25 Moeder astma Q.42.2 Tapijt slappkamer Q.26 Moeder andere allergie Q.43 Slapen met open ramen Q.27 Vader astma Q.44 Ooit waterschade woning Q.31 Ernstige LWI < 5 jaar Q.44.1 Laatste 12 maanden waterschade Q.32.1 Leeftijd schoolbeëindiging Q.45.1 Water op de keldervloer Q.32.7 Blootstelling werk Q.46 Schimmelplekken woning Q.35 Ouderdom woning Q.47 Luchtbevochtiger Q.36 Beschrijving woning Q.37.1 Centrale verwarming Q.37.2 Warme luchtverwarming Q.37.3 Air conditioning