1.31k likes | 1.52k Views
Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek. 06-5 13-5 27-5 03-6 10-6 17-6. Confounding, standaardisatie, Mantel Haenszel Enkelvoudige logistische reg. Dummy variabelen Log.reg. Met covariaten en interactie Bespreking opdrachten
E N D
Cursus Mei – Juni 2002Kruistabelanalyse & Logistische regressieFrans Tan Methodologie en Statistiek
06-5 13-5 27-5 03-6 10-6 17-6 Confounding, standaardisatie, Mantel Haenszel Enkelvoudige logistische reg. Dummy variabelen Log.reg. Met covariaten en interactie Bespreking opdrachten Vergelijking met Ancova Bespreking opdrachten Programma
Voorkennis • Toetsingstheorie • Multipele regressie Onderwerpen • Confounding • Standaardisatie/stratificatie/Mantel-Haenszel • Logistische regressie
Onderzoekskader: valideringsproblemen • Effect van een bepaalde behandeling op objects (bijv. Personen) • Ook algemener: (causaal) effect van een grootheid X op een grootheid Y
Onderzoekskader: valideringsproblemen behandeling Groep discrepantie Geen behandeling Ideale situatie niet haalbaar. Werken met proxy-controle groep
Onderzoekskader: valideringsproblemen Confounding (adequacy of the control group) • De groepen kunnen van elkaar verschillen door andere factoren (welke op zichzelf gerelateerd zijn aan de afhankelijke variabele) dan de behandeling zelf • Associatie impliceert niet causale relatie tussen X en Y • Voldoende voor geen confounding is - een gebalanceerd design- een gerandomiseerde toewijzing in groepen
Onderzoekskader: valideringsproblemen • Definitie volgens adequaatheid van de controle groep vaak verward met collapsibility principe • Collapsibility: er is sprake van confounding als de ruwe (marginale) associatie ongelijk is aan de stratumspecifieke associatie
Illustratie 1. De (fictieve) resultaten van een onderzoek naar de effectiviteit van veiligheidsgordels Snelheid een confounder ?
Illustratie 2. Effect leeftijd moeder op sterfte bij geboorte kind Geboortegewicht een confounder ?
Illustratie 3. Effect medicijn op genezingeen gebalanceerd design Ernst van de ziekte een confounder ?
Confounding Als een factor C een confounder is, dan • C is geen causaal gevolg van R (mediator) • Geen gerandomiseerd design • Geen balanced design • Ruwe RR(OR) ongelijk aan de stratum specifieke RR (OR)
Confounding • Het negeren van een confounder leidt tot vertekende resultaten (bias) • Een maat voor de invloed van een confounder is bias • Stel de werkelijke (populatie) waarde van een behandelingseffect en ô een schatter voor bias (ô) = verwachte waarde (ô) - waarbij de verwachte waarde gelijk is aan de gemiddelde waarde van alle mogelijke ô ‘s na een groot aantal herhalingen van het onderzoek
Methoden voor bias controle • Standaardisatie- directe- indirecte • Stratificatie volgens Mantel Haenszel • Correlationele methoden
Directe standaardisatie Verdeling van de confounder standaardiseren door een verdeling van een standaard populatie Relatief risico groep 1 t.o.v groep 2
Indirecte standaardisatie Verdeling van de specifieke fracties standaardiseren en vervolgens correctie toepassen m.b.v. SMR Als standaard populatie de controle groep is, dan is Rradj = SMR
Enkele opmerkingen • Compacte samenvatting van wat gaande is • Als steekproefaantal per stratum klein of zelfs nul • Als RR constant over strata van de confounder, dan levert de directe methode veelal een schatting op zonder vertekening • Indirecte standaardisatie alleen onvertekend als standaard populatie een van de groepen is • Geen toets voorhanden • Variatie over strata door standaardisatie gemaskeerd
Stratificatie volgens Mantel Haenszel • Is de associatie consistent over strata, d.w.z. zijn de waargenomen verschillen toe te schrijven aan toeval? • Stel associatie consistent over strata. Is de overall associatie gecorrigeerd voor confounder statistisch significant? • Stel overall associatie is statistisch significant. Hoe groot is de standaardfout van de overall schatting?
Stratificatie volgens Mantel Haenszel • Als associatie niet consistent, dan Mantel Haenszel niet geschikt • Mogelijk betrouwbaarheidsintervallen te contrueren • Onder consistentie is de Mantel-Haenszel schatter onvertekend
Logistisch regressiemodel • sgewijze logistische regressie • lll
Logistisch regressiemodel • Beperking lineaire regressiemodel • Specificatie van het model • Vergelijking met een kruistabelanalyse • Model met covariaat/interactie • Toetsen voor het vergelijken tussen modellen • Stapsgewijze logistische regressie
Logistisch regressiemodel • Beperking lineaire regressiemodel • Specificatie van het model • Vergelijking met een kruistabelanalyse • Model met covariaat/interactie • Toetsen voor het vergelijken tussen modellen • Stapsgewijze logistische regressie
Logistisch regressiemodel • Beperking lineaire regressiemodel • Specificatie van het model • Vergelijking met een kruistabelanalyse • Model met covariaat/interactie • Toetsen voor het vergelijken tussen modellen • Stapsgewijze logistische regressie
Logistisch regressiemodel • Beperking lineaire regressiemodel • Specificatie van het model • Vergelijking met een kruistabelanalyse • Model met covariaat/interactie • Toetsen voor het vergelijken tussen modellen • Stapsgewijze logistische regressie
Logistisch regressiemodel • Beperking lineaire regressiemodel • Specificatie van het model • Vergelijking met een kruistabelanalyse • Model met covariaat/interactie • Toetsen voor het vergelijken tussen modellen • Stapsgewijze logistische regressie
Logistisch regressiemodel • Beperking lineaire regressiemodel • Specificatie van het model • Vergelijking met een kruistabelanalyse • Model met covariaat/interactie • Toetsen voor het vergelijken tussen modellen
Logistisch regressiemodel CIJFER STUDIETIJD model: y is continu en x mag discreet zijn
Logistisch regressiemodel 1 UITSLAG 0 STUDIETIJD wat als y dichotoom is ?
Logistisch regressiemodel 1 UITSLAG 0 STUDIETIJD bepaal het percentage geslaagden per studie-tijdsinterval
Logistisch regressiemodel 1 UITSLAG 0 STUDIETIJD bepaal het percentage geslaagden per studie-tijdsinterval
Logistisch regressiemodel 1 EEN MODEL DAT IN VEEL GEVALLEN ZO’N S-VORMIG VERBAND GOED BESCHRIJFT IS SLAGINGS PERCENTAGE 0 X = STUDIETIJD IN PLAATS VAN NOTEREN WE
Logistisch regressiemodel een model dat in veel gevallen zo’n s-vormig verband goed beschrijft is 1 SLAGINGS PERCENTAGE 0 X = STUDIETIJD IN PLAATS VAN NOTEREN WE
Logistisch regressiemodel een model dat in veel gevallen zo’n s-vormig verband goed beschrijft is 1 SLAGINGS PERCENTAGE 0 X = STUDIETIJD In plaats van Noteren we
Logistisch regressiemodel • Beperking lineaire regressiemodel • Specificatie van het model • Vergelijking met een kruistabelanalyse • Model met covariaat/interactie • Toetsen voor het vergelijken tussen modellen • Stapsgewijze logistische regressie
Specificatie van het modellogistisch regressiemodel Het logistische model Kan herschreven worden als In plaats van noteren we ook Logit(p) of ln(odds)
Specificatie van het modellogistisch regressiemodel P 1 0 X = STUDIETIJD
Specificatie van het modellogistisch regressiemodel 1 0 X = STUDIETIJD
Specificatie van het model • Y = Dropout (wel =1, niet =0)X = jaarcohort
Specificatie van het model • Als logistische regressiemodel:logit (p) = 0 + 1 Cohort
Specificatie van het modelgroot steekproefaantal • Als benadering van logistische regressiemodel:logit (f) = 0 + 1 Cohort +
Specificatie van het modelgroot steekproefaantal • Als benadering van logistische regressiemodel:logit (f) = 0 + 1 Cohort + • Problem: als p=0, dan logit (f) bestaat niet • Oplossing: logit(f + c) met c een klein positief getal bijvoorbeeld 0.01 R-square = 0.504
Specificatie van het modelgroot steekproefaantal • Als lineair kansmodel:f = 0 + 1 Cohort +
Specificatie van het modelgroot steekproefaantal • Als lineair kansmodel:f = 0 + 1 Cohort + R-square = 0.502
Logistisch regressiemodel • Beperking lineaire regressiemodel • Specificatie van het model • Vergelijking met een kruistabelanalyse • Model met covariaat/interactie • Toetsen voor het vergelijken tussen modellen • Stapsgewijze logistische regressie
Vergelijking met een kruistabelanalyselogistisch regressiemodel Voorbeeld: effect van geslacht op toelating tot de universiteit berkeley.
Vergelijking met een kruistabelanalyselogistisch regressiemodel vraag: hebben mannen meer kans toegelaten te worden tot de universiteit IN TERMEN VAN KANSEN RELATIEVE SUCCESKANS (IN LITERATUUR: RELATIEF RISICO (RR)) MANNEN WORDEN EERDER TOEGELATEN TOT DE UNIVERSITEIT
Vergelijking met een kruistabelanalyselogistisch regressiemodel vraag: hebben mannen meer kans toegelaten te worden tot de universiteit in termen van kansen
Vergelijking met een kruistabelanalyselogistisch regressiemodel vraag: hebben mannen meer kans toegelaten te worden tot de universiteit in termen van kansen relatieve succeskans (in literatuur: relatief risico (rr)) mannen worden eerder toegelaten tot de universiteit
Vergelijking met een kruistabelanalyselogistisch regressiemodel in termen van odds RELATIEVE ODDS (IN LITERATUUR: ODDSRATIO(OR)) MANNEN WORDEN EERDER TOEGELATEN TOT DE UNIVERSITEIT
Vergelijking met een kruistabelanalyselogistisch regressiemodel in termen van odds relatieve odds (in literatuur: oddsratio(or)) mannen worden eerder toegelaten tot de universiteit
Vergelijking met een kruistabelanalyselogistisch regressiemodel • Het verschil tussen rr (=1.34) en or (= 1.84) is een verschil in schaling • Belangrijk voor interpretatie:als rr > (of <) 1, dan or > (of <) 1