1 / 130

Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek

Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek. 06-5 13-5 27-5 03-6 10-6 17-6. Confounding, standaardisatie, Mantel Haenszel Enkelvoudige logistische reg. Dummy variabelen Log.reg. Met covariaten en interactie Bespreking opdrachten

chambray
Download Presentation

Cursus Mei – Juni 2002 Kruistabelanalyse & Logistische regressie Frans Tan Methodologie en Statistiek

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Cursus Mei – Juni 2002Kruistabelanalyse & Logistische regressieFrans Tan Methodologie en Statistiek

  2. 06-5 13-5 27-5 03-6 10-6 17-6 Confounding, standaardisatie, Mantel Haenszel Enkelvoudige logistische reg. Dummy variabelen Log.reg. Met covariaten en interactie Bespreking opdrachten Vergelijking met Ancova Bespreking opdrachten Programma

  3. Voorkennis • Toetsingstheorie • Multipele regressie Onderwerpen • Confounding • Standaardisatie/stratificatie/Mantel-Haenszel • Logistische regressie

  4. Onderzoekskader: valideringsproblemen • Effect van een bepaalde behandeling op objects (bijv. Personen) • Ook algemener: (causaal) effect van een grootheid X op een grootheid Y

  5. Onderzoekskader: valideringsproblemen behandeling Groep discrepantie Geen behandeling Ideale situatie niet haalbaar. Werken met proxy-controle groep

  6. Onderzoekskader: valideringsproblemen Confounding (adequacy of the control group) • De groepen kunnen van elkaar verschillen door andere factoren (welke op zichzelf gerelateerd zijn aan de afhankelijke variabele) dan de behandeling zelf • Associatie impliceert niet causale relatie tussen X en Y • Voldoende voor geen confounding is - een gebalanceerd design- een gerandomiseerde toewijzing in groepen

  7. Onderzoekskader: valideringsproblemen • Definitie volgens adequaatheid van de controle groep vaak verward met collapsibility principe • Collapsibility: er is sprake van confounding als de ruwe (marginale) associatie ongelijk is aan de stratumspecifieke associatie

  8. Illustratie 1. De (fictieve) resultaten van een onderzoek naar de effectiviteit van veiligheidsgordels Snelheid een confounder ?

  9. Illustratie 2. Effect leeftijd moeder op sterfte bij geboorte kind Geboortegewicht een confounder ?

  10. Illustratie 3. Effect medicijn op genezingeen gebalanceerd design Ernst van de ziekte een confounder ?

  11. Confounding Als een factor C een confounder is, dan • C is geen causaal gevolg van R (mediator) • Geen gerandomiseerd design • Geen balanced design • Ruwe RR(OR) ongelijk aan de stratum specifieke RR (OR)

  12. Confounding • Het negeren van een confounder leidt tot vertekende resultaten (bias) • Een maat voor de invloed van een confounder is bias • Stel  de werkelijke (populatie) waarde van een behandelingseffect en ô een schatter voor bias (ô) = verwachte waarde (ô) - waarbij de verwachte waarde gelijk is aan de gemiddelde waarde van alle mogelijke ô ‘s na een groot aantal herhalingen van het onderzoek

  13. Methoden voor bias controle • Standaardisatie- directe- indirecte • Stratificatie volgens Mantel Haenszel • Correlationele methoden

  14. Directe standaardisatie Verdeling van de confounder standaardiseren door een verdeling van een standaard populatie Relatief risico groep 1 t.o.v groep 2

  15. Indirecte standaardisatie Verdeling van de specifieke fracties standaardiseren en vervolgens correctie toepassen m.b.v. SMR Als standaard populatie de controle groep is, dan is Rradj = SMR

  16. Enkele opmerkingen • Compacte samenvatting van wat gaande is • Als steekproefaantal per stratum klein of zelfs nul • Als RR constant over strata van de confounder, dan levert de directe methode veelal een schatting op zonder vertekening • Indirecte standaardisatie alleen onvertekend als standaard populatie een van de groepen is • Geen toets voorhanden • Variatie over strata door standaardisatie gemaskeerd

  17. Stratificatie volgens Mantel Haenszel • Is de associatie consistent over strata, d.w.z. zijn de waargenomen verschillen toe te schrijven aan toeval? • Stel associatie consistent over strata. Is de overall associatie gecorrigeerd voor confounder statistisch significant? • Stel overall associatie is statistisch significant. Hoe groot is de standaardfout van de overall schatting?

  18. Stratificatie volgens Mantel Haenszel • Als associatie niet consistent, dan Mantel Haenszel niet geschikt • Mogelijk betrouwbaarheidsintervallen te contrueren • Onder consistentie is de Mantel-Haenszel schatter onvertekend

  19. Logistisch regressiemodel • sgewijze logistische regressie • lll

  20. Logistisch regressiemodel • Beperking lineaire regressiemodel • Specificatie van het model • Vergelijking met een kruistabelanalyse • Model met covariaat/interactie • Toetsen voor het vergelijken tussen modellen • Stapsgewijze logistische regressie

  21. Logistisch regressiemodel • Beperking lineaire regressiemodel • Specificatie van het model • Vergelijking met een kruistabelanalyse • Model met covariaat/interactie • Toetsen voor het vergelijken tussen modellen • Stapsgewijze logistische regressie

  22. Logistisch regressiemodel • Beperking lineaire regressiemodel • Specificatie van het model • Vergelijking met een kruistabelanalyse • Model met covariaat/interactie • Toetsen voor het vergelijken tussen modellen • Stapsgewijze logistische regressie

  23. Logistisch regressiemodel • Beperking lineaire regressiemodel • Specificatie van het model • Vergelijking met een kruistabelanalyse • Model met covariaat/interactie • Toetsen voor het vergelijken tussen modellen • Stapsgewijze logistische regressie

  24. Logistisch regressiemodel • Beperking lineaire regressiemodel • Specificatie van het model • Vergelijking met een kruistabelanalyse • Model met covariaat/interactie • Toetsen voor het vergelijken tussen modellen • Stapsgewijze logistische regressie

  25. Logistisch regressiemodel • Beperking lineaire regressiemodel • Specificatie van het model • Vergelijking met een kruistabelanalyse • Model met covariaat/interactie • Toetsen voor het vergelijken tussen modellen

  26. Logistisch regressiemodel CIJFER STUDIETIJD model: y is continu en x mag discreet zijn

  27. Logistisch regressiemodel 1 UITSLAG 0 STUDIETIJD wat als y dichotoom is ?

  28. Logistisch regressiemodel 1 UITSLAG 0 STUDIETIJD bepaal het percentage geslaagden per studie-tijdsinterval

  29. Logistisch regressiemodel 1 UITSLAG 0 STUDIETIJD bepaal het percentage geslaagden per studie-tijdsinterval

  30. Logistisch regressiemodel 1 EEN MODEL DAT IN VEEL GEVALLEN ZO’N S-VORMIG VERBAND GOED BESCHRIJFT IS SLAGINGS PERCENTAGE 0 X = STUDIETIJD IN PLAATS VAN NOTEREN WE

  31. Logistisch regressiemodel een model dat in veel gevallen zo’n s-vormig verband goed beschrijft is 1 SLAGINGS PERCENTAGE 0 X = STUDIETIJD IN PLAATS VAN NOTEREN WE

  32. Logistisch regressiemodel een model dat in veel gevallen zo’n s-vormig verband goed beschrijft is 1 SLAGINGS PERCENTAGE 0 X = STUDIETIJD In plaats van Noteren we

  33. Logistisch regressiemodel • Beperking lineaire regressiemodel • Specificatie van het model • Vergelijking met een kruistabelanalyse • Model met covariaat/interactie • Toetsen voor het vergelijken tussen modellen • Stapsgewijze logistische regressie

  34. Specificatie van het modellogistisch regressiemodel Het logistische model Kan herschreven worden als In plaats van noteren we ook Logit(p) of ln(odds)

  35. Specificatie van het modellogistisch regressiemodel P 1 0 X = STUDIETIJD

  36. Specificatie van het modellogistisch regressiemodel 1 0 X = STUDIETIJD

  37. Specificatie van het model • Y = Dropout (wel =1, niet =0)X = jaarcohort

  38. Specificatie van het model • Als logistische regressiemodel:logit (p) = 0 + 1 Cohort

  39. Specificatie van het modelgroot steekproefaantal • Als benadering van logistische regressiemodel:logit (f) = 0 + 1 Cohort + 

  40. Specificatie van het modelgroot steekproefaantal • Als benadering van logistische regressiemodel:logit (f) = 0 + 1 Cohort +  • Problem: als p=0, dan logit (f) bestaat niet • Oplossing: logit(f + c) met c een klein positief getal bijvoorbeeld 0.01 R-square = 0.504

  41. Specificatie van het modelgroot steekproefaantal • Als lineair kansmodel:f = 0 + 1 Cohort + 

  42. Specificatie van het modelgroot steekproefaantal • Als lineair kansmodel:f = 0 + 1 Cohort +  R-square = 0.502

  43. Logistisch regressiemodel • Beperking lineaire regressiemodel • Specificatie van het model • Vergelijking met een kruistabelanalyse • Model met covariaat/interactie • Toetsen voor het vergelijken tussen modellen • Stapsgewijze logistische regressie

  44. Vergelijking met een kruistabelanalyselogistisch regressiemodel Voorbeeld: effect van geslacht op toelating tot de universiteit berkeley.

  45. Vergelijking met een kruistabelanalyselogistisch regressiemodel vraag: hebben mannen meer kans toegelaten te worden tot de universiteit IN TERMEN VAN KANSEN RELATIEVE SUCCESKANS (IN LITERATUUR: RELATIEF RISICO (RR)) MANNEN WORDEN EERDER TOEGELATEN TOT DE UNIVERSITEIT

  46. Vergelijking met een kruistabelanalyselogistisch regressiemodel vraag: hebben mannen meer kans toegelaten te worden tot de universiteit in termen van kansen

  47. Vergelijking met een kruistabelanalyselogistisch regressiemodel vraag: hebben mannen meer kans toegelaten te worden tot de universiteit in termen van kansen relatieve succeskans (in literatuur: relatief risico (rr)) mannen worden eerder toegelaten tot de universiteit

  48. Vergelijking met een kruistabelanalyselogistisch regressiemodel in termen van odds RELATIEVE ODDS (IN LITERATUUR: ODDSRATIO(OR)) MANNEN WORDEN EERDER TOEGELATEN TOT DE UNIVERSITEIT

  49. Vergelijking met een kruistabelanalyselogistisch regressiemodel in termen van odds relatieve odds (in literatuur: oddsratio(or)) mannen worden eerder toegelaten tot de universiteit

  50. Vergelijking met een kruistabelanalyselogistisch regressiemodel • Het verschil tussen rr (=1.34) en or (= 1.84) is een verschil in schaling • Belangrijk voor interpretatie:als rr > (of <) 1, dan or > (of <) 1

More Related