340 likes | 565 Views
Hoofdstuk 3. Gegevens verwerven. Bij de analyse van gegevens 2 doelstellingen: 1. Exploratieve data-analyse geen specifieke vragen onbekende gegevens, grafisch bekijken patronen zoeken, nieuwe vragen, verder onderzoek zelden overtuigende bewijzen 2. Formele statistische inferentie
E N D
Hoofdstuk 3 Gegevens verwerven
Bij de analyse van gegevens 2 doelstellingen: • 1. Exploratieve data-analyse • geen specifieke vragen • onbekende gegevens, grafisch bekijken • patronen zoeken, nieuwe vragen, verder onderzoek • zelden overtuigende bewijzen • 2. Formele statistische inferentie • antwoorden op specifieke vragen • minder grafisch, vooral numeriek • maat voor betrouwbaarheid van conclusies
3.1. Eerste stappen • Wat meten : variabelen ? • Hoe meten : instrumenten of methoden ? • ONTWERPEN : methodiek voor het verwerven van data
A. Waar kan men gegevens vinden ? • Voorbeeld : Hoe vaak komt dit fenomeen voor in de populatie ? • Anekdotisch bewijsmateriaal : lukraak gekozen individuen, niet representatief • Beschikbare gegevens : kunnen vroeger verkregen data een antwoord bieden • Nieuwe data verwerven door steekproeftrekking of experimenten
B. Steekproeftrekking • Steekproeftrekking : een gedeelte bestuderen (steekproef) om zicht te krijgen op het geheel (populatie) • Opdat conclusies zouden gelden voor de hele populatie moet steekproef goed gekozen worden
C. Experimenten • In steekproef : info verzamelen zonder iets te veranderen • In experiment : effect van ingreep meten • DE manier om oorzaak-gevolg relatie vast te stellen • DE methode die gebruikt wordt om kennis te verzamelen in de wetenschap
3.2. Proefopzet : opzet van experimenten • Basisterminologie : • elementen of proefpersonen • experimentele conditie of behandeling • Voorbeeld : medicijn voor beter presteren • medicijn A en B (Factor 1 met 2 niveaus) • tijdstip 10’ 20’ 30’ (Factor 2 met 3 niveaus)
Factor 1 : tijd (3niveaus) Factor 2 : Medicijn (2niv) => 6 experimentele condities of behandelingen
Alle andere factoren worden constant gehouden in een experiment • DUS conclusies van 1 variabele op een andere • Goed bewijs leveren van een causaal verband • In experiment kunnen ook interacties tussen factoren bekeken worden • bv. 10’ medicijn A effectief en 30’ medicijn B
A. Vergelijkende experimenten • Meest eenvoudig opzet : waarneming pre - behandeling - waarneming post pijn - medicijn - pijn • MAAR placebo-effect • DUS : NIET 1 behandeling behandelingen VERGELIJKEN => gebruik maken van een controlegroep
Placebo = schijnbehandeling • Placebo effect: positief reageren ook al is er maar een schijnbehandeling (wegens vertrouwen in de arts of hoop op genezing, verwachting) • In experiment : beheersing van de effecten van externe variabelen (bv. omgeving, vertrouwen in arts, verwachting, …) • Vertekening : als systematisch bepaalde uitkomsten bevoordeeld worden • bv. medicijn zonder controlegroep
B. Randomisatie • Indien twee groepen in een experiment vergeleken moeten worden, moeten deze groepen ook vergelijkbaar zijn • Twee groepen koppelen of matchen op bepaalde variabelen bv. leeftijd, geslacht, conditie, … • MAAR : verborgen variabelen, moeilijk meten
Beter : randomisatie = toewijzen aan een groep op basis van toeval gerandomiseerde toewijzing groep 1 groep 2 behandeling 1 behandeling 2 vergelijk reacties
Door toewijzing op basis van toeval • geen systematische verschillen tussen groepen • wel toevallige verschillen tussen groepen • Bij vergelijking tussen groepen na behandeling : • verschil dat te groot is om toegeschreven te worden aan toeval = STATISTISCH SIGNIFICANT = toe te schrijven aan de behandeling • groepen moeten wel voldoende groot zijn !!
Basisprincipes van experimenten : 1. Beheersing door vergelijking 2. Randomisatie bij toewijzing 3. Herhaling op voldoende proefpersonen
C. Hoe randomisatie doen • Briefjes trekken uit een hoed • Tabel van toevalscijfers gebruiken (Tabel B) • Volledig gerandomiseerd : als alle onderzoekseenheden op toevallige wijze zijn toegewezen
D. Waarschuwingen bij experimenten • Verborgen vertekening : ene groep anders behandelen dan andere groep => oplossing : dubbelblind experiment : proefpersoon en proefleider weten niet in welke groep proefpersoon zit • Gebrek aan realisme : opzet van experiment is te verschillend van realiteit : goede kennis van vakgebied is noodzakelijk
E. Andere proefopzetten • Naast volledig gerandomiseerd proefopzet • Ontwerp van gekoppelde paren : • niet volledig random • blokken op grond van belangrijkste onvermijdelijke bronnen van variabiliteit • binnen de blokken opnieuw randomiseren • Voorbeeld : indien geslacht een rol speelt : eerst blokken op basis van geslacht
Proefpersonen Mannen Vrouwen Th1 Th2 Th3 Th1 Th2 Th3 Vergelijken Vergelijken
3.3. Een steekproeftrekking ontwerpen • Basisterminologie: • hele groep = populatie • elementen zijn leden van de populatie • steekproef is gedeelte van populatie dat wordt onderzocht • Vertekening of systematische fouten door sommige delen van populatie te bevoordelen • bv. vrijwillige reactie (70% geen kinderen meer)
A. Enkelvoudige aselecte steekproef • Op zo een manier gekozen dat elke verzameling met n elementen evenveel kans heeft om de steekproef te zijn • Systematische aselecte steekproef : bv. elke 7de van de lijst : • wel elke eenheid evenveel kans • niet elke verzameling eenheden evenveel kans
B. Gestratifieerde steekproeven • Kanssteekproeftrekking : elk lid heeft op voorhand een gegeven kans om getrokken te worden (indien iedereen gelijk = EAS) • Gestratifieerde aselecte steekproef • stratum op voor hand bepalen • dan EAS uit de verschillende strata
Strata (cfr. Blokontwerpen) : feiten die op voorhand bekend zijn: stratum = groepen van overeenkomstige individuen • Bv. Stratifiëren op : • Geslacht • Leeftijd • SES • Gezondheidskenmerken (rokers vs niet-rokers)
C. Getrapte steekproeven • Getrapte steekproef : bv. 1. steekproef van gemeenten 2. steekproef van postcodes uit gemeenten 3. steekproef van straten uit postcodes 4. steekproef van huisnummers uit straten • Dit kan ook via gestratifieerde steekproef : • Plattelandsgemeenten, stadsrand, stad
D. Waarschuwingen bij steekproefonderzoek • Onvolledige dekking : populatie niet volledig opgenomen in lijst • Nonrespons : meer dan 30% • Vertekende reactie : • suggestie van ondervrager, ras, geslacht, ... • liegen van ondervraagde, vergeten, “telescoop-effect”, … • Formulering van vragen
3.4. Naar statistische inferentie • Statistische inferentie : conclusies over populatie op basis van resultaten van steekproef • Gebaseerd op wetten van de kansrekening : dus randomisatie van data is zeer belangrijk • Terminologie : • parameter : getal dat de populatie beschrijft • steekproefgrootheid : getal berekend uit de data
A. Steekproefvariabiliteit • Voorbeeld : • parameter: hoeveel % gaat niet naar de kerk • steekproefgrootheid : 1035 op 1785 = 58% • parameter p is onbekend en wordt geschat op basis van steekproef • p = 58% is dat een nauwkeurige schatter ? • Steekproefvariabiliteit bv 56% in andere steekproef
B. Steekproefverdelingen • Bij herhaald trekken van steekproeven krijgen we verschillende waarden maar met een zekere verdeling • STEEKPROEFVERDELING : de verdeling van de waarden die een steekproefgrootheid aanneemt bij alle mogelijke steekproeven van dezelfde omvang uit één populatie • Kenmerken : symmetrische verdeling dicht bij normaalverdeling, centrum van de verdeling is p
C. Vertekening van een steekproefgrootheid • Vertekening : systematische fouten in het schattingsproces zodat p in dezelfde richting afwijkt van p • Zuivere schatter : een steekproefgrootheid is een zuivere schatter als de verwachting (gemiddelde) van de steekproefverdeling gelijk is aan de werkelijke waarde van de parameter
D. Variabiliteit van een steekproefgrootheid • Variabiliteit van een steekproefgrootheid wordt gemeten door de spreiding van zijn steekproefverdeling • Vertekening en variabiliteit zijn afzonderlijke kenmerken • Grotere steekproeven geven minder variabiliteit
Variabiliteit gemeten door spreiding of standaardafwijking • 68-95-99.7 regel : 95% tussen -2 en +2 standaardafwijking • Als het gemiddelde 60% is dan • bij 100 personen tussen 50% en 70% • bij 2000 personen tussen 57% en 62% • Variabiliteit hangt af van steekproefgrootte NIET erg van de omvang van de populatie • Of je nu uit grote of kleine populaties steek-proef neemt : dezelfde grootte steekproef is nodig voor betrouwbare resultaten
E. Vertekening en variabiliteit • Vertekening = schieten buiten de roos • Roos = de grootheid in de populatie • Hoge variabiliteit = schoten liggen wijd verspreid om het doel • Lage variabiliteit = herhaalde schoten liggen dicht bij elkaar
Hoge vertekening Lage vertekening Lage variabiliteit Hoge variabiliteit Hoge vertekening Lage vertekening Hoge variabiliteit Lage variabiliteit
F. Waarom randomiseren • Door randomisatie : • Wetten van kansrekening • Bij benadering normale verdeling • Vertekening is minimaal • Variabiliteit kan klein gemaakt worden door steekproef te vergroten => Op basis daarvan uitspraken doen over de populatie op basis van de steekproef