770 likes | 1.01k Views
SPSS-cursus inleiding statistiek. SPSS-cursus inleiding statistiek. Statistiek. Waarschijnlijkheidsrekening Statistiek. Waarschijnlijkheidsrekening. uit het bekende kansen op uitkomsten berekenen kans op munt kans op 3* munt bij 10 worpen bekende: de werkelijkheid: populatie of universum
E N D
SPSS-cursusinleiding statistiek SPSS-cursus Statistiek
SPSS-cursusinleiding statistiek SPSS-cursus Statistiek
Statistiek • Waarschijnlijkheidsrekening • Statistiek SPSS-cursus Statistiek
Waarschijnlijkheidsrekening • uit het bekende kansen op uitkomsten berekenen • kans op munt • kans op 3* munt bij 10 worpen • bekende: • de werkelijkheid: populatie of universum • een hypothese (veronderstelling over werkelijkheid) SPSS-cursus Statistiek
Populatie • Eindige populatie • alle nederlandse vrouwen • alle studenten Geneeskunde in Groningen • Oneindige populatie • alle mogelijke worpen met een munt SPSS-cursus Statistiek
Populatie • (verdeling) is bekend • hoeveel nederlandse vrouwen en hun kenmerken • bijv. leeftijdsverdeling • hoeveel studenten Geneeskunde en hun kenmerken • bijv. verhouding vrouw/ man • mits munt eerlijk: evenveel kans op kruis of munt SPSS-cursus Statistiek
Steekproef • een willekeurige trekking uit de populatie (aselect) • 100 nederlandse vrouwen • 20 studenten Geneeskunde • 10 worpen met een munt SPSS-cursus Statistiek
Waarschijnlijkheidsrekening • kans dat 12 (van de 100) vrouwen ouder 60 zijn • kans dat er minstens 15 (van 20) vrouwelijke studenten zijn • kans op minstens 8 (van 10) keer munt SPSS-cursus Statistiek
Statistiek beschrijvende/ inferentiële statistiek (schatten en toetsen) • beschrijvende statistiekwat vind je in de steekproef?: tellen (aantallen, gemiddelden, grafieken, ...) • aantal vrouwen • gemiddelde leeftijd • staafdiagram kruis/ munt bij 10 worpen • scatterplot leeftijd/ waardering SPSS-cursus Statistiek
Statistiek • inferentiële statistiek (schatten en toetsen)op grond van uitkomsten in de steekproef parameters in de populatie schatten en conclusies trekken • 12% van nederlandse vrouwen is ouder dan 60 • er studeren in Groningen meer vrouwen Geneeskunde dan mannen • de munt is eerlijk SPSS-cursus Statistiek
Statistiek Schatten uit uitkomsten van een steekproef schatting maken van de werkelijkheid (populatie) SPSS-cursus Statistiek
Statistiek • gevonden 12 vrouwen ouder dan 60, hoeveel vrouwen zullen in de populatie ouder 60 zijn? (puntschatting: P(v>60) =0,12) • gevonden 15 vrouwelijke studenten, wat is verhouding man/ vrouw in de populatie? (P(v)=0,75) • gevonden 8 keer munt, kans op munt ? (P(munt)=0.80) SPSS-cursus Statistiek
Statistiek • bij ander steekproef (toevallig bepaald!)andere uitkomst:20 van de 100 ouder dan 60 P(v>60)=0,2010 vrouwelijke studenten P(v)=0,50 4 keer munt P(munt)=0,40 SPSS-cursus Statistiek
Statistiek • Puntschatting met onzekerheid (standaarddeviatie (SD), spreiding,interval) • P(v>60) =0,12 SD=0,03 • P(v)=0,75 SD=0,10 • P(munt)=0,8 SD=0,13 SPSS-cursus Statistiek
Schatting Conclusie “Ik denk dat de fractie vrouwen > 60 jaar in de populatie 0,12 is (puntschatting), maar deze fractie ‘kan best’ (met 95% waarschijnlijkheid) liggen tussen 0,06 en 0,18 (puntschatting 2* SD)” SPSS-cursus Statistiek
Toetsen van hypothesen • Hypothese: veronderstelling over werkelijkheid (populatie) • munt is eerlijk P(munt) = P(kruis) • minder mannelijke dan vrouwelijke studenten Geneeskunde SPSS-cursus Statistiek
Stel hypothese • Stel Nulhypothese (H0) op • P(munt) = P(kruis) = 0,5 • P(vrouw) = P(man) =0,5 • P(vrouw>60)= 0,2 • Stel Alternatieve hypothese vast (Ha)(situatie als H0 niet waar is) • P(munt) > 0,5 • P(vrouw) 0,5 • P(vrouw>60) > 0,2 SPSS-cursus Statistiek
Bepaal kansverdeling onder H0 • waarschijnlijkheidsrekening bij steekproefgrootte: • P(0 * munt), P(1 * munt), …, P(10 * munt) als P(munt) = 0,5 • P(0 * vrouw), P(1 * vrouw), … , P(20 * vrouw) als P(vrouw) = 0,5 SPSS-cursus Statistiek
Trek steekproef • Trek een aselecte steekproef uit de populatie • Doe de waarnemingen (tellen, meten, …) SPSS-cursus Statistiek
Bepaal kans op gevonden uitkomst • Dit heet Overschrijdingskans • Gevonden 8 keer munt • P( 8 * munt) = 0,055 berekening? • Let op: 8, 9, 10 * alle bij Ha (P(munt)>0,5) • Zou dit kunnen als H0 waar is? • Ja, de kans is 0,055 ! SPSS-cursus Statistiek
Wat vind je van de uitkomst? • Acht je uitkomst ‘redelijk’ als H0 waar is? • Of past uitkomst beter bij Ha? SPSS-cursus Statistiek
Fout I en fout II werkelijkheid H0 Ha uitkomst H0 Ha OK Fout II FoutI OK SPSS-cursus Statistiek
Significantieniveau • Geef vooraf aan welke kans je redelijk vindtdit is een keus van de onderzoeker! • 0,05 gebruikelijke significantieniveau • 0,01 kleinere kans om H0 ten onrechte te verwerpen, grotere om hem ten onrechte niet te verwerpen SPSS-cursus Statistiek
Verwerpen van H0 • als P(uitkomst) < significantieniveau:verwerp H0, neem Ha aan • anders: neem H0 aan SPSS-cursus Statistiek
Conclusie • P(gevonden # vrouw) = 0,03 • bij H0: P(vrouw)=0,5 • Significantieniveau is 0,05 • Resultaat is significant • Er zijn niet evenveel vrouwen als mannen SPSS-cursus Statistiek
1-zijdig / 2-zijdig toetsen • Ho is ’is gelijk aan’ • Ha kan zijn: • is ongelijk aan 2-zijdig • is groter dan (of kleiner dan) 1-zijdig SPSS-cursus Statistiek
1-zijdig / 2-zijdig toetsen • 1-zijdig als je tevoren een verwachting hebt over het alternatief als H0 wordt verworpenBijvoorbeeld het toedienen van een medicatie om de bloeddruk te verlagen.Het is slechts interessant als dit tot verlaging leidt (mits er iets verandert).Hiervoor moet je een ‘theorie’ hebben. SPSS-cursus Statistiek
1-zijdig / 2-zijdig toetsen • 2-zijdig als de richting bij verwerpen van H0 niet is te voorspellen.Bijvoorbeeld of vrouwen beter op een trainingsprogramma reageren dan mannen. SPSS-cursus Statistiek
1-zijdig / 2-zijdig toetsen SD Overschr. Overschr Gem. SPSS-cursus Statistiek
1-zijdig / 2-zijdig toetsen • De verdeling van een toetsingsgrootheid, bijv. het verschil in gemiddelde leeftijd • Bij 2-zijdig moet je kijken of de waarde van de toetsingsgrootheid valt in het linker of rechter staartje, samen een kans van 0,05 (als dat significantieniveau is)Bij een normale verdeling zijn de grenzen > 1,96 en < -1,96 SPSS-cursus Statistiek
1-zijdig / 2-zijdig toetsen • Bij 1-zijdig kijk je in 1 staartje (bijv. rechts); het gebied omvat dat aan die ene kant een kans 0,05Bij een normale verdeling is de grens > 1,645 SPSS-cursus Statistiek
Keus methode • kansverdeling variabelen • meetniveau variabelen • verschil of verband • steekproef opzet SPSS-cursus Statistiek
Kansverdeling • De kansverdeling beschrijft de kansen op uitkomsten • De totale kans, alle uitkomsten samen, = 1 • Je hebt continue en discrete kansverdelingen SPSS-cursus Statistiek
Kansverdeling • Discreet • slechts bepaalde uitkomsten mogelijk • man of vrouw • blauwe, bruine, grijze, groene ogen • aantal mensen • elke uitkomst heeft bepaalde kans, andere uitkomsten onmogelijk, kans = 0 SPSS-cursus Statistiek
Kansverdeling • Continu • alle uikomsten zijn mogelijk • de getallenrechte, van - oneindig tot + oneindig • snelheid • afstand • tijd SPSS-cursus Statistiek
Kansen continu • Bij continue verdeling kans op uitkomst in interval • Kans uitkomst < a = 0,05 • Kans op uitkomst > b = 0,20 • Kans op uitkomst tussen a en b = 0,75 SPSS-cursus Statistiek
Normale verdeling SD Overschr. Overschr Gem. SPSS-cursus Statistiek
Kansverdeling • Bijv. (continue) Normale verdeling (oppervlak = 1) • Hoe hoger, hoe groter kans, kans bij gemiddelde groot, staart klein • De ‘vorm’ is bepaald • Plaats en breedte wordt bepaald door Parameters gemiddelde en SD * SPSS-cursus Statistiek
Kansverdeling * Populatie: griekse letters, steekproef ‘gewone’ letters Gemiddelde resp. m SD resp. s Corr. Coëff. resp. R Er zijn ook verdelingen die niet door parameters worden bepaald: parametervrij (non parametric) SPSS-cursus Statistiek
Meetniveau • Nominaal • discrete uitkomsten zonder volgorde • man, vrouw • oogkleur • typologie ziekten SPSS-cursus Statistiek
Meetniveau • Ordinaal • discrete uitkomsten met volgorde • verschil uitkomsten onbepaald: slecht/ matig versus matig/ voldoende • slecht/ matig/ voldoende/ goed • leeftijdsklassen: <20, 20-40, >40 SPSS-cursus Statistiek
Meetniveau • Interval • representatie van continue verdeling • verschil uitkomsten bepaald: 5-4 = 6-5 • tijd in seconden • afstand in mm • score op IQ-test SPSS-cursus Statistiek
Meetniveau • Ratio • als interval • met absoluut nulpunt • temperatuur Celsius Interval • afstand in meters Ratio SPSS-cursus Statistiek
Centrale tendentie • Interval (Ratio) gemiddelde • Ordinaal mediaan (middelste waarde, 50%) • Nominaal - (PM: frequenties, modus) SPSS-cursus Statistiek
Spreiding • Interval (ratio) standaarddeviatie (SD) • Ordinaal interkwartielenrange (25% - 75%) • Nominaal - (PM: frequenties, modus) SPSS-cursus Statistiek
Toetsen op verschil • 2 onafhankelijke steekproeven • interval niveau • Normale verdeling • Student t-toets SPSS-cursus Statistiek
Normale verdeling SD SD gem 1. gem 2. SPSS-cursus Statistiek
Student t-toets onafh. steekpr. • zijn gemiddelden gelijk (H0) ? • twee varianten: • varianties gelijk (equal) • varianties ongelijk (unequal) SPSS-cursus Statistiek
Toetsen op verschil • 2 onafhankelijke steekproeven • interval niveau, geen Normale verdeling • of ordinaal niveau SPSS-cursus Statistiek
Mann-Whitney U-toets • zijn medianen gelijk (H0) ? • gemiddelde rangnummers • U statistic • standaardnormale benadering U SPSS-cursus Statistiek