590 likes | 1k Views
Hoofdstuk 2: Frequentieverdelingen. Absolute, relatieve en cumulatieve frequentie Tabellen en grafieken 1. Frequentietabellen 2. Classificeren van waarnemingen 3. Grafieken. Absolute, relatieve en cumulatieve frequentie. Gegevens, data = ongeordend aanschouwelijk voorstellen:
E N D
Hoofdstuk 2:Frequentieverdelingen • Absolute, relatieve en cumulatieve frequentie • Tabellen en grafieken 1. Frequentietabellen 2. Classificeren van waarnemingen 3. Grafieken
Absolute, relatieve en cumulatieve frequentie Gegevens, data = ongeordend aanschouwelijk voorstellen: • in tabelvorm • grafisch Classificeren datareductie informatieverlies
De absolute frequentie Totaal aantal waarnemingen: • populatiegrootte: N • steekproefgrootte: n Absolute frequentie f = het aantal keren dat een kenmerk Xi wordt waargenomen (geteld) 3 stappen: selecteren, sorteren, tellen
De relatieve frequentie Relatieve frequentie rel.fi = absolute frequentie gedeeld door de totale frequentie • in decimalen (fractie van 1) • in procenten Som relatieve frequenties = 1 of 100%
De cumulatieve frequentie Ndz. een bepaalde volgorde in de uitkomsten (b.v. van klein naar groot): hoeveel waarnemingen zijn groter/kleiner dan een bepaalde waarde?
De cumulatieve frequentie (2) • de cumulatieve frequentie vanaf de grootste waarde Fg = het aantal waarnemingen dat groter dan of gelijk is aan een bepaalde grenswaarde of hoeveel waarden zijn in het schaalpunt of erboven gelegen
De cumulatieve frequentie (3) • de cumulatieve frequentie vanaf de kleinste waarde Fk = het aantal waarnemingen dat kleiner dan of gelijk is aan een bepaalde grenswaarde of hoeveel waarden zijn in het schaalpunt of eronder gelegen
De cumulatieve frequentie (4) F = Fk + Fg = n + f n bij niet-geclassificeerde waarnemingen F = Fk + Fg = n (of N) bij geclassificeerde waarnemingen ook: relatief cumulatieve frequenties
Hoofdstuk 2: Tabellen en grafieken • Frequentietabellen rijen, kolommen, velden/cellen Richtlijnen: • een tabel moet overzichtelijker zijn dan de lijst aparte waarnemingen • bij voorkeur indelen naar maximum drie gezichtsvelden • getallen met meer dan 3 cijfers worden afgerond • internationale afspraken voor gebruik van tekens
Classificeren van waarnemingen (1) • Classificeren = samennemen van naburige schaalpunten van een variabele in een beperkt aantal klassen Doel: data-reductie
Classificeren van waarnemingen (2) 3 manieren: • zoals het de onderzoeker uitkomt • zó dat elke klasse evenveel van de oorspronkelijke schaalpunten bevat (elke klasse is even breed) • zó dat iedere klasse een bepaald aantal –gelijk of ongelijk- waarnemingen bevat
Classificeren van waarnemingen (3) Aanbevelingen voor het classificeren van waarnemingen: • het aantal klassen ligt bij voorkeur tussen 5 en 20; vuistregel is ongeveer √n klassen te nemen • men streeft naar een gelijk klasse-interval (gelijke klassebreedte) • vermijdt lege klassen of klassen met weinig waarnemingen (frequentieverdelingen « met een staart »)
Classificeren van waarnemingen (4) • vermijdt open klassen aan het begin of einde (soms echter noodzakelijk) • klassegrenzen mogen elkaar niet overlappen en moeten aaneensluiten (categorisch systeem!) • voor klassegrenzen en –middens kiest men best ronde getallen • bepaalt men de klassegrenzen op één rang meer dan de waarnemingen, dan kan er nooit twijfel bestaan in welke klasse een waarneming valt.
Keuze klassegrenzen en –middens (mi) [161 cm – 171 cm[mi = 166 cm [171 cm – 181 cm[ 176 cm ]160 cm – 170 cm] mi = 165 cm ]170 cm – 180 cm] 175 cm 160,5 cm – 170,5 cm mi = 165,5 cm 170,5 cm – 180,5 cm 175,5 cm
Stap voor stap (1) Waarnemingsresultaten hoogste: Xmax. turven: frequenties laagste: Xmin. Uitbijters? Ja schrappen aan beide uiteinden Range: R = Xmax. – Xmin.
Stap voor stap (2) Bepaling klassebreedte: i = R / √ n als n<40: R/6 als n>400: R/20 Kleinste waarneming moet in de laagste klasse liggen Bepaling klassemiddens: mi = (bi + Bi ) / 2
Frequentietabel: voorbeeld Lichaamslengte 35 studenten van een klas Cumulatieve frequenties bepaald op de benedengrens!
Frequentiedichtheid Wat? Frequentiedichtheid = frequentie/klassebreedte fd = fi / i Nut? Om klassen te vergelijken met ongelijke klassebreedte Belangrijkste klasse is deze met de hoogste frequentiedichtheid (dichtste bezetting)
Stem and leaf-diagram Wat? Combinatie van een tabel en een grafiek Voorbeeld: afstand huis-school van 43 studenten 90°
Hoofdstuk 2: Grafieken Indeling: • frequentiediagrammen • tijdreeksgrafieken • spreidings- of correlatiediagrammen • specifieke voorstellingswijzen
Grafieken (1):frequentiediagrammen 3 soorten: • histogrammen en kolommendiagrammen • frequentieveelhoeken (-polygonen) • frequentiecurven (waarschijnlijkheidsverdelingen)
Frequentiediagrammen Algemeen kenmerk: vertikale as = frequentieas • absolute frequentie (fi ) • relatieve frequentie (rel.fi ) • cumulatieve frequentie • vanaf de kleinste waarde (Fk ) • vanaf de grootste waarde (Fg ) • relatief cumulatieve frequenties (rel.Fk en rel.Fg ) horizontale as = meetschaal
Histogram continue kenmerken reeks rechthoeken opp. evenredig met frequentie kenmerk sluiten aan elkaar absoluut, relatief, cumulatief, relatief cumulatief twee- en driedimensionaal Kolommendiagram discontinue kenmerken los van elkaar getekend grotere vrijheid in de vorm (b.v. cilinders, objecten …) Histogrammen en kolommendiagrammen
Frequentiediagrammen: voorbeeld (1)Lichaamslengte 35 studenten van een klas Cumulatieve frequenties bepaald op de benedengrens!
Frequentiediagrammen: voorbeelden (2) 1. Absoluut histogram
Frequentiediagrammen: voorbeelden (3) 2. Staafdiagram 3. Frequentieveelhoek/-polygoon
4. Relatief cumulatief frequentiehistogram vanaf de kleinste waarde 5. Relatief cumulatief frequentiepolygoon vanaf de kleinste waarde Frequentiediagrammen:voorbeelden (4) De (relatief) cumulatieve frequentie- veelhoeken worden geconstrueerd op de benedengrens (of bovengrens)
Histogrammen: varianten • puntendiagram klassemiddens • staafdiagram loodrechte projectie van de klassemiddens • frequentieveelhoek (-polygoon) klassemiddens verbinden; uiterste klassen verbinden met klassemiddens fictieve aanliggende klassen met nulfrequentie • frequentiecurve klassemiddens verbinden door vloeiende lijn
Gestapelde frequentiediagrammen Mogelijkheid om histogrammen en kolommendiagrammen te stapelen - absoluut - relatief - voordeel: evolutie van het totaal is gemakke-lijker af te lezen - nadeel: evolutie van de aparte kenmerken is moeilijk of niet af te lezen
« Een grafiekje om bestwil »: misleiding met grafieken • nulpunt/nullijn houdt geen verband met de resultaten en er wordt geen scheurlijn/breuklijn gebruikt • de verhouding op de assen klopt niet met de realiteit • de kolommen worden uitgezet op een stijgende lijn (dus niet op dezelfde hoogte) • de afstanden op de X-as zijn niet evenredig (bepaalde periodes worden weggelaten) • bepaalde resultaten worden extra in de verf gezet, b.v. op een cirkeldiagram « Kans op onjuiste diagrammen in een jaarverslag is 47% »
Aanbevelingen voor grafieken • bij niet rangschikbare kenmerken: volgorde staven/kolommen speelt geen rol; aanbeveling: rangschikken van klein naar groot of van groot naar klein • ondelinge afstand tussen de kolommen is willekeurig • klassen samenvoegen: de totale frequentie delen door het aantal samengenomen klassen • soms is het nuttig de oorsprong van het assenstelsel te verleggen: gebruik een scheurlijn of breuklijn • op de assen: schaalpunten en meeteenheid vermelden, niet de exacte waarnemingen.
Waarschijnlijkheidsverdelingen • homogene verdelingen • normale verdelingen: - spits, normaal en vlak • scheve verdelingen: • scheef naar links • scheef naar rechts • eentoppige, tweetoppige en meertoppige verdelingen • U-vormige verdelingen • J-vormige en omgekeerd J-vormige verdelingen
Hoofdstuk 2: Grafieken Indeling: • frequentiediagrammen • tijdreeksgrafieken • spreidings- of correlatiediagrammen • specifieke voorstellingswijzen
Tijdreeksgrafieken Algemeen kenmerk: horizontale as = tijdsas vertikale as = meetschaal Soorten: • lijn(en)diagram • stralendiagram • sterdiagram, poolcurve of radardiagram
Tijdreeksgrafieken (1):lijn(en)diagram b.v. verloop beurskoersen temperatuurverloop in een maand evolutie elektriciteitsverbruik in 24u
Tijdreeksgrafieken (2):stralendiagram (1) Het resultaat in de basisperiode wordt gelijkgesteld aan 100 en alle volgende uitslagen worden omgerekend naar die basis
Stralendiagram (3) • Voordelen: - relatieve groei onmiddellijk af te lezen - resultaten gemakkelijk te vergelijken • Nadelen: - geen absolute resultaten - onmogelijk af te lezen welke reeks de hoogste scores heeft
Tijdreeksgrafieken (3):radardiagram/poolcurve/sterdiagram Concentrisch opgebouwde grafiek, af te lezen in wijzerszin toepassingen: - samenstellen homogene teams (complementaire vaardigheden) - bezettingsgraden infrastructuren in bepaalde periode - kwaliteitsvergelijking reeks producten - illustreren van het seizoenkarakter van verschijnselen
Radardiagram/poolcurve/sterdiagram (3) • Voordelen: - moderne vorm van grafische voorstelling - mogelijk veel info op één grafiek - bij goed gebruik zeer praktisch • Nadelen: - zeer specifiek - moeilijk af te lezen door de leek - als de volgorde van de uitslagen wordt gewijzigd, dan verandert de vorm/het uitzicht van de grafiek
Hoofdstuk 2: Grafieken Indeling: • frequentiediagrammen • tijdreeksgrafieken • spreidings- of correlatiediagrammen • specifieke voorstellingswijzen
Spreidings-, correlatie- of scatterdiagrammen (1) Gebruik: om grafisch de samenhang tussen twee kenmerken na te gaan Opbouw: horizontale as: kenmerk 1 = oorzaak vertikale as: kenmerk 2 = gevolg de bekomen combinaties liggen meestal in het eerste kwadrant van de grafiek
Spreidingsdiagrammen (2) Soorten: • correlatiediagrammen • laddergrafieken • grafiek van Claparède
Laddergrafieken Wat? Visuele methode om samenhang tussen twee kenmerken te illustreren Hoe? 2 reeksen uitslagen rangschikken (van klein naar groot of omgekeerd) corresponderende rangorden verbinden - geen snijpunten: volmaakte ladder: 100% positieve correlatie - 1 snijpunt: volmaakte negatieve correlatie: 100% neg. corr. - veel snijpunten: geen correlatie Opm. 1 afwijkende uitslag kan zorgen voor heel wat snijpunten
Grafiek van Claparède Wat? 2 tijdreeksgrafieken boven elkaar geplakt Aflezing? - grafieken evenwijdig: grote positieve correlatie - 1 snijpunt: grote negatieve correlatie - veel snijpunten: weinig/geen correlatie
Hoofdstuk 2: Grafieken Indeling: • frequentiediagrammen • tijdreeksgrafieken • spreidings- of correlatiediagrammen • specifieke voorstellingswijzen
Grafieken: specifieke voorstellingswijzen Overzicht: • cirkeldiagrammen en taartpuntdiagrammen • stroomdiagrammen (flow-charts) • beeldstatistieken • cartogrammen • driehoeksdiagrammen • bevolkingspiramiden
Grafieken: specifieke voorstellingswijzen Overzicht: • cirkeldiagrammen en taartpuntdiagrammen • stroomdiagrammen (flow-charts) • beeldstatistieken • cartogrammen • driehoeksdiagrammen • bevolkingspiramiden