1 / 52

Hoofdstuk 3 Maatstaven voor ligging en spreiding

Hoofdstuk 3 Maatstaven voor ligging en spreiding. 3.1. Centrummaten – Gemiddelden 3.2. Kwantielen 3.3. De spreidingsmaten. Centrummaten. het rekenkundig gemiddelde de mediaan de modus bij niet-gegroepeerde waarnemingen bij gegroepeerde waarnemingen of frequentieverdelingen.

afra
Download Presentation

Hoofdstuk 3 Maatstaven voor ligging en spreiding

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Hoofdstuk 3Maatstaven voor ligging en spreiding • 3.1. Centrummaten – Gemiddelden • 3.2. Kwantielen • 3.3. De spreidingsmaten

  2. Centrummaten • het rekenkundig gemiddelde • de mediaan • de modus • bij niet-gegroepeerde waarnemingen • bij gegroepeerde waarnemingen of frequentieverdelingen

  3. Eigenschappen van kengetallen voor frequentieverdelingen a. eenduidig gedefinieerd zijn (ondubbelzinnig) b. alle waarnemingen spelen een rol bij de bepaling van het kengetal c. de interpretatie moet eenvoudig en inzichtelijk zijn d. de kengetallen moeten niet al te gevoelig zijn voor steekproeftoevalligheden, maar een grote steekproefstabiliteitbezitten e. met de kengetallen moeten algebraïsche bewerkingen mogelijk zijn

  4. Het rekenkundig gemiddelde Wat? Het rekenkundig gemiddelde van een reeks waarnemingsresutaten is gelijk aan de som van alle resultaten gedeeld door het aantal waarnemingen (dit is de steekproef- of popultieomvang) Symbool: Formule:

  5. Het rekenkundig gemiddelde: eigenschappen (1) • 1. Vermindert men alle waarnemingen met een zelfde getal, dan wordt ook het rekenkundig gemiddelde verminderd met dat getal  men mag op de meetschaal een nieuwe oorsprong invoeren • 2. Vermenigvuldigt men alle resultaten met een zelfde getal, dan wordt ook het rekenkundig gemiddelde met dit getal vermenigvuldigd (idem delen)  men mag alle resultaten vereenvoudigen

  6. Het rekenkundig gemiddelde: eigenschappen (2) • 3. De som van de afwijking van alle waarnemingsresultaten ten opzichte van hun rekenkundig gemiddelde is nul Opm. : het rekenkundig gemiddelde wordt in de statistiek altijd berekend op één rang meer dan de waarnemingsresultaten.

  7. Het gewogen rekenkundig gemiddelde (1) Wat? Als niet aan alle waarnemingen een zelfde belang mag gehecht worden, vermenigvuldigt men elke waarde met een wegingsfactor en bepaalt men pas dan het rekenkundig gemiddelde

  8. Het gewogen rekenkundig gemiddelde (2) Voorbeeld: examenuitslagen student D.V. Rekenkundig gemiddelde: Gewogen rek.gemiddelde:

  9. Het rekenkundig gemiddelde van gegroepeerde gegevens Formule: De klassemiddens worden representatief voor elke klasse: alle frequenties worden vermenigvuldigd met de overeenkomende klassemiddens

  10. Centrummaten • het rekenkundig gemiddelde • de mediaan • de modus • bij niet-gegroepeerde waarnemingen • bij gegroepeerde waarnemingen of frequentieverdelingen

  11. De mediaan (1) Wat? De mediaan van een reeks waarnemings-resultaten is de middelste van de naar grootte gerangschikte resultaten. De mediaan verdeelt een reeks resultaten in twee gelijke groepen: aantal waarden < Me = aantal waarden > Me Symbool: Me Synoniem: midscore

  12. De mediaan (2) • bij oneven aantal waarnemingen: Me = middelste van naar grootte gerangschikte • bij even aantal waarnemingen: Me = rek. gemiddelde van middelste twee • Bij gegroepeerde frequentieverdelingen: • Me = tweede kwartiel (Q2) • mediaanklasse: zie cumulatief frequentiehistogram

  13. De modus Wat? De modus van een reeks waarnemingsresultaten is de waarneming die het meest voorkomt (= de uitslag met de hoogste frequentie) Symbool: Mo Opmerkingen: • hebben alle resultaten in een reeks dezelfde frequentie, dan is er geen modus • de modus is de enige centrummaat ook te gebruiken voor kwalitatieve kenmerken • unimodale, bimodale, multimodale verdelingen

  14. De modus bij gegroepeerde waarnemingen (1) • de modale klasse is de klasse met de hoogste frequentie • nauwkeuriger: f = frequentie modale klasse fl = frequentie (lagere) voorgaande klasse fh= frequentie (hogere) volgende klasse b = benedengrens modale klasse i = klasse-interval

  15. De modus bij gegroepeerde waarnemingen (2) Grafische bepaling van de modus bij frequentieverdelingen: modale klasse Mo

  16. Eigenschappen van kengetallen voor frequentieverdelingen a. eenduidig gedefinieerd zijn (ondubbelzinnig) b. alle waarnemingen spelen een rol bij de bepaling van het kengetal c. de interpretatie moet eenvoudig en inzichtelijk zijn d. de kengetallen moeten niet al te gevoelig zijn voor steekproeftoevalligheden, maar een grote steekproefstabiliteitbezitten e. met de kengetallen moeten algebraïsche bewerkingen mogelijk zijn

  17. Keuze van de centrummaten (1)

  18. Keuze van de centrummaten (2) De keuze hangt af van: • het meetniveau • de scheefheid van de verdeling • extreme waarden

  19. Keuze centrummaat in functie van het meetniveau

  20. Keuze van de centrummaten (3) De keuze hangt af van: • het meetniveau • de scheefheid • mogelijke extreme waarden

  21. Keuze centrummaat in functie van de scheefheid (1a) • Symmetrische verdelingen  normale verdelingen b.v. IQ-scores, de meeste natuurlijke verschijnselen

  22. Keuze centrummaat in functie van de scheefheid (1b) • Bimodale symmetrische verdelingen Mo1 Mo2

  23. Keuze centrummaat in functie van de scheefheid (2) • Scheef naar links (negatief scheef) b.v. lichaamsgewicht mannelijke 40-plussers in België Mo staart

  24. Keuze centrummaat in functie van de scheefheid (3) • Scheef naar rechts (positief scheef) b.v. belastbaar inkomen Belgische bevolking in € Mo staart

  25. Keuze van de centrummaten (4) De keuze hangt af van: • het meetniveau • de scheefheid • mogelijke extreme waarden

  26. Keuze centrummaat in functie van mogelijke extreme waarden Extreme waarden (= uitbijters): beïnvloeden het gemiddelde de mediaan is hier beter geschikt dan het rekenkundig gemiddelde Voorbeeld: 1 2 2 3 4 5 5 7 9 118 = 15,6 Me= 4,5

  27. Hoofdstuk 3Maatstaven voor ligging en spreiding • 3.1. Centrummaten – Gemiddelden • 3.2. Kwantielen • 3.3. De spreidingsmaten

  28. Kwantielen Wat? Kwantielen verdelen een frequentieverdeling in een aantal gelijke stukken (= stukken met gelijke frequentie) Doel? Kwantielen dienen om een uitkomst te situeren ten opzichte van andere uitkomsten

  29. Kwantielen (2) Soorten kwantielen: • Kwartielen: Q1, Q2 , Q3 verdelen de frequentieverdeling in 4 gelijke intervallen, elk met 25% van de uitkomsten • Decielen: D1,D2 , … , D9 verdelen de frequentieverdeling in 10 gelijke intervallen, elk met 10% van de uitkomsten • Percentielen: P01, P02 , … , P99 verdelen de frequentieverdeling in 100 gelijke intervallen, elk met 1% van de uitkomsten

  30. Kwantielen (3) De interkwartielafstand (IKA) geeft de range aan van de middelste helft van de resultaten. De IKA is ongevoelig voor uitbijters.

  31. Percentiel  percentiele rang • percentiel (P) b.v. P57 = 173,5 cm 57% van de resultaten zijn kleiner of gelijk aan 173,5 cm • percentiele rang (p) b.v. p168cm = 48,3% een lengte van 168cm komt overeen met de 48,3% kleinste resultaten

  32. 5-getallen-résumé Een frequentieverdeling kan omschreven worden met 5 kengetallen:

  33. Boxplot (boxdiagram) Een boxplot is de grafische voorstelling van het 5-getallen-résumé: • de randen van de box: Q1 (bodem) Q3 (deksel) • het tussenschot in de box: Me • twee « bakkebaarden »: van de box tot aan Xmin en Xmax Doel: een snelle vergelijking van verschillende frequentieverdelingen

  34. Boxplot (5-getallen-résumé) Xmax Q3 Me Q1 Xmin

  35. Vergelijking boxplots

  36. Grafische bepaling van kwantielen 96 percentiel: P27 = 133 percentiele rang: P528 = 96% 27 133 528

  37. Hoofdstuk 3Maatstaven voor ligging en spreiding • 3.1. Centrummaten – Gemiddelden • 3.2. Kwantielen • 3.3. De spreidingsmaten

  38. Spreiding, dispersie, variatie 3 invalshoeken: • de verschillen tussen de uitkomsten onderling • de range op de meetschaal, waarbinnen een bepaald percentage van het totaal aantal waarnemingen ligt • de verschillen tussen de uitkomsten en de centrummaten

  39. De variatiebreedte of de range (1) Wat? het verschil tussen de uiterste resultaten Voordelen: zeer snel en eenvoudig te bepalen Nadeel: maximaal beïnvloed door uitbijters

  40. De variatiebreedte of de range (2) Bij gegroepeerde gegevens is de range:

  41. De interkwartielafsand (IKA) Beter dan de range: Voordeel: totaal ongevoelig voor uitbijters! Ook: IDA = interdecielafstand (D9 – D1)

  42. Spreiding, dispersie, variatie 3 invalshoeken: • de verschillen tussen de uitkomsten onderling • de range op de meetschaal, waarbinnen een bepaald percentage van het totaal aantal waarnemingen ligt • de verschillen tussen de uitkomsten en de centrummaten

  43. Spreiding Algemeen: de afstand tussen een centrummaat C en de waarnemingsresultaten Xi Spreiding: waarin

  44. De gemiddelde absolute afwijking Wat? het gemiddeld verschil tussen elke uitslag en het rekenkundig gemiddelde van alle uitslagen Symbool: Formule: voor gegroepeerde gegevens: Xi mi

  45. De variantie en de standaardafwijking Wat? de variantie van een reeks uitslagen geeft aan in hoeverre deze afwijken van het gemiddelde Symbool: Formule: mi

  46. De standaardafwijking (1) Variantie: wordt uitgedrukt in de tweede macht van de meeteenheid de standaardafwijking is de vierkantswortel uit de variantie de standaardafwijking is de belangrijkste spreidingsmaat in de statistiek

  47. De standaardafwijking (2) Formule: of fi . mi² voor gegroepeerde gegevens: Xi  fi.mi

  48. De standaardafwijking (3) De standaardafwijking is de meest gebruikte spreidingsmaat: • normale verdelingen worden gekarakteriseerd door het rekenkundig gemiddelde en de standaardafwijking • in een Gauss-curve is de afstand van de buigpunten tot de symmetrieas steeds gelijk aan de standaardafwijking • in een normale verdeling ligt steeds een zelfde percentage van de waarnemingen tussen het gemiddelde vermeerderd/verminderd met 1, 2 of 3 keer de standaardafwijking

  49. Normale verdelingen (1) b.v. N(63;12,7) 16%

  50. Normale verdelingen (2) vlakke normale verdeling spitse normale verdeling

More Related