1 / 26

Statistiek

Statistiek. HC1MBR Statistiek. Doel. De eigenschappen van een grote verzameling getallen op een simpele manier weergeven. Methode 1: een plaatje. Dus geen lange lijst met vetpercentages, maar:. Methode 2: 1 getal of woord. Dus geen lange lijst met gegevens, maar:.

kirra
Download Presentation

Statistiek

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Statistiek HC1MBR Statistiek

  2. Doel De eigenschappen van een grote verzameling getallen op een simpele manier weergeven

  3. Methode 1: een plaatje Dus geen lange lijst met vetpercentages, maar:

  4. Methode 2: 1 getal of woord Dus geen lange lijst met gegevens, maar: “Het gemiddelde cijfer is een 5” “De middelste beoordeling was ‘gaat wel’ ” “Er is een verschil van 8 punten tussen het hoogste en het laagste cijfer” “De populairste fast-food keten is McDonalds”

  5. Voorbereiding Voordat we zelfs maar gaan denken aan een bepaald getal of plaatje, moeten we weten of de gegevens ‘goed’ zijn. Hiervoor stellen we de volgende vragen: Zijn de gegevens betrouwbaar ? Zijn de gegevens valide ? Als we over het voorgaande tevreden zijn, is het voor de keuze van een bepaald type plaatje of getal belangrijk dat we het meetniveau van de gegevens kennen.

  6. Betrouwbaarheid Betrouwbaarheid = als we nog een keer gaan meten, krijgen we dan dezelfde gegevens ? Voorbeeld onbetrouwbaarheid: een weegschaal die voor hetzelfde voorwerp iedere dag een ander gewicht aangeeft Voorbeeld onbetrouwbaarheid: een toets waarop studenten die hetzelfde weten / kunnen totaal verschillende scores halen Voorbeeld onbetrouwbaarheid: in een te kleine groep het effect van een dieet op bloeddruk onderzoeken

  7. Validiteit ALLEEN als gegevens betrouwbaar zijn kunnen we de volgende stap zetten en ons afvragen of gegevens ook valide zijn. Validiteit = Meten we ook echt wat we willen meten ? • Hieraan zouden we kunnen gaan twijfelen omdat de gegevens: • geen compleet inhoudelijk beeld van het onderwerp geven • van een steekproef niet uit te breiden zijn naar de populatie • in tegenspraak zijn met gegevens uit een andere bron Voorbeeld ontbreken validiteit: iemands kennis over voedingsstoffen testen door alleen maar vragen over cholesterol te stellen Voorbeeld ontbreken validiteit: in een onderzoek onder de gehele bevolking naar het effect van een dieet op bloeddruk alleen mensen met overgewicht ondervragen

  8. Meetniveaus – indelingen 1. Gegevens die je niet op volgorde kunt zetten: nominaal meetniveau • Geslacht • Fast-food keten • Type lipoproteine 2. Gegevens die je op volgorde kunt zetten: ordinaal meetniveau • Ergens helemaal of een beetje of niet helemaal of helemaal niet mee eens zijn • Sociale klasse

  9. Meetniveaus - getallen 1. Gegevens zonder ‘natuurlijk nulpunt’: interval meetniveau • Temperatuur • Tijdsaanduiding 2. Gegevens met een ‘natuurlijk nulpunt’: ratio meetniveau • Cholesterolgehalte • Vetpercentage • Gewicht

  10. Plaatjes - cirkeldiagram indelingen Belangrijk: de categorieen sluiten elkaar uit

  11. Plaatjes – staafdiagram indelingen Meer mogelijkheden als bij cirkeldiagram Voorbeeld1: Iedere kolom is een cirkeldiagram Voorbeeld2: Categorieen hoeven elkaar niet uit te sluiten

  12. Plaatjes – histogram getal, kun je mee rekenen

  13. Plaatjes – lijndiagram getal, kun je mee rekenen Zelfde als histogram, maar vertelt je wat er in de loop van de tijd gebeurt

  14. Plaatjes – cumulatief lijndiagram getal, kun je mee rekenen Zelfde als lijndiagram, alleen tel je nu alles uit het verleden op en laat je het totaal zien.

  15. Plaatjes – spreidingsdiagram getal, kun je mee rekenen Hoort hier eigenlijk niet thuis. Geeft het verband tussen TWEE verzamelingen getallen. Des te meer de punten op een lijn liggen, des te sterker het verband

  16. Plaatjes – boxplot getal, kun je mee rekenen deelt alle gegevens in vieren.

  17. 1 getal of woord - centrummaten Voorbeeld:beste fast-food keten MacD, Burger, MacD, MacD, KFC Welk gegeven zegt in 1 keer iets over de ‘grootte’ van alle gegevens bij elkaar ?? • De modus: het gegeven dat het meest voorkomt: MacD

  18. 1 getal of woord - centrummaten Voorbeeld:beoordeling chemie II door studenten slecht, slecht, gaat wel, goed, briljant • De mediaan: het middelste gegeven: gaat wel • De modus: het gegeven dat het meest voorkomt: slecht

  19. 1 getal of woord - centrummaten Voorbeeld:cijfers 2e herkansing chemie II 3, 3, 4, 7, 8 • Het gemiddelde: (3+3+4+7+8)/5 = 5 • De mediaan: het middelste gegeven: een 4 • De modus: het gegeven dat het meest voorkomt: een 3

  20. 1 getal of woord – spreidingsmaten Voorbeeld: Het gemiddelde van de cijfers voor het vak chemie II is een 6 • Dit kan betekenen: • Iedereen heeft een 6 • De ene helft heeft een 3, de andere helft heeft een 9 • Of nog heel veel andere dingen ……. Kortom: we willen niet alleen weten wat het gemiddelde van de cijfers is, maar ook hoe ver de cijfers uit elkaar liggen: de spreiding

  21. 1 getal of woord - spreidingsmaten Variatiebreedte = grootste getal – kleinste getal Interkwartielafstand = grootste getal – kleinste getal, als je de grootste en de kleinste 25% van de getallen hebt weggelaten

  22. 1 getal of woord - spreidingsmaten Een zeer belangrijke spreidingsmaat is de standaarddeviatie Hoe meer spreiding hoe groter de standaarddeviatie De standaarddeviatie bereken je uit de variantie. De standaarddeviatie berekenen is een heel gedoe … Zelfs met rekenmachine … !

  23. 1 getal of woord - spreidingsmaten Voorbeeld: het gewicht van 5 Big Macs in grammen: 405, 400, 400, 390, 405 Gemiddelde gewicht = (405 + 400 + 400 + 390 + 405) / 5 = 400 variantie = (25+25+100)/5 = 30 standaarddeviatie = wortel uit de variantie = 5.5

  24. Normale verdeling • Een normale verdeling is een histogram wat: • Redelijk symmetrisch rond het gemiddelde ligt • Verder van het midden (veel) minder waarnemingen heeft (de kolommen worden korter) Wel normaal verdeeld Niet normaal verdeeld Niet normaal verdeeld

  25. Normale verdeling Bij normale verdelingen heeft de standaarddeviatie een speciale betekenis: In Nederland is de lengte normaal verdeeld. De gemiddelde lengte is 180 cm en de standaarddeviatie is 10 cm. • Hiermee bedoelen we: • Ongeveer 68% van de Nederlanders heeft een lengte tussen de 170 en de 190 cm • Ongeveer 95% van de Nederlanders heeft een lengte tussen de 160 en de 200 cm • Ongeveer 99% van de Nederlanders heeft een lengte tussen de 150 en de 210 cm

More Related