1 / 57

Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van PASW

Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van PASW. Guido Valkeneers. Hoofdstuk IX Het correlatievraagstuk & PASW toepassing. guido.valkeneers@lessius.eu. Doelstellingen.

whitfield
Download Presentation

Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van PASW

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Inleiding in de statistiek voor de gedragswetenschappenMet ondersteuning van PASW Guido Valkeneers

  2. Hoofdstuk IX Het correlatievraagstuk & PASW toepassing guido.valkeneers@lessius.eu

  3. Doelstellingen • De studenten kunnen voor een eenvoudige set van gegevens de samenhang tussen twee intervalvariabelen bepalen; • De studenten kunnen op grond van eenvoudige set van data de samenhang tussen ordinale variabelen bestuderen; • De studenten kunnen deze berekeningen via PASW doen. De studenten kunnen de output van PASW lezen en interpreteren.

  4. Herhaling Analyse van de samenhang Vereiste: twee uitslagen per persoon • Twee nominale variabelen stellen we voor in een kruistabel. Analyse met Chi-kwadraat en de associatiematen. • Twee interval variabelen: gebruik de Pearson correlatiecoëfficiënt en de regressietechniek. Bv. samenhang tussen IQ en schooluitslag • Twee ordinale variabelen: gebruik de correlatiecoëfficiënt van Spearman.

  5. Samenhang tussen twee interval variabelen • Bestaat er een (lineair) verband?Gebruik de Pearson correlatiecoëfficiënt • Hoe kunnen we de Y variabele voorspellen op grond van de X variabele?Gebruik de regressielijn van Y op X.

  6. De correlatiecoëfficiënt

  7. Spreidingsdiagram (scatterplot)

  8. Voorbeeld van een zeer hoge positieve correlatie

  9. Voorbeeld van een hoge positieve correlatie

  10. Voorbeeld van een geringe positieve correlatie

  11. Voorbeeld van geen correlatie

  12. Voorbeeld van een negatieve matige correlatie

  13. Voorbeeld van hoge negatieve correlatie

  14. Voorbeeld van zeer hoge negatieve correlatie

  15. Correlatie • Is het verband negatief? Of positief? • Hoe sterk is het verband? -1 ≤ r ≤1 • Enkele concrete voorbeelden

  16. Correlatiecoëfficiënt Bv. aantal juiste oplossingen en punt voor examen

  17. Correlatiecoëfficiënt Bv. intelligentie en schooluitslag

  18. Correlatiecoëfficiënt Bv. lichaamslengte en schooluitslag

  19. Correlatie Bv. faalangst en schooluitslag

  20. Correlatie? • Is de mate waarin elk individu eenzelfde relatieve positie inneemt op de twee variabelen. • Is positief als hoge score voor een variabele samengaat met hoge score voor tweede variabele. • Is negatief als hoge score voor een variabele samengaat met lage score voor tweede variabele.

  21. Correlatie Y-as ZX>0 en Zy>0 Zx<0 en Zy>0 Zx<0 en ZY<0 Zx>0 en Zy<0 X-as

  22. Pearson correlatie • Is het gemiddelde product van de bij X en Y horende z-scores. (productmomentcorrelatie van Karl Pearson) RXY = ∑ZX*ZY/N RYX = ∑ ZX*ZY/N D.w.z. de correlatie is symmetrisch

  23. Covariantie • = niet gestandaardiseerde maat van samenhang tussen twee interval variabelen. Gemiddelde product van de afwijking t.o.v. het rekenkundig gemiddelde

  24. Pearson correlatie = een gestandaardiseerde maat van samenhang, varieert van – 1 tot + 1 Correlatie kan gedefinieerd worden als de covariantie van de twee variabelen gedeeld door het product van de bijbehorende standaarddeviaties.

  25. Pearson correlatie • Blijft constant als de X en/of de Y waarden vermenigvuldigd, gedeeld worden door een bepaald getal. Let wel op het teken van de correlatie. • Blijft constant als de X en/of de Y waarden opgeteld of verminderd worden met een bepaald getal. • Dus r is invariant onder lineaire transformaties (afgezien van het teken).

  26. Invariant van de correlatie • X Y (X+3)/4 (Y+2)/6 • 1 5 1,00 1,17 • 2 2 1,25 0,67 • 3 3 1,50 0,83 • 4 4 1,75 1,00 • 5 1 2,00 0,50 r = - 60 r = - 60

  27. Invariant van de correlatie ? • X Y (X+3)/4 -(Y+2)/6 • 1 5 1,00 - 1,17 • 2 2 1,25 - 0,67 • 3 3 1,50 - 0,83 • 4 4 1,75 - 1,00 • 5 1 2,00 - 0,50 r = -.60 r = .60

  28. Correlatie bij lineaire transformatie en danis

  29. Pearson correlatie • Is niet invariant voor niet-lineaire transformaties, zoals bv. omzetting in percentielscores, of bv. worteltrekking of kwadratering. • Niet lineaire transformaties wijzigen de vorm van de verdeling en tevens de correlatie met andere variabelen.

  30. Lage correlaties? • De variabelen hangen niet met elkaar samen (bv. lichaamslengte en schooluitslag) • Het verband tussen de beide variabelen is niet lineair (bv. relatie tussen angst en prestaties) • Er is sprake van ‘restriction of range’. Eén van de variabelen heeft onvoldoende bereik, waardoor de correlatie gedrukt wordt.

  31. Lage correlatie 1. Geen verband

  32. Lage correlatie 2. niet-lineair verband

  33. Lage correlatie 3. Restriction of range

  34. Lage correlatie 3. Restriction of range

  35. Lage correlatie? Let op bij gering aantal metingen

  36. Correlatie en causaliteit • Als er een samenhang bestaat tussen twee variabelen, betekent dit een causaal verband?Misschien- X veroorzaakt Y- Y veroorzaakt X- Z veroorzaakt X, maar ook Y- andere…bv. medewerkerstevredenheid en productiviteit bv. ooievaarsnesten en aantal geboorten

  37. Correlatie en causaliteit Het onderzoeksbureau ‘Reason Foundation’ publiceerde een opmerkelijke studie. Drinkers verdienen ruim 10% meer dan geheelonthouders. Iemand die buitenshuis zijn pintje drinkt, verdient op zijn beurt meer dan een thuisdrinker. De reden lijkt logisch: mensen die drinken, onderhouden meestal meer contacten. Contacten – en dus netwerking – kunnen zorgen voor een nieuwe of betere baan en snellere loonsverhogingen. Vrouwelijke drinkers verdienen gemiddeld 14% meer dan vrouwelijke niet drinkers. Het verschil bij de mannen bedraagt maar 10%, maar bij hen kan een regelmatig toogbezoek daar nog 7% aan toevoegen. Vanzelfsprekend geldt voor dit onderzoek ook de bekende slogan: overdaad schaadt. (www.reason.org)

  38. Verband tussen IQ en schooluitslag • IQ Schooluitslag • 100 70 • 120 80 • 130 85 • 140 85 • 112 82 • 90 60 • 97 65 • 111 70

  39. PASW input

  40. PASW opvragen scatterplot

  41. PASW scatterplot Kies voor ‘simple scatter’

  42. PASW scatterplot Afhankelijke variabele op de Y-as Onafhankelijke variabele op de X-as

  43. Het spreidingsdiagram

  44. PASW Opvragen van correlatie

  45. PASW analyse

  46. PASW output

  47. Correlatie tussen meer dan twee interval geschaalde variabelen • Samenhang is in de werkelijkheid vaak complex. • Bijvoorbeeld. Er is een samenhang tussen het schoolresultaat en de intelligentie, maar ook tussen het schoolresultaat en de studietijd.

  48. Correlatie tussen meer dan twee interval geschaalde variabelen • Multiple correlatie: samenhang tussen één afhankelijke variabele en meerdere onafhankelijke variabelen • Partiële correlatie: samenhang tussen één afhankelijke variabele en één onafhankelijke variabele onder constant houding van derde variabele.

  49. De rangcorrelatiecoëfficiënt Guido.Valkeneers

  50. Rangcorrelatiecoëfficiënt • Het betreft het verband tussen twee ordinale variabelen. • Correlatiecoëfficiënt van Spearman • Formule: Deze correlatie varieert van -1 tot + 1 met

More Related