1 / 19

Statistiek voor Historici

Statistiek voor Historici. Hulpvak GB2HVST / G2HV09A Dr. L.J. Touwen College 7. Zevende college:. Trendlijnen aanbrengen in Excel-grafiek Voorbeeld Hudson pagina 133 Associatie en correlatie NB Volgende week géén college NB Powerpoints staan online bij ‘theorie’. Drs: 2,9 ects

nyx
Download Presentation

Statistiek voor Historici

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Statistiek voor Historici Hulpvak GB2HVST / G2HV09A Dr. L.J. Touwen College 7

  2. Zevende college: • Trendlijnen aanbrengen in Excel-grafiek • Voorbeeld Hudson pagina 133 • Associatie en correlatie • NB Volgende week géén college • NB Powerpoints staan online bij ‘theorie’

  3. Drs: 2,9 ects BA: 4 ects Voor doctoraalstudenten geldt: Hoofdstuk 7 vervalt Eén tentamenvraag minder óf: 1,1 ects in de vrije keuzeruimte

  4. Excel: trendlijnen • Met de rechtermuisknop op de data-series in de grafiek gaan staan – ‘Add trendline’ • Lineair, niet-lineair (exponentieel, logaritmisch, polynoom, moving average, etc) • Options: ‘display equation on chart’ • Let op: moving average wordt niet juist geplot door Excel.

  5. Associatie en correlatie • Is er samenhang tussen twee reeksen variabelen? Beïnvloeden zij elkaar of staan zij allebei onder invloed van een derde variabele? • De waarde van de ‘afhankelijke variabele’ wordt veroorzaakt door een ‘onafhankelijke variabele’

  6. Associatie en correlatie • Het bestaan van het verband moet op kwalitatieve gronden worden beargumenteerd. Only if we can think of sound reasons why there might be a relationship between two or more variables should we indulge in the statistical identification and measurement of that relationship. (Hudson p. 138)

  7. Associatie • Bij nominale en ordinale data spreken wij van associatie (geeft aan óf er een causaal verband is). Hier gebruiken we • Chi-kwadraat of de contingentie coëfficiënt • Rangorde-correlatie-coëfficiënt van Spearman

  8. Correlatie • Bij interval- en ratio-data kunnen we tevens onderzoeken hoe groot de samenhang is, dit noemen we correlatie. Voor correlatie • correlatie-coëfficiënt (Pearson correlatie-coëfficiënt) • Het regressiemodel brengt het gevonden verband in kaart.

  9. Associatie • Chi-kwadraat (a) Berekenen: som van (O-E)2/E voor elke cel (b) Interpreteren: kans dat het verband niet toevallig is. - drempelwaarde hangt af van de dimensies van de tabel - staan de uitkomsten in 2 x 2 tabel (aantal vrijheidsgraden=1): drempelwaarde is 6,6 bij 99% betrouwbaarheid - dit kun je opzoeken in een tabel Excel: functie ChiInv(kans; df)

  10. Kritische waarden Chi-kwadraat

  11. Associatie • SPEARMAN rangorde correlatie coëff. • Waarde tussen –1 en 1 • Geeft aan of de geobserveerde samenhang in de rangordes van twee variabelen statistisch significant is (dwz waarschijnlijk niet door het toeval komt) • Excel: functies RANK (..) en PEARSON(..)

  12. Correlatie • Pearson correlatie-coëfficiënt • 0 < R < 1 positief verband bij R > ca. 0,7 • -1 < R < 0 negatief verband bij R < ca. –0,7 • NB afh/onafh niet te zien(!) • PEARSON(array1; array2) • PEARSON(B3:B13; A3:A13)

  13. Correlatie • Determinatie coëfficiënt = R2 (Coëfficiënt of determination) geeft ‘percentage verklaard’ aan •  grenswaarde 0,5 (0,7^2=0,49) •  kwadraat van Pearson cor.coëff. • RSQ(B3:B13;A3:A13)

  14. Regressie • De regressie-lijn is de best-passende lijn door een puntenwolk.(scatter diagram) • Punten in beeld brengen in een X-Y grafiek

  15. Regressielijn

  16. Andere aandachtspunten: • ‘Lagged results’ • Autocorrelatie • Multicollineariteit • Non-random error

  17. Excel functies • Correl (..), Pearson (..), RSQ(..), RANK(..) Let op: voor het berekenen van trendlijnen (bij tijdreeksanalyse, een lineaire trendlijn wordt net zo berekend als een regressielijn): Trend(..) : levert trendwaarden op NB dit is een array-functie! Lineest (..), slope (..), intercept(..) leveren de parameters van de trendlijn op

  18. Volgende week geen college

More Related