1 / 12

Program

Korrelation Gamma Pearsons r Regression Kausalitet. Program. Eksempel: Korrelation. En stikprøve på 181 fans af HIMYM / StarWars / James Bond / TV Charlie … er indsamlet.

judson
Download Presentation

Program

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Korrelation Gamma Pearsons r Regression Kausalitet Program

  2. Eksempel: Korrelation • En stikprøve på 181 fans af HIMYM / StarWars / James Bond / TV Charlie … er indsamlet. • Respondenterne er bl.a. blevet spurgt om deres alder og (på en skala fra 1-10) i hvilken grad de anser sig selv for fan af HIMYM / StarWars / James Bond / … /

  3. Goodman – Kruskal Gamma • A non-parametric measure of correlation is Goodman Kruskal Gamma (G) which is based on the difference between concordant pairs (C) and discordant pairs (D). Gamma is computed as follows: • G = (C-D)/(C+D) • Thus, Gamma is the surplus of concordant pairs over discordant pairs, as a percentage of all pairs, ignoring ties. Gamma defines perfect association as weak monotonicity. Under statistical independence, Gamma will be 0, but it can be 0 at other times as well (whenever concordant minus discordant pairs are 0). • Gamma is a symmetric measure and computes the same coefficient value, regardless of which is the independent (column) variable. Its value ranges between +1 to –1. • Kilde: http://www.unesco.org/webworld/idams/advguide/Chapt4_2.htm

  4. Eksempel på analyse af brugervenlighed ved spørgsmålet: ”Jeg fandt det, jeg ledte efter”. • En stikprøve på 20 udtages blandt landets kommuner. • Webmasteren spørges, hvor mange sider der er på kommunens website. • Data kobles til scoren på spørgsmålet ”Jeg fandt det, jeg ledte efter.” • Antal sider. Gns: 1.127. Std.afv.: 162. • Brugervenlighed. Gns: 2,7. Std.afv.: 0,7.

  5. Korrelation • Korrelationen, som forkortes med bogstavet r, beskriver den linære association mellem x og y. • Korrelationen ‘r’ er et tal i intervallet mellem -1 og +1, begge tal inklusiv. • Jo større absolut værdi af r, des stærkere er den lineære association. • Korrelationen afhænger ikke af den enhed, der måles i.Kilde: http://www.sjsu.edu/faculty/gerstman/StatPrimer/correlation.pdf

  6. RegressionsanalysePlot x og y mod hinanden og se om de danner en ret linje

  7. I x-y diagrammet højreklikkes og ”Tilføj trendline” vælges.

  8. Eksempel: Brugervenlighed og antal web-sider

  9. Regressionsanalyse • Analysen fortæller os: • Brugervenlighed = 0,0034 x antal sider – 1,15. • Hældningen på linjen er 0,0034. Skæring med y-aksen er i -1,15 • Har en kommune 1.500 sider, er et kvalificeret gæt, at kommunen scorer: (0,0034 x 1.500) - 1,15 = 3,87 – 1,15 = 2,72 på BV-spørgsmålet. • Regressionsanalysen kan bruges til at forudsige værdien af y, når man kender værdien af x. • Forudsigelsen er i sagens natur ikke 100% præcis (y varierer). • Man bør tjekke for outliers, da de kan påvirke resultatet betydeligt

  10. Model • En (statistisk) model er ikke eksakt beskrivelse af virkeligheden. • Modellen er ”kun” en approksimation, men … • Den er praktisk nyttig, hvis den estimerer relationen mellem x og y relativt godt. • Sort (og hvid) er virkeligheden. Rød er modellen (regressionsligningen)

  11. Outliers

  12. Kausalitet: Årsag og virkning Betingelser for kausalitet Rækkefølge (X → Y, ikke X ← Y) Association mellem X og Y. Udtrykkes operationelt f.eks. ved regression eller en korrelationskoefficient, f.eks. r. Positive r værdier tyder på en positive association (sammenhæng) Negative r værdier tyder på en negative association r værdier tæt på +1 eller -1 tyder på en stærk lineær association r værdier tæt på 0 tyder på en svag association Udelukkelse af andre forklaringer X: Salg af is, Y: Drukne ulykker Hypotese: X → Y

More Related