220 likes | 564 Views
Forskningsmetodik Lektion 7 Korrelation och kausalitet. y. x. Tvådimensionella histogram. Korrelation mellan två variabler (X och Y). y. y. x. x. Tvådimensionella histogram. Korrelation mellan två variabler (X och Y). y. y. y. x. x. x. Ingen korrelation. Icke-linjär korrelation.
E N D
y x Tvådimensionella histogram Korrelation mellan två variabler (X och Y)
y y x x Tvådimensionella histogram Korrelation mellan två variabler (X och Y) y y y x x x Ingen korrelation Icke-linjär korrelation Positiv korrelation Negativ korrelation
Korrelationskofficenten r r kan ha ett värde från -1 till +1 Positive korrelation 0 < r < 1 Negative korrelation -1 < r < 0
Y = X2 r = 0.978 Y = 3 + 4X r = 1 Y = 3 + 4X - 5X2 r = - 0.974 Y = 3 +4X -5X2 r = -0.991
Statistisk signifikans av korrelationen Två figurer med slumpmässigt valda talpar
Statistisk signifikans 2 • Stark korrelation ( r nära 1 eller -1) och många mätpunkter ger signifikans Signifikant för 10 datapunkter Icke signifikant 5 % 5 % -0,632 0,632 -1 0 1
y x Linjär regression “Linjär regression” är facktermen för den procedur som finner den bästa möjliga räta linjen, givet ett antal x- och y-värden. En rät linje kan skrivas som y = m·x + b , där m är riktningkoefficienten och b “interceptet”, dvs det värde där linjen skär y-axeln. y = m·x + b Dy Dx b
y = m·x + b Givet ett antal x- och y-värden så finns det en formel för att beräkna m och b för den räta linje som bäst ansluter till punkterna:
Exempel: Antag följande serie: (1,-0.6), (2, 1.5), (3, 2.5), (4, 4.6) och (5, 7.7) Insatt i formlerna får vi: y = -2.77 + 1.97·x
Bakgrundsfaktorer som ger falsk korrelation • Exempel: Under vintern säljs mindre glass, sker fler benbrott, dricks mer glögg, säljs fler skidresor och fler åker buss till jobbet än på sommaren. Men det är väl ingen som drar slutsatsen att det är ökad bussåkning som ger upphov till ökad glöggkonsumtion. Det beror mer på det kalla vädret.
Möjliga förklaringar för en korrelation • Statistisk fluktuation (se tabell 7.3) • Bakomliggande faktorer (tex väder etc) • En variabel beror av den andra (ett kausalt samband)
Kausalitet • En korrelation mellan två variabler kan indikera en kausalitet (en variabel beror av den andra) men inte ensam bevisa att man har en kausalitet. • En mängd andra undersökningar behövs!
Riktlinjer för att visa kausalitet • Kontroller att korrelationen existerar även när andra parametrar varieras • Kontrollera att korrelationen förstärks då en misstänkt parameter förstärks • Om effekten kan orsakas av någon känd effekt, kontrollera att effekten finns kvar då man tagit hänsyn till den kända effekten. • Försök att göra ett experiment • Försök finna en fysisk orsak till korrelationen
Ex. hur man visade att rökning orsakade lungcancer • Observerad korrelation mellan rökning och lungcancer för alla typer av människor • Man fann att för människor med lika förutsättningar att icke rökare hade mer sällan lungcancer än rökare • Folk som rökte mycket och länge hade högre chans att få luncancer • När man tog korrigerade för kända orsaker till lungcancer som tex radon hade rökare fortfarande högre frekvens än icke rökare • Man gjorde djurförsök och fann att de ”rökande” fick lungcancer • Biologer studerade cellkulturer och fann att röken orsakade mutationeroch att det inte fanns någon genetisk faktor