540 likes | 1.29k Views
Välkomna till kursen Kvantitativa forskningsmetoder I 1/2 sv - 4 F, 12 A Föreläsning 1. Tom Wikman tom.wikman@abo.fi Tfn: 06-3247 250 Rum F 624, Academill vån. 6. Kvantitativa metoder I enl. studiehandboken:.
E N D
Välkomna till kursenKvantitativa forskningsmetoder I1/2 sv - 4 F, 12 AFöreläsning 1 Tom Wikman tom.wikman@abo.fi Tfn: 06-3247 250 Rum F 624, Academill vån. 6
Kvantitativa metoder Ienl. studiehandboken: • ”Kursen syftar till att presentera grunderna till statistiska metoder för insamling, beskrivning och analys av kvantitativa data.” • I kursen ingår beräkning av deskriptiv statistik, spridningsvärden, medelvärdesskillnader, sambandsmått och testning av statistisk signifikans. Studerande bör efter kursen kunna beräkna alla ovan nämnda mått och kunna läsa av SPSS utskrifter.
Kvantitativa forskningsmetoder Ienl. studiehandboken: Litteratur • Stukát, S. (1993) Statistikens grunder. Lund: Studentlitteratur. • Holme, I. M. & Solvang, B. K. (1997). Forskningsmetodik. Om kvalitativa och kvantitativa metoder. Lund: Studentlitteratur. (Del I, II och IV) • + föreläsnings- och övningskompendium
Föreläsningsunderlag, övningar, m.m. publiceras på kursens webbplats: http://www.vasa.abo.fi/users/twikman/
F1 Introduktion, grundläggande begrepp, skaltyper F2 Deskriptiv statistik: central- och spridningsmått Sannolikhet, statistisk signifikans, c2-test, medelvärdesskillnader: t-test + 5 övningar i dataklassen: SPSS for Windows
Flickors och pojkars skrivresultat (i % av maximipoängen) i relation till modersmålsvitsorden. Figuren visar att det finns skillnader i skrivförmåga bland flickor och pojkar med samma modersmålsvitsord på betyget.
Vad är kvantitativ forskning? • Formaliserad och strukturerad • Statistikstödd databearbetning och beräkning • Bearbetning av rådata (från empirisk undersökning), till “siffror” som lämpar sig för statistisk behandling • Sannolikhetsbaserad undersökning • All forskning undersöker kvalitet även om resultatet är siffror. • Även kvalitativ: siffrorna skall tolkas och beskrivas
Forskningsprocessen • Samla information genom att läsa litteratur. • Beslut dig för vad du vill forska om och formulera forskningsfrågor. • Välj den metod som är bäst lämpad för att besvara dina frågor. Designa forskningsinstrumentet. • Samla in data. • Analysera data. • Rapportera.
Vad behövs för att utföra en vetenskaplig undersökning? 1. Forskningsfrågor (ej vardagsproblem!) 2.Variabler (latenta ’bakomliggande’ ’osynliga’ variabler) = egenskaper som studeras hos respondenterna 3. Operationaliserade frågor (manifesta ’direkta’ ’synliga’ variabler)= frågor som ställs till respondenterna för att ta reda på värdet på variabeln
Manifest variabel A1 Manifest variabel B1 Manifest variabel A2 Exempel Forskningsfråga: Vilket är sambandet mellan variabel A och variabel B? Vilket är sambandet mellan intelligens och musikalitet? Sjunger: bedöms skala 1-5 Latent variabel A Latent variabel B IQ- test Spelar ett instrument: bedöms skala 1-5 Musikalitet Intelligens
Beroende Oberoende Ex. slöjdvitsord Intelligens Hur kan man mäta en latent variabel? • Hur skall man lyckas fånga “kvaliteten” eller “essensen” i ett fenomen? • Hur kan egenskapen förvandlas till “siffror”? • Vilka frågor kan man ställa (till en försöksperson)? • Vilka svarsalternativ skall respondenten få att välja mellan? Beroende och oberoende variabel Ju mera IQ desto bättre vitsord
Exempel på forskningsfrågor • Hur inverkar socioekonomisk bakgrund på skolprestation? • Vilket är sambandet mellan längd vid födsel och som vuxen? • Hur varierar koncentrationsförmåga enligt kön? • Hur skiljer sig hög- och lågprestande elevers biologikunskaper?
A A Tid 1 Tid 2 A B A A Tid 1 Tid 2 B B Tid 1 Tid 2 A A Undersökningsgrupp + variabel Tid 1 Tid 2 Kontrollgrupp B B Tid 1 Tid 2 Vilken typ av design? Case studieVad händer? A Longitudinell studie/ panelstudie/ trendstudieHar det skett en förändring med A över tid? JämförelseÄr A och B olika? Logitudinell jämförelseÄr A och B olika över tid? Experimentell studieÄr A och B olika över tid pga den oberoende variabeln?
Kvalitativ variabel (kan klassindelas) t.ex.partitillhörighet Kvantitativ variabel(kan mätas)t.ex. längd Diskret variabel(skalstegen är fasta)t.ex. antalet barn Kontinuerlig variabel(alla skalsteg möjliga)t.ex. vikt Variablerna kan vara:
Latent Manifest
Datanivåer/skaltyper • Nominalskala: frekvenser, endast klassificering, antal case per grupp, kan endast räknas # • Ordinalskala: samband baserade på rangordning, skalstegen olika långa, kan rangordnas <> • Intervall: samband baserade på mätningstalen, kan addreras, ingen nollpunkt, jämna skalsteg + - • kvotskala, samband baserade på mätningstalen, lika långa skalsteg, har absolut nollpunkt, kan beräknas matematiskt * / + -
Nominalnivå • Innebär klassificering enligt kännetecken. Kvalitativ variabel. Ex. Kön, hårfärg, kommuntyp ...
Ordinalnivå • Mätningen är sådan att man ej kan ge enheterna tal vilka anger förhållanden mellan enheternas placeringar på variabeln. Data innehåller enbart rangordning av enheterna.
Intervallnivå • Enheternas värden anges med tal. Nollpunkten ej definierad. • Exempel: Intelligens, temperatur, skönhet.
Kvotnivå • Mätvärden används för att ange mängd på variabeln. Det finns en bestämd, fast nollpunkt. • Exempel: Längd, vikt.
Datanivåer (avgör vilka statistiska test du kan utföra på dina data) Rangordning Jämna steg Nollpunkt Exempel Nominalskala – – – Kön – – Rang Ordinalskala – Intervallskala IQ Kvotskala Vikt I statistiska undersökningar är det viktigt att skilja mellan data på de olika nivåerna. Variabler som används inom pedagogiskt/psykologiska studier anses ofta ligga mellan ordinal- och intervallskala.
Frågeformulär och responsalternativ Öppna frågor: Nämn vilka frukter du tycker om: ___ Nämn vilka frukter du inte tycker om: ___ De lättaste frågorna att göra eftersom de ställs på ett naturligt sätt. Nackdelen är att de oftast inte kan analyseras systematiskt. Vid öppna frågor är det forskaren som kategoriserar svaren vilket kan ställa till problem. Användbar i två situationer: när det är klart hur svaren skall analyseras, när svaren skall hjälpa till att förklara ett statistiskt resultat.
Dikotom skala Kryssa för ifall du tycker om följande frukt (JA) eller inte (NEJ) JA NEJ Tycker du om äppel___ ___ Tycker du om banan ___ ___ Tycker du om mandarin___ ___ Tycker du om apelsin ___ ___ Nom Rangordningsskala: Rangordna följande frukter enligt hur mycket du tycker om dem (3 framför den godaste, 0 framför den minst goda) äppel ____ banan ____ mandarin ____ apelsin ____ Ord
Slutna frågor/frågor med svarsalternativ Likert-skala utan benämning av skalstegen I vilken grad håller du medom följande påståenden. HÅLLER EJ HÅLLER ALLS MED HELT MED Jag tycker om äppel .................0 1 2 3 4 5 6 Jag tycker om banan ................0 1 2 3 4 5 6 Jag tycker om mandarin ..........0 1 2 3 4 5 6 Jag tycker om apelsin ..............0 1 2 3 4 5 6 Likert-skala med benämnda skalsteg 0 = håller ej alls med 1 = håller ej med2 = håller devis ej med 3 = vet inte4 = håller delvis med 5 = håller med6 = håller helt med Int
Semantiska differentialer Jag tycker äpplen smakargott << < 0 > >> illa Jag tycker banan smakar gott << < 0 > >> illa Jag tycker apelsin smakar gott << < 0 > >> illa Jag tycker banan smakar gott << < 0 > >> illa 0 Int “Kvotskala” Hur uppfattar du dig själv? Indikera med ett kryss per rad hurdan du tycker att du är, hurudan du skulle vilja vara, och hur du tror att andra uppfattar dig. ’0’ betyder avsaknad av egenskapen i fråga. ’100’ betyder att du har så mycket som möjligt av egenskapen. 100 Trevlig… Du anser att du är… Du skulle vilja vara… Andra tycker du är… 0 Kvo
Exempel på psykometrisk variabel med 10 item- självskattning Ringa in hurudan du tycker att du är. Skalan är från 0 till 3. (0= jag håller ej alls med, 1= håller ej med, 2= håller med, 3= håller helt med) 1.på det hela taget är jag nöjd med mig själv 0 1 2 3 2. ibland tycker jag att jag inte alls är bra 0 1 2 3 3. jag tycker att jag har goda sidor 0 1 2 3 4. jag kan göra saker lika bra som de flesta 0 1 2 3 5. jag har inte mycket att vara stolt över 0 1 2 3 6. ibland känner jag mig värdelös 0 1 2 3 7. jag känner mig åtminstone lika värdefull som andra 0 1 2 3 8. jag önskar jag tyckte bättre om mig själv 0 1 2 3 9. jag är misslyckad 0 1 2 3 10. jag tycker bra om mig själv 0 1 2 3 Efter att respondenten fyllt i alla 10 items produceras ett mått på personens självskattning som medelvärdet av alla 10 item. Item som är negativt formulerade räknas inverterade (0=3; 1=2; 2=1; 3=0). Int
”Vet inte”? Hur skall man behandla ”vet inte” alternativet? Olika alternativ: 1 2 3 4 -9 helt av delvis av delvis av helt av vet inte samma samma motsatt motsatt (varken för åsikt åsikt åsikt åsikt eller mot) Tycker du om bananer? ja [ ], nej [ ], vet inte [ ] 1 helt av sammaåsikt 3 vet inte (varken för eller emot 2 delvis av samma åsikt 4 delvis av motsatt åsikt 5 helt av motsatt åsikt
Agency beliefs in effort (Little & Wanner, 1997) • (1=almost never, 2=sometimes, 3=often, 4=almost always) • When it comes to learning something new in school, can you work hard enough at it? • When it comes to figuring out a new lesson, can you put enough effort into it? • When it comes to figuring out a new lesson, even if it's difficult, can you put enough effort into it? • When it comes to understanding new things in school, can you keep on trying long enough at it? • When it comes to understanding new things in school, can you keep on trying long enough at it? • When it comes to understanding new things in school, even if it's difficult, can you keep on trying long enough at it?
Slutna frågor/frågor med svarsalternativ Är lite svårare att göra än öppna frågor men de är lättare att analysera. Svårt att hitta alternativ som täcker alla eventualiteter men som ändå inte överlappar. Borde också inkludera ”vet ej” eller ”annat”. Undvik negativt ställda frågor om möjligt. T.ex. Det är inte roligt att läsa böcker. Undvik mångtydiga frågor. Undvik frågor om hypotetiska situationer, jargonger, fackspråk och mångtydigheter. Undvik ledande ord, var klar och koncis. Undvik att ställa frågor som du inte behöver.
Exempel: dåliga frågor • Vilket betyg ger du för den nya läroplanen då det gäller verklighetsanknytning och användbarhet? Högt/medel/lågt • Innehåller två frågor men bara ett svarsalternativ! • Är folk bättre utbildade idag än för tio år sedan? Ja/nej • De flesta människor har ingen kunskap om detta och borde alltså inte kunna svara på den. Risken finns att de ändå svarar! • Hur ofta straffar ni elever? Aldrig/månatligen/veckovis/dagligen • Mångtydig fråga, vad betyder straffa?Vem syftar man på skolan eller läraren? Osv…
Hur välja sampel? • I ett krig i USA dödades 10 av 1000 soldater. Under samma tid dog 20 av 1000 människor i New York.= det är säkrare att vara soldat i krig än att bo i New York. ?! • Varför stämmer inte detta? • Urvalet är avgörande för resultatet! • Undersök helst hela populationen! Om du besluter dig för att använda sampel förlorar du ev. i kvalitet. • Sampel sparar tid och pengar för forskaren. Sampel är en genväg som kan ge nästan så bra resultat som om man studerar hela populationen, men till ett mindre pris och snabbare. • En stor del av dataanalysmetoderna baserar sig på sampelteorier t.ex. alla signifikanstest utgår från att data är insamlade ur ett slumpvist urval från en definierad population.
Population: den grupp som du vill undersöka t.ex. finlandssvenska skolelever i åk 6. Måste alltid definieras innan du börjar! • Sampel, urval: den grupp som du verkligen undersöker ur populationen t.ex. finlandssvenska skolelever i åk 6 i 20 skolor i Svenskfinland. Resultaten generaliseras sedan att gälla hela populationen. Samplet måste vara representativt för hela populationen!
Olika typer av sampel • 1. Slumpmässigt (randomiserat) sampel • i teorin det enda rätta. Slumpvist urval ur populationen t.ex. med slumpgenerator på dator, lottdragning o. dyl. Gör att man kan beräkna sannolikheter, påverkas ej av forskarens egna val. Problem: väldigt utspritt, t.ex. endast enstaka fall per ort. Ex. vi har en lista på samtliga svenskspråkiga lärare i Finland och låter en dator plocka ut 400 slumpvist utvalda lärare. • 2. Stratifierat sampel (xx% från strata I, xx% från strata II, etc..) • grupperar populationen i enligt några karaktäristika. T.ex. om 68 % av populationen är kvinnor skall även samplet ha 68 % kvinnor. Inom varje grupp (strata) skall urvalet ske slumpmässigt. Kräver svåra beslut om undersökningen omfattar fler grupper. • 3. Experimentell design (försöksgrupp - kontrollgrupp)
Olika typer av sampel • 4. Kriterierelaterat sampel, ifall du vill påvisa generaliserbarhet bör du påvisa enligt vilka kriterier du valt individerna, eller hur de motsvarar “normalpopulationen”. • systematiskt sampel. T.ex. väljer ut elever i finländska skolor med utländsk bakgrund, i ett slumpvist sampel skulle de vara väldigt få, men nu blir urvalskriteriet att de skall tillhöra denna grupp för att bli valda. • 5. Kluster (vanligt att “plocka” klasser) • Saker som vi är intresserade av uppträder ofta i kluster, grupper, t.ex. klasser, skolor. Därför kan vi omdefiniera populationen till dessa kluster (t.ex. lågstadieskolor) och välja vårt sampel från dem t.ex. slumpvist. Skolor och klasser är case framom enskilda elever, lättare att få tag i adresser till skolor än enskilda individer. T.ex. vi väljer ut 50 skolor av alla Finlands skolor och undersöker hela lärarkåren i de utvalda skolorna.
Exempel I en undersökning av David m.fl. (1994) frågade man elever och föräldrar hur de väljer skola för sina barn. Endast 50 % av föräldrarna svarade vilket gav två grupper av elever: de vars föräldrar svarade och de vars föräldrar inte svarade. Forskaren märkte att det fanns en stor skillnad mellan de båda grupperna. Elever i den första gruppen poängterade olika utbildningsaspekter för skolvalet medan de vars föräldrar inte svarade poängterade bekvämlighetsaspekter. Detta är ett indirekt bevis för att de båda grupperna av föräldrar också är olika (ifall de kunde undersökas). Forskaren lyckades intervjua några föräldrar ur den andra gruppen och märkte att de var olika, de poängterade barnets egna önskningar men annars var de mindre aktiva i urvalsprocessen.
Steg vid val av sampel avgör om du skall använda ett sampel och varför definiera populationen du vill undersöka lista de som hör till populationen eller bestäm egenskaperna hos populationen uppskatta sampelstorleken du behöver, använd ett stort sampel välj en metod för att välja ut samplet ur populationen (slump, systematiskt, stratifierat…) välj en metod för korrigering (tänk på svarsbenägenhet, obesvarade frågor…) undersök ditt sampel, hur ser ditt sampel ut i jämförelse med ett idealt sampel eller hela populationen korrigera om nödvändigt (avvägning)
Hur många försökspersoner? • För statistisk beräkning bör du ha fler individer än antal frågor. 5-10 ggr större än antalet variabler. • Ej större bortfall än 15% (enl. vissa 30%) av responser på insamlat data • Tänk på hur stora “celler” du vill jämföra med varandra. T.ex. tillräckligt många av vardera könen osv… • Enligt det test du vill utföra (t.ex. faktoranalys kräver tre gånger fler försökspersoner än antal item). • Ha ett så stort sampel som möjligt! • Vi kan endast kontrollera för kvaliteten genom sampelstorleken – det endas som vi kan påverka själva! 20 case- i varje grupp = högt standardfel 60 case- i varje grupp = mindre standardfel80 case- i varje grupp = ganska litet
Behandling av rådata • Insamling av rådata • Vem samlar in • Vilka instruktioner? • Hur reagerar respondenterna? • Databearbetning • - Kodning • - Kategorisering • - Systematiskt bortfall (tex oreliabla frågor) • - Osystematiskt bortfall (t.ex. misstag, tidpunkt) • Bortfall? • - Utesluta? • - Ersätta värden? • - Analys av extremfall • - Välj analysmetod i förväg
Reliabilitet och validitet • Reliabilitet betyder hur väl du lyckas mäta det du avser mäta, dvs. hur noggrann eller tillförlitlig mätningen är. Influeras av t.ex. instrumentet, misstag, kodning osv… Validitetbetyder hur väl det mätta fenomenet motsvarar verkligheten, dvs. hur sanningsenlig mätningen är.
random error Ifall man man visualiserar konstruktionen av items med att “skjuta i prick”, kan tre scenarion ritas. Längst till vänster motsvarar. I mitten är Hög reliabilitetHög validitet Frågorna samstämmiga och motsvarardet forskaren vill undersöka. Hög reliabilitetLåg validitet Samstämmigheten mellan frågorna hög, men de motsvarar ej det forskaren vill undersöka. Låg reliabilitet Låg validitet Frågorna ej det undersökta området och de är ej heller sinsemellan sammanhängade
Vanliga problem vid design av enkäter Ställer forskningsfrågorna Dvs man blandar ihop studiens forskningsfrågor med enkätfrågor. Oftast är forskningsfrågorna inga bra enkätfrågor. Tror de flesta lärare att pojkar klarar sig sämre i skolan än flickor? Ja/nej/vet ej Ställer ledande frågor Man ställer frågorna så att man får det svar man önskar, kan avslöjas redan i följebrevet. Hur viktig är kvaliteten på undervisningen då du väljer skola? 1 viss betydelse/ 2 medium betydelse/3 stor betydelse För långt frågeformulär Mycket vanligt problem som inverkar på bl.a. svarsfrekvensen Ställer oväsentliga frågor Ställer frågor som man redan vet svaret på eller som man kan hitta svaren till på andra sätt. Använder stötande språk I misstag kan det hända att man formulerar frågor på ett sådant sätt att de kan verka stötande för vissa respondenter.