200 likes | 411 Views
FL6. 732G81. Punktskattning = att använda som en uppskattning av µ Dock: är en slumpvariabel och antar olika värden för varje stickprov. Hur ska vi hantera den osäkerheten? Vi börjar med att göra tre antaganden: stickprovet är draget som ett OSU
E N D
FL6 732G81
Punktskattning = att använda som en uppskattning av µ Dock: är en slumpvariabel och antar olika värden för varje stickprov. Hur ska vi hantera den osäkerheten? Vi börjar med att göra tre antaganden: • stickprovet är draget som ett OSU • populationen som vi drog stickprovet ur är normalfördelad • populationsstandardavvikelsen σ är känd
Konfidensintervall när är känd Konfidensintervall = ett osäkerhetsintervall utlagt kring som tillåter oss att med en viss säkerhet säga att µ ingår i intervallet Formel för konfidensintervall: Beräkna Eftersom vi antas veta σ, beräkna Hämta värdet på z* ur normalfördelningstabell
Exempel Glödlampor som tillverkas i en viss fabrik har en lystid som kan beskrivas som normalfördelad med medelvärde 1600 timmar och standardavvikelse 100 timmar. Nu har man bytt en maskin i fabriken, och har därför dragit ett stickprov om 150 lampor och konstaterat att bland dem var den genomsnittliga lystiden 1618 timmar.Standardavvikelsen förefaller däremot oförändrad. Bestäm ett 95% konfidensintervall för den genomsnittliga lystiden för glödlampor tillverkade med den nya maskinen!
Hypotesprövning • Vi utgår från samma grundantaganden som när vi bildade konfidensintervall: • stickprovet är draget som ett OSU • populationen som vi drog stickprovet ur är normalfördelad • populationsstandardavvikelsen σ är känd • Grundidé för hypotesprövning: • Ställ upp två hypoteser • Undersök hur pass sannolika hypoteserna är givet insamlade data • Bestäm vilken hypotes vi ska tro på
Exempel Glödlampor som tillverkas i en viss fabrik har en lystid som kan beskrivas som normalfördelad med medelvärde 1600 timmar och standardavvikelse 100 timmar. Nu har man bytt en maskin i fabriken, och har därför dragit ett stickprov om 150 lampor och konstaterat att bland dem var den genomsnittliga lystiden 1618 timmar.Standardavvikelsen förefaller däremot oförändrad. Har den nya maskinen förbättrat den genomsnittliga lystiden?
Hypotesprövning när är känd H0: µ = µ0 Ha: µ > µ0 Ha: µ < µ0 Ha: µ ≠ µ0 • Testvariabel: Ska vi tro på H0eller Ha? Valet av mothypotes bestäms av problemställningen
Ska vi tro på H0eller Ha?Metod 1: Kritiskt värde • α = signifikansnivå = risken att förkasta H0 trots att den är sann • Vanliga värden på α: 5% och 1%, 5% vanligast. • Steg 1: Välj signifikansnivå • Steg 2: Slå upp kritiskt värde i normalfördelningstabellen • Beslutsregel: om testvariabeln hamnar i kritiskt område så förkastas H0
Ska vi tro på H0eller Ha?Metod 2: p-värde • p-värde = sannolikheten för att vår testvariabel ska anta ett värde som det vi observerat eller ännu längre ifrån μ0 Om p-värdet är litet är H0 osannolik: vi tror då mer på Ha • Beslutsregel: om p-värdet < α förkastar vi H0 • Vid dubbelsidig mothypotes beräknas p-värdet * 2 (varför?) Kommentar: beslutsmetoden baserat på kritiskt värde lämpar sig bättre för handräkning. Om vi gör hypotesprövningen med dator får vi dock alltid resultatet i form av ett p-värde.
Både de metoder för konfidensintervall och hypotesprövning vi diskuterat hittills baseras alltså på de tre kraven • stickprovet måste vara draget som ett OSU • populationen som vi drog stickprovet ur är normalfördelad • populationsstandardavvikelsen σ är känd Är det rimligt att dessa krav uppfylls i praktiken? => Nej, σ är sällan känd
Konfidensintervall och hypotesprövning när σ är okänd Skatta σmed Konfidensintervall Hypotesprövning där värdet på t* respektive t hämtas ur t-fördelningen med n – 1 frihetsgrader.
Exempel En viss sorts påsar med kryddor påstås innehålla 4 gram. Vi kontrollmäter fyra slumpmässigt utvalda påsar och erhåller Undersök på 5% signifikansnivå om påsarna i genomsnitt innehåller mindre än 4 gram!
Normalfördelning (z) och t-fördelning (t) När ska vi använda t och när ska vi använda z? t-värdet är alltid större än z för att ta hänsyn till den ökade osäkerheten som följer av att konfidensintervallet/hypotesprövningen baseras på två skattningar (både och s) t-värdet konvergerar (går mot) z när n ökar (titta i t-tabellen!) σ känd => använd z σ okänd => använd t
Hur kan en hypotesprövning gå fel? • Typ I-fel: Att förkasta H0 fast H0 faktiskt är sann • Typ II-fel: Att acceptera H0 fast Ha är sann Signifikansnivå = α: sannolikheten (risken!) för typ I-fel • Det råder ett motsatsförhållande mellan risken för Typ I-fel och risken för Typ II-fel: sänker vi signifikansnivån (= risken för Typ I-fel) ökar risken för Typ II-fel. • Inom samhällsvetenskaperna brukar man anse att α = 0.05 ger en bra avvägning mellan typerna av fel.
Stratifiering – några räkneregler Vi beräknar: μ = 100 och σ = 170 Hur kan vi påverka konfidensintervallets bredd? Genom att öka n Genom att göra ett stratifierat urval Exempel: Låt oss utgå från en population som består av 10 företag. Vi känner hur mycket företagen investerat (i tkr):
Exempel (forts) Stratum 1 Stratum 2 μ2 = 440 och σ2 = 20 μ1 = 15 och σ1 = 6.34 Hur stort stickprov ska väljas ur respektive strata? = att välja allokering
Projektarbetet - kodning Exempel 1: Fråga med endast två svarsalternativ. Äger du något motorfordon? ( 1 ) Ja ( 0 ) Nej Exempel 2: Fråga med många svarsalternativ, men det är endast tillåtet att fylla i ett enda svarsalternativ på frågan. Hur reser du oftast till Göteborg idag? ( 1 ) Med buss och byten mellan olika bussar ( 2 ) Med tåg och byten mellan olika tåg ( 3 ) Med buss och tåg och lämpliga byten ( 4 ) Med bil (egen bil eller samåkning med andra) ( 5 ) Med flyg ( 6 ) På annat sätt än ovanstående
Projektarbetet - kodning Exempel 3: Fråga med många svarsalternativ, där det är tillåtet att fylla i flera alternativ. Hur reser du till Göteborg idag? (Flera svarsalternativ får ges) ( ) Med buss ( ) Med tåg ( ) Med bil (egen bil eller samåkning) ( ) Med flyg ( ) På annat sätt än ovanstående Här är det lämpligt att låta varje svarsalternativ utgöra en egen kolumn i Excel när vi kodar, och om respondenten valt ett specifikt alternativ får det koden 1, annars koden 0
Projektarbetet - kodning Exempel 4: Attitydfrågor med svarsskalor av typen Mycket positiv ( 5 ) ( 4 ) ( 3 ) ( 2 ) ( 1 ) Mycket negativ Exempel 5: Frekvensfrågor Jag reser till Göteborg ( 1 ) mindre än en gång per år ( 2 ) 1-6 gånger per år ( 3 ) nästan varje månad ( 4 ) 1-3 gånger per månad ( 5 ) 1-3 gånger per vecka ( 6 ) varje dag eller nästan varje dag Exempel 7: Hur gammal är du? ______________ (skriv in resultatet, bilda grupper i efterhand)
Projektarbetet - kodning Kodning av saknade svar: • Om ”illegalt” bortfall lämna cellen tom eller markera med en * • Om ”legalt” bortfall ge någon speciell kod för detta (exempelvis -49) Exempel: Fråga 4: Reser du med buss när du reser till Göteborg? ( ) Ja ( ) Nej Fråga 5: Om du svarat Nej på föregående fråga, fortsätt till fråga 6 Vilket bussbolag reser du oftast med vid starten från Linköping? ( ) WeekendBus ( ) CrossSwede ( ) Annat, nämligen ____________ Om respondenten svarat Nej på fråga 4 skall inget svar ges på fråga 5. Bortfallet är legalt och kodas med 49