1 / 43

732G70 Statistik A, 7hp

732G70 Statistik A, 7hp. Linda Wänström ( linda.wanstrom@liu.se ) Tommy Schyman ( tommy.schyman@liu.se ). Kursupplägg. 10 föreläsningar 4 lektioner 4 räknestugor 3 datorövningar (labbar). Kurslitteratur. Tillämpad statistik – en grundkurs av Karl Wahlin

topaz
Download Presentation

732G70 Statistik A, 7hp

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 732G70Statistik A, 7hp Linda Wänström (linda.wanstrom@liu.se) Tommy Schyman (tommy.schyman@liu.se)

  2. Kursupplägg • 10 föreläsningar • 4 lektioner • 4 räknestugor • 3 datorövningar (labbar)

  3. Kurslitteratur • Tillämpad statistik – en grundkurs av Karl Wahlin • Kurskompendium med extra övningsuppgifter Föreläsningsunderlag läggs ut på kurshemsidan senast kvällen innan föreläsningen.

  4. Examination • Skriftlig salstentamen den 16 april • Hjälpmedel: • Valfri miniräknare • Kursboken • Får innehålla markeringar och överstrykningar men inte anteckningar

  5. Kurshemsida • Föreläsningsunderlag • Schema med läsanvisningar • Datorövningar • Gruppindelning till datorövningar • Kursplan • Information http://www.ida.liu.se/~732G70

  6. Kapitel 2 Populationer, stickprov och variabler Sid 11-46

  7. Population och stickprov • Population: Den samling enheter (exempelvis individer) som vi vill dra slutsatser om • Urvalsram • En förteckning över populationens enheter • Antalet enheter i populationen betecknas med N • Stickprov: urval av enheter från populationen • Antalet enheter i stickprovet betecknas med n • Exempel • Frågeställning: Hur skulle svenska folket rösta om det var val i dag? • Population? • Urvalsram? • Stickprov?

  8. Ändliga och oändliga populationer • Oändlig population • Sannolikheten att en enhet ska väljas ut ändras inte mellan dragningarna • Oberoende mellan dragningarna • Dragning med återläggning • Ändlig population • Sannolikheten att en enhet ska väljas ut ändras mellan dragningarna • Ej oberoende mellan dragningarna • Dragning utan återläggning • Tumregel: populationen kan betraktas som oändlig om urvalet utgör mindre än 10% av populationsstorleken.

  9. Variabel • Variabel • En egenskap som varierar • Kvalitativ variabel • Variabel som ej antar numeriska värden • Kvantitativ variabel • Variabel som antar numeriska värden • Diskreta kvantitativa variabler • Kan endast anta ett ändligt antal värden, eller ett oändligt men uppräkneligt antal värden • Ofta heltalsvärden • Kontinuerliga kvantitativa variabler • Kan anta ett oändligt antal värden inom ett intervall

  10. Skalor • En variabel är mätt med en viss skala • Nominalskala • Det går endast att kategorisera variabelvärdena • Ordinalskala • Det går att kategorisera OCH rangordna variabelvärdena • Metrisk skala • Det går att kategorisera och rangordna variabelvärdena, dessutom är avstånden mellan variabelvärdena desamma • Exempel: • Vilket parti skulle du rösta på om det var val i dag? __________ • Hur gammal är du? ___________ • Hur gammal är du? 18-25, 26-35, 36-64, 65+ • Hur väl instämmer du i följande påstående: …. (håller helt med, håller delvis med, varken håller med eller tar avstånd, tar delvis avstånd, tar helt avstånd)?

  11. Tabeller och diagram • Med tabeller och diagram kan vi åskådliggöra fördelningen för en/flera variabler

  12. Frekvenstabell • En tabell som anger frekvens (absoluta och/eller relativa frekvenser) för varje variabelvärde • Passar för kvalitativ variabel eller kvantitativ med få värden Exempel: ”Vilket parti skulle du rösta på i riksdagsvalet om det var val i dag?” • Undersökning gjord av SIFO i mars 2014 • Baserad på 1934 intervjuer

  13. Stapeldiagram På x-axeln har vi de olika variabelvärdena På y-axeln har vi frekvenserna ( i detta fall procent) Passar för kvalitativ variabel

  14. Cirkeldiagram • Passar för kvalitativ variabel

  15. Stolpdiagram • Som stapeldiagram, men stolparna är tunnare • Passar kvantitativ diskret variabel med få värden • Exempel: Antal barn i ett stickprov med 3340 kvinnor i USA

  16. Histogram Passar kvantitativa kontinuerliga variabler Variabelvärdena måste först klassindelas Exempel: Hushållsinkomst för de amerikanska kvinnorna (från tidigare)

  17. Histogram • Urval av hushållsinkomster (i dollar): 100, 300, 600, 800, 2000, 2100, 2100, 2200, 2500, 2700, 2800, 2900, 3000, 3100, 3200, 3300, 3500, 4000, 4800, 5500 • Klassindela på ett rimligt sätt, exempelvis: • 0-999, 1000-1999, 2000-2999, 3000-3999, 4000-4999, 5000-5999

  18. Stam- och bladdiagram • Ett slags histogram som står upp, där varje värde åskådliggörs • Passar kvantitativa (både diskreta och kontinuerliga) variabler • Siffrorna delas upp i ”stam” och ”blad” • Exempel (forts): 100, 300, 600, 800, 2000, 2100, 2100, 2200, 2500, 2700, 2800, 2900, 3000, 3100, 3200, 3300, 3500, 4000, 4800, 5500 • Stam: 1000-tal, dvs 0, 1, 2, 3, 4, 5

  19. Beskrivande mått • Andel/proportion (lägesmått) • För kvalitativa eller kvantitativa variabler • För stickprov: • För population: • Exempel: I SIFOS urval (i mars 2014) svarade 659 av1934 att de skulle rösta på socialdemokraterna om det var val i dag.

  20. Typvärde (lägesmått) • Variabelvärdet som förekommer med högst frekvens • För kvalitativa eller kvantitativa variabler • Exempel: • Vad är typvärdet för antal barn för de amerikanska kvinnorna (från tidigare)? • Vad är typvärdet för partisympati enligt SIFOs undersöknining?

  21. (Aritmetiskt) medelvärde (lägesmått) • För kvantitativa variabler • För stickprov: • För population: • Exempel: Vad är medelvärdet för urvalet av inkomster?

  22. Vägt medelvärde (lägesmått) • Medelvärde för grupperade (klassindelade) data i en frekvenstabell • För stickprov • För population där g är antal grupper/klasser • Vad blir medelvärdet för klassindelade inkomsten?

  23. Median (lägesmått) • Det mittersta värdet i en fördelning, när alla värden har storleksordnats • För kvantitativa och kvalitativa variabler på minst ordinaldatanivå • Medianen, M, har position Vad är medianinkomsten (för icke-klassindelade data)?

  24. Varians och standardavvikelse (spridningsmått) • Mäter ”spridningen” av data runt medelvärdet • För kvantitativa variabler • För stickprov • För population Vad är standardavvikelsen för inkomsterna?

  25. Varians och standardavvikelse (spridningsmått) • Varians och standardavvikelse för grupperade/klassindelade data i en frekvenstabell • För stickprov • För population Vad är standardavvikelsen för de klassindelade inkomsterna?

  26. Kvartilavstånd (spridningsmått) • För kvantitativa variabler • q3-q1 där q1 (första kvartilen) är mittersta värdet i första halvan av data q3 (tredje kvartilen) är mittersta värdet i andra halvan av data Kvartiler kan även beräknas på kvalitativa variabler på ordinaldatanivå

  27. Lådagram • Ett diagram som använder sig av median och kvartiler • En låda som begränsas av första och tredje kvartilen ritas, där medianen är utsatt med ett streck i lådan • Streck från lådan till den minsta och största observationen dras • Rita ett lådagram för följande observationer: 1, 2, 3, 3, 3, 4, 5, 6, 6, 7, 10, 11

  28. Standardvägning • En metod för att jämföra medelvärden för olika grupper där man tar hänsyn till att grupperna kan skilja sig åt i fördelningen för en annan variabel • Exempel: Medellöner för män och kvinnor efter arbetslivserfarenhet på ett företag • Enligt formel för vägt medelvärde får vi • Känns denna jämförelse rättvis? • Om vi i stället beräknar vägda medelvärden men använder totalantalet som vikter får vi

  29. Kapitel 3 Sannolikhetsteori sid 47-78

  30. Mängdlära • Används för att förstå och åskådliggöra sannolikheter • När vi utför ett experiment (slumpmässigt försök) kan vi få olika utfall • Exempel på experiment: Kasta en tärning, kasta ett mynt, dra ett kort från en kortlek, välj slumpmässigt en person från en population och fråga om partisympati • Vilka är de möjliga utfallen? • S = utfallsrum = mängden av de olika utfallen • En händelse definieras som en samling utfall • Exempel: A = antal udda prickar vid tärningskast, B = antal prickar högst 2 vid tärningskast

  31. Venndiagram • Ett diagram som åskådliggör utfallsrum och olika händelser

  32. Händelser • Snitt • Händelsen att både A och B inträffar • Union • Händelsen att antingen A eller B eller båda inträffar • Komplement till A • Händelsen att A inte inträffar • Disjunkta händelser • Händelserna A och B är disjunkta om de inte kan inträffa samtidigt (dvs de har inget snitt) • Oberoende händelser • Händelserna A och B är oberoende om sannolikheten att händelsen A inträffar inte påverkas av om B redan inträffat eller ej, samt sannolikheten att B inträffar inte påverkas av om A redan inträffat eller ej

  33. Kombinatorik • En metod för att bestämma antalet sätt ett visst antal element kan väljas/ordnas i mängder • Multiplikationsprincipen • Används när vi i tur och ordning ska utföra k stycken operationer där antalet möjliga händelser vid varje operation är n1, n2,…, nk • Det totala antalet sätt att utföra k operationer är Exempel: På en restaurang kan man välja mellan två förrätter, tre huvudrätter, och två efterrätter. På hur många sätt kan man skapa sin trerätters måltid?

  34. Permutationer när alla element är olika • Används när vi i en viss ordningsföljd vill välja ut k av n element och varje element endast får användas en gång • Antalet permutationer när alla element är olika är • Exempel: Av fyra längdskidåkare ska två väljas ut till ett stafettlag: en till förstasträckan och en till andrasträckan. På hur många sett kan detta ske?

  35. Permutationer när vissa element är lika • Används när vi vill ordna n element och där k1 tillhör en typ, k2 tillhör en annan typ osv • Antalet permutationer när vissa element är lika är • Exempel: I ett längdskidåkningslag finns två kvinnliga juniorer, två manliga juniorer, en kvinnlig senior och en manlig senior. På hur många sätt kan vi bilda stafettlag med dessa sex åkare?

  36. Kombinationer utan upprepning • Används när vi utan hänsyn till ordning vill välja ut k av n element och varje element endast får användas en gång • Antalet kombinationer är • Exempel: Av fyra längdskidåkare ska två väljas ut till ett stafettlag: På hur många sett kan detta ske?

  37. Kombinationer vid upprepning • Används när vi utan hänsyn till ordning vill välja ut k av n element och varje element får användas flera gånger • Antalet kombinationer är • Exempel: I en affär finns 4 sorter med plockgodis. På hur många sätt kan vi välja 2 godisbitar?

  38. Sannolikhetslära • Område inom statistiken där vi arbetar med experiment vars utfall beror på slumpen • Sannolikhet: ett värde som talar om hur troligt det är att en viss händelse ska inträffa • Klassiska sannolikhetsdefinitionen • Regler för sannolikheter: Sannolikheten för disjunkta händelser som upptar hela utfallsrummet kommer tillsammans att summera till 1

  39. Relativ frekvens • Sannolikheten för en händelse är en bedömning av den relativa frekvensen för händelsen

  40. Räknemetoder för sannolikheter • Additionssatsen för disjunkta händelser • För två händelser A och B som är disjunkta gäller att • Additionssatsen för icke disjunkta händelser • För två händelser A och B som inte är disjunkta gäller att Exempel: Vad är sannolikheten att få ett ess eller en kung när man drar ett kort ur en kortlek? Vad är sannolikheten att få ett ess eller ett hjärter när man drar ett kort ur en kortlek?

  41. Multiplikationssatsen för oberoende händelser • Om händelserna A och B är oberoende gäller • Om händelserna A och B inte är oberoende gäller • Exempel: Vad är sannolikheten att få två sexor vid kast av två tärningar? Vad är sannolikheten att få två ess vid dragning av två kort från en kortlek? Vad är sannolikheten att kortet vi dragit är ett ess om vi vet att kortet är minst en dam?

  42. Satsen om total sannolikhet • Om A1, A2, …, Ag är disjunkta händelser, sådana att deras union tillsammans bildar hela utfallsrummet, gäller • Exempel: I en fabrik tillverkas 25% av enheterna av maskin A1, 35% av maskin A2, och 40% av maskin A3. Dessutom gäller att 5% som tillverkas i maskin A1 är defekta, 4% som tillverkas i maskin A2 är defekta, och 2% som tillverkas i maskin A3 är defekta. Vad är sannolikheten att en slumpmässigt vald enhet är defekt?

  43. Bayes sats • Om A1, A2, …, Ag är disjunkta händelser, sådana att deras union tillsammans bildar hela utfallsrummet, gäller • Exempel (forts.): Vad är sannolikheten att en slumpmässigt vald enhet tillverkats av maskin A1 om vi vet att den är defekt?

More Related