1 / 36

APRAŠOMOJI STATISTIKA

APRAŠOMOJI STATISTIKA. SKAITMENINIŲ DUOMENŲ APRAŠYMAS Tvarkymas Santykiniai ir sukauptieji dažniai, grafinis pateikimas Vidutiniai ir sklaidos dydžiai Normalumo vertinimas. GRUPAVIMAS. Variacinė eilutė (diskretūs, tolydieji kintamieji) Grupuojama į 5-17 gr. pagal tyrėjo kriterijus

charla
Download Presentation

APRAŠOMOJI STATISTIKA

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. APRAŠOMOJI STATISTIKA SKAITMENINIŲ DUOMENŲ APRAŠYMAS Tvarkymas Santykiniai ir sukauptieji dažniai,grafinis pateikimas Vidutiniai ir sklaidos dydžiai Normalumo vertinimas

  2. GRUPAVIMAS • Variacinė eilutė (diskretūs, tolydieji kintamieji) • Grupuojama į 5-17 gr. pagal tyrėjo kriterijus • (atviros kategorijos).

  3. Dažnių palyginimas ir skaičiavimas Apklausti 197 studentai, kiek tuo metu turėjo “pilnų” litų piniginėje

  4. Dažnių grafinis vaizdas

  5. PAVYZDYS Lovų skaičius slaugos ligoninėse Lietuvoje

  6. Sukauptojo dažnio reikšmė • Paprasčiau rasti Me, kvartilius • Skirstymui į grupes duomenų analizei • Dviejų imčių palyginimui (grafiniam)

  7. Dažnių grafinis vaizdas

  8. Dažnių grafinis vaizdas

  9. Normalūs skirstiniai (distributions) • Daugelis stebėjimų susitelkę apie centrą (vidurį, vidurkį) • mažesni, bet panašūs skaičiai kiekviename intervale virš ir žemiau centrinės reikšmės. • Vienodos proporcijos kiekvienoje centrinio taško pusėje. • Kraštutinės reikšmės (min ir max) pasitaiko vienodu dažnumu. • Pvz.: ūgis, svoris, kraujospūdis • Dažniausiai naudojamas Gauso (ar normalinis) skirstinys

  10. Asimetriški skirstiniai • Didesnė stebėjimų dalis susitelkusi vienoje pusėje.

  11. Varianto reikšmė Asimetriškas dažnio pasiskirstymas

  12. Kuo apibūdinama imtis? • DVI GRUPĖS STATISTIKŲ: 1. DUOMENŲ PADĖTIES (vidutiniai) DYDŽIAI 2. SKLAIDOS (išsibarstymo) DYDŽIAI

  13. DUOMENŲ PADĖTIES DYDŽIAI • Vidurkiai (aritmetinis, geometrinis, harmoninis ir kt.) • Moda • Mediana • Kvartiliai

  14. DUOMENŲ PADĖTIES DYDŽIAI • Aritmetinis vidurkis X=∑xi/n • kur: X = vidurkis, xi = i-toji x reikšmė, n = stebėjimų skaičius

  15. DUOMENŲ PADĖTIES DYDŽIAI Mediana - vidurinė reikšmė, arba 50-toji procentilė (varianto, dalijančio variacinę eilutę pusiau, reikšmė). Variacinėje eilutėje (stebėjimai išdėstyti didėjimo tvarka) pusė variantų yra mažiau už medianą, pusė – daugiau (vidurinis variantas apskaičiuojamas: • kai n nelyginis: mediana yra vidurinis variantas. • kai n lyginis: mediana yra vidurkis dviejų vidurinių variantų vidurkis

  16. DUOMENŲ PADĖTIES DYDŽIAI • Moda - dažniausiai pasitaikantys stebėjimai • gali būti daugiau nei viena, gali nebūti nė vienos

  17. SKAIČIAVIMAS Variacinė eilutė

  18. Mo, Me, X SKAIČIAVIMAS Apklausti 197 studentai, kiek tuo metu turėjo litų piniginėje

  19. DUOMENŲ PADĖTIES DYDŽIAI • Kvartiliai – imties dydis (stebėjimų skaičius) dalijamas į 4 dalis, gauname po 25 proc. variantų/stebėjimų kiekvienoje dalyje.

  20. SKAIČIAVIMAS Q1 Apklausti 197 studentai, kiek tuo metu turėjo litų piniginėje Q2 Q3

  21. Dvi imtys su vienodais vidutiniais dydžiais, bet skirtinga sklaida

  22. SKLAIDOS DYDŽIAI • Imties plotis (rangas): • skirtumas tarp maksimalios ir minimalios reikšmės • jautri kraštutinėms reikšmėms, nestabilus • Standartinis nuokrypis (SD/s - standard deviation) – dispersijos (variance) kvadratinė šaknis • Dispersija - V= ∑(xi - x)2/n-1 • Interkvartilinis plotis (IQR): Q3-Q1 arba 75%-25%.

  23. SKAIČIAVIMAS Apklausti 197 studentai, kiek tuo metu turėjo litų piniginėje

  24. SKAIČIAVIMAS Q1 Apklausti 197 studentai, kiek tuo metu turėjo litų piniginėje Q3 (IQR): Q3-Q1=4Lt.

  25. Sklaidos palyginimas • Imčių sklaidos palyginimui, kai skiriasi vidurkiai arba dimensijos, naudojamas variacijos koeficientas • CV = (SD/X) x 100% • Variacijos koeficientas, kai • vidurkis 10, SD 5, CV =50% • vidurkis 100, SD 5, CV =5% • Sklaidos skirtumą-vienodumą (variance equality) vertina Leveno (Levene) koeficientas.

  26. Kokios statistikos naudotinos imties apibūdinimui? Jei skirstinys normalus • Vidurkis – vidutinis dydis • jame visų stebėjimų informacija • naudingos statistinės savybės • Variacija (arba standartinis nuokrypis) – sklaidos dydis

  27. Kokios statistikos naudotinos, jei skirstinys neatitinka Gauso kreivės? Jei skirstinys asimetriškas, • mediana -- vidutinis dydis • interkvartilinis plotis arba min ir max reikšmės – sklaidos dydis Šios statistikos naudotinos ir ordinaliems kintamiesiems.

  28. Skirstinio normalumo vertinimas • Grafiškai • Vidutinių dydžių palyginimas bei vidurkio ir SD empirinė taisyklė • Asimetrijos (skewness) ir eksceso (kurtosis) koeficientai (Gauso kreivėje =0) • Šapiro ir Vilko testas (Shapiro-Wilk) Kolmogorovo ir Smirnovo testas

  29. Dažnis X, Mo, Me Varianto reikšmė Vidurkis~Mediana~Moda, SD ir vidurkio empirinė taisyklė

  30. Empirinė taisyklė • 3 standartinių nuokrypių (3 sigma) taisyklė • Vidurkio ir standartinio nuokrypio sąsaja

  31. EMPIRINĖ TAISYKLĖ Stebėjimų skaičius (%) 1, 2 ir 2.5 SD nuo vidurkio, esant normaliniam skirstiniui

  32. EMPIRINĖS TAISYKLĖS TAIKYMO PAVYZDYSNormalinis kraujospūdžio skirstinys Sistolinis AKS

  33. EMPIRINĖS TAISYKLĖS TAIKYMO PAVYZDYS X=8 SD=2,5 -2SD +2SD X

More Related