370 likes | 1.03k Views
APRAŠOMOJI STATISTIKA. SKAITMENINIŲ DUOMENŲ APRAŠYMAS Tvarkymas Santykiniai ir sukauptieji dažniai, grafinis pateikimas Vidutiniai ir sklaidos dydžiai Normalumo vertinimas. GRUPAVIMAS. Variacinė eilutė (diskretūs, tolydieji kintamieji) Grupuojama į 5-17 gr. pagal tyrėjo kriterijus
E N D
APRAŠOMOJI STATISTIKA SKAITMENINIŲ DUOMENŲ APRAŠYMAS Tvarkymas Santykiniai ir sukauptieji dažniai,grafinis pateikimas Vidutiniai ir sklaidos dydžiai Normalumo vertinimas
GRUPAVIMAS • Variacinė eilutė (diskretūs, tolydieji kintamieji) • Grupuojama į 5-17 gr. pagal tyrėjo kriterijus • (atviros kategorijos).
Dažnių palyginimas ir skaičiavimas Apklausti 197 studentai, kiek tuo metu turėjo “pilnų” litų piniginėje
PAVYZDYS Lovų skaičius slaugos ligoninėse Lietuvoje
Sukauptojo dažnio reikšmė • Paprasčiau rasti Me, kvartilius • Skirstymui į grupes duomenų analizei • Dviejų imčių palyginimui (grafiniam)
Normalūs skirstiniai (distributions) • Daugelis stebėjimų susitelkę apie centrą (vidurį, vidurkį) • mažesni, bet panašūs skaičiai kiekviename intervale virš ir žemiau centrinės reikšmės. • Vienodos proporcijos kiekvienoje centrinio taško pusėje. • Kraštutinės reikšmės (min ir max) pasitaiko vienodu dažnumu. • Pvz.: ūgis, svoris, kraujospūdis • Dažniausiai naudojamas Gauso (ar normalinis) skirstinys
Asimetriški skirstiniai • Didesnė stebėjimų dalis susitelkusi vienoje pusėje.
Varianto reikšmė Asimetriškas dažnio pasiskirstymas
Kuo apibūdinama imtis? • DVI GRUPĖS STATISTIKŲ: 1. DUOMENŲ PADĖTIES (vidutiniai) DYDŽIAI 2. SKLAIDOS (išsibarstymo) DYDŽIAI
DUOMENŲ PADĖTIES DYDŽIAI • Vidurkiai (aritmetinis, geometrinis, harmoninis ir kt.) • Moda • Mediana • Kvartiliai
DUOMENŲ PADĖTIES DYDŽIAI • Aritmetinis vidurkis X=∑xi/n • kur: X = vidurkis, xi = i-toji x reikšmė, n = stebėjimų skaičius
DUOMENŲ PADĖTIES DYDŽIAI Mediana - vidurinė reikšmė, arba 50-toji procentilė (varianto, dalijančio variacinę eilutę pusiau, reikšmė). Variacinėje eilutėje (stebėjimai išdėstyti didėjimo tvarka) pusė variantų yra mažiau už medianą, pusė – daugiau (vidurinis variantas apskaičiuojamas: • kai n nelyginis: mediana yra vidurinis variantas. • kai n lyginis: mediana yra vidurkis dviejų vidurinių variantų vidurkis
DUOMENŲ PADĖTIES DYDŽIAI • Moda - dažniausiai pasitaikantys stebėjimai • gali būti daugiau nei viena, gali nebūti nė vienos
SKAIČIAVIMAS Variacinė eilutė
Mo, Me, X SKAIČIAVIMAS Apklausti 197 studentai, kiek tuo metu turėjo litų piniginėje
DUOMENŲ PADĖTIES DYDŽIAI • Kvartiliai – imties dydis (stebėjimų skaičius) dalijamas į 4 dalis, gauname po 25 proc. variantų/stebėjimų kiekvienoje dalyje.
SKAIČIAVIMAS Q1 Apklausti 197 studentai, kiek tuo metu turėjo litų piniginėje Q2 Q3
Dvi imtys su vienodais vidutiniais dydžiais, bet skirtinga sklaida
SKLAIDOS DYDŽIAI • Imties plotis (rangas): • skirtumas tarp maksimalios ir minimalios reikšmės • jautri kraštutinėms reikšmėms, nestabilus • Standartinis nuokrypis (SD/s - standard deviation) – dispersijos (variance) kvadratinė šaknis • Dispersija - V= ∑(xi - x)2/n-1 • Interkvartilinis plotis (IQR): Q3-Q1 arba 75%-25%.
SKAIČIAVIMAS Apklausti 197 studentai, kiek tuo metu turėjo litų piniginėje
SKAIČIAVIMAS Q1 Apklausti 197 studentai, kiek tuo metu turėjo litų piniginėje Q3 (IQR): Q3-Q1=4Lt.
Sklaidos palyginimas • Imčių sklaidos palyginimui, kai skiriasi vidurkiai arba dimensijos, naudojamas variacijos koeficientas • CV = (SD/X) x 100% • Variacijos koeficientas, kai • vidurkis 10, SD 5, CV =50% • vidurkis 100, SD 5, CV =5% • Sklaidos skirtumą-vienodumą (variance equality) vertina Leveno (Levene) koeficientas.
Kokios statistikos naudotinos imties apibūdinimui? Jei skirstinys normalus • Vidurkis – vidutinis dydis • jame visų stebėjimų informacija • naudingos statistinės savybės • Variacija (arba standartinis nuokrypis) – sklaidos dydis
Kokios statistikos naudotinos, jei skirstinys neatitinka Gauso kreivės? Jei skirstinys asimetriškas, • mediana -- vidutinis dydis • interkvartilinis plotis arba min ir max reikšmės – sklaidos dydis Šios statistikos naudotinos ir ordinaliems kintamiesiems.
Skirstinio normalumo vertinimas • Grafiškai • Vidutinių dydžių palyginimas bei vidurkio ir SD empirinė taisyklė • Asimetrijos (skewness) ir eksceso (kurtosis) koeficientai (Gauso kreivėje =0) • Šapiro ir Vilko testas (Shapiro-Wilk) Kolmogorovo ir Smirnovo testas
Dažnis X, Mo, Me Varianto reikšmė Vidurkis~Mediana~Moda, SD ir vidurkio empirinė taisyklė
Empirinė taisyklė • 3 standartinių nuokrypių (3 sigma) taisyklė • Vidurkio ir standartinio nuokrypio sąsaja
EMPIRINĖ TAISYKLĖ Stebėjimų skaičius (%) 1, 2 ir 2.5 SD nuo vidurkio, esant normaliniam skirstiniui
EMPIRINĖS TAISYKLĖS TAIKYMO PAVYZDYSNormalinis kraujospūdžio skirstinys Sistolinis AKS
EMPIRINĖS TAISYKLĖS TAIKYMO PAVYZDYS X=8 SD=2,5 -2SD +2SD X