170 likes | 443 Views
Rozdelenie štatistiky. Popisná štatistika. 1. Obsah: Zber dát Spracovanie dát Prezentácia dát 2. Cieľ: Popis dát. $. 50. 25. 0. Q1. Q2. Q3. Q4. X = 30.5 S 2 = 113. Matematická štatistika. 1. Obsah: Odhad Testovanie hypotéz 2. Cieľ:
E N D
Popisná štatistika 1. Obsah: • Zber dát • Spracovanie dát • Prezentácia dát 2. Cieľ: • Popis dát $ 50 25 0 Q1 Q2 Q3 Q4 X = 30.5 S2 = 113 UVM
Matematická štatistika 1. Obsah: • Odhad • Testovanie hypotéz 2. Cieľ: • Rozhodnúť o charakteristikách základného súboru (populácia) Populácia? UVM
Spracovanie, sumarizácia dát • Kontrola dat • formálna • vecná • Triedenie = usporiadanie dát do skupín (tried) podľa určitých pravidiel tak, aby čo najlepšie vynikli vlastnosti javu (-ov) • Zásady triedenia: • Jednoznačnosť • Úplnosť UVM
Kľúčové pojmy • Základný súbor = populácia (Population, Universe) • všetky jednotky 2. Výberový súbor = výber, vzorka (Sample) • časť populácie 3. Parameter (Parameter) • charakteristika populácie 4. Štatistika (Statistic) • charakteristika výberu • P in Population & Parameter • S in Sample & Statistic UVM
Prezentácia kvalitatívnych dát(kategoriálne dáta) • Obsah tabuľky (Summary table): • Zoznam kategórií • Početnosti kategórií (počet, percento, alebo aj oboje) Súhlas:|||| |||||||| |||| Riadok = kategória Počet Špecializácia Management 130 Ek.integrácia (EI) 20 Marketing 50 Spolu: 200 UVM
Stĺpcový graf(Bar Chart) Výška stĺpca zobrazuje početnosť (alebo %) Špecializácia Marketing Rovnaká šírka stĺpcov EI Management Horizontálny stĺpec pre kategoriálnu premennú 0 50 100 Početnosť (Frequency) UVM
Kruhový graf(Pie Chart) • Zobrazuje rozloženie početnosti súboru do kategórií • Vhodný na zobrazenie relatívnych početností • Veľkosť uhla = (360°) x (percento) Špecializácia Marketing 25% Ek. integrácia 10% 36° Management 65% (360°)x(10%) = 36° UVM
Bodový graf(Dot Chart) Špecializácia Dĺžka čiary zobrazuje početnosť (alebo %) Marketing Rovnaké medzery Ek.integrácia Management Nulový bod 0 50 100 150 Početnosť UVM
Stem-and-Leaf DisplaySteblo-a-List graf • Delí všetky pozorovania na hodnoty „stebla“ a „listov“: • Hodnoty „stebla“ určujú triedy (Class) • Hodnoty „listov“ určujú počet (Count) • Dáta: 21, 24, 24, 26, 27, 27, 30, 32, 38, 41 26 UVM
Frekvenčnátabuľka(Frequency Table) Dáta (Raw Data):n = 10 (rozsah) 24, 26, 24, 21, 27, 27, 30, 41, 32, 38 m = 3 (počet tried resp. tried. intervalov) h = 10 (šírka intervalu = rozpätie) UVM
FrekvenčnátabuľkaPostup • Určiť variačné rozpätie (Range) R = xmax – xmin • Určiť počet triednych intervalov (Class) m (zvyčajne 5 m 15) • Určiť šírku (rozpätie) intervalov h (Width): • rovnaká, nerovnaká • Určiť hranice intervalov (Boundaries): • ostré, neostré • Určiť stredy intervalov (Class Midpoints) xi , i = 1, 2, …, m • Vytriediť dáta & zistiť triedne početnosti (Frequency): UVM
ni = absolútne triedne početnosti (platí ni=n, pre i=1, 2,…,m) Ni = kumulatívne absolútne triedne početnosti fi = relatívne triedne početnosti (fi=ni / n) Fi = kumulatívne relatívne triedne početnosti UVM
FrekvenčnátabuľkaPríklad Dáta:n = 10 24, 26, 24, 21, 27, 27, 30, 41, 32, 38 R = 41-21 = 20, m = 4, h = 5 x2 = 30 - 5/2 = 27,5 f1= 3/10 = 0,3 resp. 30% UVM
Histogram Početnosť absolútna, relatívna(v %) Počet 5 4 Dotyk stĺpcov 3 2 1 0 0 15 25 3545 Nulový bod Dolné hranice intervalov UVM