190 likes | 390 Views
Základy metodológie vedy I. 9. prednáška. Triedenie dát: Triedny znak - x i Absolútna početnosť – n i ( súčet všetkých absolútnych početností sa rovná rozsahu súboru – n )
E N D
Triedenie dát: • Triedny znak - xi • Absolútna početnosť – ni(súčetvšetkých absolútnych početností sa rovná rozsahu súboru – n) • Relatívna početnosť – fi(relatívna početnosť sa udáva ako desatinné číslo, resp. v %. Súčetvšetkých relatívnych početností sa vždy rovná 1, resp. 100 %)
Triedenie dát: • Kumulatívna absolútnapočetnosť – Ni • Kumulatívna relatívnapočetnosť - Fi
Úlohou deskriptívnej (opisnej) štatistiky je vytvorenie prehľadu o získaných údajoch, ktoré samé o sebe predstavujú neprehľadnú zmes čísel, prípadne aj písmen. Na splnenie tohto účelu slúžia: • tabuľky, • grafy, • opisné charakteristiky.
Prezentácia výsledkov: Neoddeliteľnou súčasťou štatistického spracovania zistených údajov je prehľadná a názorná prezentácia prostredníctvom tabuliek a grafov. • Kruhový (koláčový) graf Obr. 4 Úmrtnosť na Slovensku podľa príčin smrti v roku 1999
Bodový graf • Spojnicový graf
Opisné charakteristiky: Opisná charakteristika predstavuje číslo vypočítané podľa príslušného vzorca zo štatistického súboru. Cieľom opisných charakteristík je charakterizovať súbor. Opisné charakteristiky sa delia na tri skupiny: • miery polohy (stredné hodnoty), • miery variability, • miery tvaru.
Miery polohy (stredné hodnoty): • poskytujú základnú informáciu o súbore získaných údajov, charakterizujú nám typickú hodnotu údajov, určenie hodnoty, okolo ktorej sa hodnoty premennej (znaku) v skúmanom súbore nachádzajú, pohybujú • Aritmetický priemer – x (resp. M)
Miery polohy (stredné hodnoty): • Medián– x (resp. Me) medián predstavuje strednú hodnotu súboru, ktorý je zoradený od najmenšej po najväčšiu hodnotu. V prípade párneho počtu hodnôt je medián aritmetický priemer hodnôt na miestach n/2 a n/2+1. • Modus– x (resp. Mo) modus predstavuje najčastejšie sa vyskytujúcu hodnotu premennej.Rozdelenie:s jediným vrcholom – unimodálne,s dvomi (viacerými) vrcholmi – bimodálne (multimodálne).
Miery variability: • Variačné rozpätie– Vr(resp. R) Najjednoduchšou mierou variability je variačné rozpätie, ktoré sa vypočíta ako rozdiel medzi najväčšou a najmenšou hodnotou súboru: pracuje sa iba s dvomi údajmi z celého súboru
Miery variability: • Rozptyl– s2 - najpoužívanejšou mierou variability je rozptyl,- pri výpočte sa používajú všetky údaje a vzťahuje sa k aritmetickému priemeru,- čím je rozptyl väčší, tým sa údaje viac odchyľujú od priemeru – sú viac rozptýlené.
Miery variability: • Smerodajná odchýlka– s - je odmocnina z rozptylu a tým sa vracia miera variability do mierky pôvodných dát:
Normálne (Gaussovo) rozdelenie - normálne rozdelenie pravdepodobnosti má v štatistických aplikáciách najväčší význam,- náhodná premenná x má normálne rozdelenie pravdepodobnosti s parametrami a 2 , ak jej funkcia hustoty pravdepodobnosti je daná vzťahom kde je stredná hodnota náhodnej premennej x, 2je rozptyl náhodnej premennej x.
Krivka hustoty pravdepodobnosti normálneho rozdelenia - parametre normálneho rozdelenia sú stredná hodnota a rozptyl, - normálna krivka je symetrická podľa osy, ktorá prechádza vrchol krivky,- vrcholom (maximom) krivky je stredná hodnota,- normálna krivka má zvonovitý tvar a je vždy kladná a nenulová pre všetky hodnoty x - nikdy nepretína vodorovnú os,- plocha ohraničená grafom f(x) a osou x je rovná 1 (zodpovedá 100%), - smerodajná odchýlka určuje ako je krivka roztiahnutá do šírky,
Krivka hustoty pravdepodobnosti normálneho rozdelenia Tvar krivky normálneho rozdelenia pre rôzne smerodajné odchýlky
Krivka hustoty pravdepodobnosti normálneho rozdelenia - interval obsahuje 68,3 % populácie,- interval 2obsahuje 95,5 % populácie,- interval 3obsahuje 99,7 % populácie.