340 likes | 746 Views
Statistika. OPAKOVÁNÍ. Statistický soubor Statistický znak x - kvalitativní - kvantitativní - hodnoty statistického znaku x 1 , x 2 ,…, x n Četnost n i Relativní četnost v i Rozdělení četností - tabulka - graf.
E N D
OPAKOVÁNÍ • Statistický soubor • Statistický znak x - kvalitativní - kvantitativní - hodnoty statistického znaku x1, x2,…,xn • Četnost ni • Relativní četnost vi • Rozdělení četností - tabulka - graf
CHARAKTERISTIKYZNAKU = čísla, která podávají stručnou souhrnnou informaci o uvažovaném statistickém souboru z různých hledisek • Charakteristiky polohy (střední hodnoty) - aritmetický průměr - vážený průměr - geometrický průměr - harmonický průměr - medián - modus
CHARAKTERISTIKY ZNAKU • Charakteristiky variability = čísla, která nějak charakterizují, jak se hodnoty znaku prvků souboru liší od zvolené střední hodnoty, resp. od sebe navzájem - rozptyl - směrodatná odchylka - variační koeficient
ARITMETICKÝ PRŮMĚR znak x hodnoty znaku x1, x2,…,xn aritmetický průměr
ARITMETICKÝ PRŮMĚR • Pokud vycházíme z tabulky rozložení četností, n1,…,nk jsou četnosti hodnot x1,…, xk, dostaneme Př.:
PŘÍKLADY • Počet bodů, které získali studenti z písemné práce, je uveden v tabulce. Určete aritmetický průměr bodů. 2) Průměrná výška původně nominovaných členů školního basketbalového mužstva byla 183 cm. Poté co byl do družstva zařazen nový hráč, který měří 199 cm, vzrostla průměrná výška v družstvu o 2 cm. Kolik členů má školní družstvo nyní?
VÁŽENÝ PRŮMĚR • Skládá-li se soubor z několika dílčích souborů s různými počty prvků, musíme při počítání „celkového průměru“ zohlednit tyto počty (přiřadit jednotlivým hodnotám různou váhu) • Statistický soubor … 4 dílčí soubory známe: n1, n2, n3, n4 a chceme určit průměr v celém souboru
PŘÍKLADY • Ve firmě jsou tři oddělení. V prvním pracuje 25 lidí a jejich průměrný plat je 28 000 Kč,ve druhém pracuje 32 lidí a jejich průměrný plat činí 23 500 Kč a ve třetím je 6 lidí a jejich průměrný plat je 38 000 Kč. Vypočítejte průměrný plat v celé firmě. • Ve škole jsou čtyři 6. třídy. Počty žáků a průměrné známky z matematiky jsou uvedeny v tabulce. Určete průměrnou známku z matematiky ve všech 6. třídách dohromady.
GEOMETRICKÝ PRŮMĚR • Zavádí se jen pro kladná čísla • Používá se především k výpočtu průměrného tempa (koeficientu) růstu • Geometrický průměr
PŘÍKLADY • Vypočtěte průměrný koeficient růstu produkce jednoho podniku za celý rok, jestliže v jednotlivých čtvrtletích byl koeficient růstu následující: 0,98; 1,02; 1,12; 1,05. • Předloni byla výše ročního platu zaměstnance ve firmě 200 000 Kč, loni 220 000 Kč a letos 250 000 Kč. Jaký je průměrný koeficient růstu jeho platu? • Jsou dány v procentech tyto údaje o růstu určitého druhu výroby v devíti po sobě jdoucích letech: 103,5; 104,7; 107,6; 105,8; 112,7; 116,5; 115,3; 108,5; 110,6. Máme vypočítat průměrné roční tempo růstu této výroby za uvedené období.
HARMONICKÝ PRŮMĚR Využití: Př.: Určete průměrnou rychlost automobilu, který jede z místa A do místa B stálou rychlostí 80 km/h a zpět z B do A stálou rychlostí 120 km/h.
MODUS • Modus znaku x je jeho hodnota s největší četností • Značí se Mod(x) • Využití: - věk, v němž se nejčastěji vyskytuje sledované onemocnění - statistika výskytu škodlivin … Př.: Co je modus v následujících výsledcích zjišťování krevních skupin: A, 0, 0, B, B, AB, A, A, 0, 0, 0, AB, B, 0, B, A, 0, AB, 0, 0, B, 0, A?
MEDIÁN • Medián znaku x je prostřední hodnota znaku, jsou-li hodnoty x1, x2,…, xnuspořádány podle velikosti. • Značí se Med(x) • Pro n liché • Pro n sudé
PŘÍKLADY • Uvažujme malou firmu s 10 zaměstnanci, z nichž jeden je zároveň majitelem firmy. Představme si, že 3 zaměstnanci pobírají měsíčně plat 10 000 Kč, 2 zaměstnanci 12 000 Kč, 4 zaměstnanci 13 000 Kč a majitel si vyplácí měsíčně 110 000 Kč. Určete medián platu. 2) Pro rozdělení četností podle tabulky určete modus a medián hodnot xi.
PŘÍKLADY – geometrický průměr • Nově založený podnik vykázal v letech 2000 až 2004 následující čistý zisk (v mil. Kč): Jaké bylo průměrné roční tempo růstu? 2) Obdélník má rozměry a = 2 cm, b = 8 cm. Jaká je délka strany čtverce stejného obsahu jako obdélník? 3) Kvádr má rozměry a = 5 cm, b = 2 cm, c = 12,5 cm. Jak dlouhou musí mít krychle hranu, aby měla stejný objem jako daný kvádr?
CHARAKTERISTIKY VARIABILITY = čísla, která nějak charakterizují, jak se hodnoty znaku prvků souboru liší od zvolené střední hodnoty, resp. od sebe navzájem - rozptyl - směrodatná odchylka - variační koeficient
ROZPTYL = aritmetický průměr druhých mocnin odchylek hodnot znaku od aritmetického průměru • Obvykle se značí • Je-li x znak, xi jeho hodnoty, platí pro rozptyl vztah: • Vycházíme-li z tabulky četností:
ROZPTYL • po úpravě (pro snadnější výpočet): resp.
SMĚRODATNÁ ODCHYLKA = druhá odmocnina z rozptylu • obvykle se značí • uvádí se ve stejných jednotkách jako znak (hodnoty znaku)
PŘÍKLADY • Spočtěte průměr, rozptyl a směrodatnou odchylku následujících hmotností: 68 kg, 65 kg, 59 kg, 57 kg, 59 kg, 52 kg, 49 kg, 48 kg, 43 kg, 48 kg, 48 kg. 2) K dispozici máme údaje o městské spotřebě 120 osobních a malých užitkových automobilů dostupných v roce 2004 na trhu v USA. Spotřeba je uvedena v litrech paliva na 100 km. Určete průměrnou městskou spotřebu těchto aut, rozptyl a směrodatnou odchylku.
VARIAČNÍ KOEFICIENT = podíl směrodatné odchylky a aritmetického průměru sledovaného znaku x • obvykle se značí • v procentech: • využití: - při statistické kontrole kvality laboratorních testů - může charakterizovat přesnost měření …
PŘÍKLADY 1) U předchozích dvou příkladů určete variační koeficient.
PŘÍKLADY - OPAKOVÁNÍ • Ve třídě bylo 28 žáků. Na počátku školního roku byl aritmetický průměr jejich výšek 143 cm. Později se přistěhoval Petr, který měří 164 cm, a Eva, která měří 152 cm. Jaká je nyní průměrná výška žáka čtvrté třídy? • V nemocnici bylo v určitém období hospitalizováno 150 osob na chirurgickém oddělení s průměrnou délkou hospitalizace 19 dní, 100 osob na gynekologickém oddělení s průměrnou délkou hospitalizace 7 dní a na dětském oddělení 90 dětí s průměrnou délkou hospitalizace 12 dní. Spočtěte průměrnou délku hospitalizace v nemocnici.
PŘÍKLADY - OPAKOVÁNÍ 3) V následující tabulce je uvedeno rozdělení četností hladiny hemoglobinu pro 70 žen. Určete, kolik procent žen má hladinu hemoglobinu nižší než 12 g/100ml.
STATISTICKÁ ZÁVISLOST ZNAKŮ • statistika se většinou nezabývá jen každým znakem zvlášť, ale zkoumá vzájemnou závislost dvou a více znaků • 2 znaky: x hodnoty znaků: x1, x2, …, xn yy1, y2, …, yn
PŘÍKLAD Na konci 1. a 2. ročníku byli v matematice žáci klasifikováni následovně: Vytvořte tabulku četností.
ZÁVISLOST DVOU ZNAKŮ – KOEFICIENT KORELACE • obvykle se značí rxy 2 znaky: hodnoty znaku x: x1, x2, …, xn hodnoty znaku y: y1, y2, …, yn • koeficient korelace:
PŘÍKLADY • 10 chlapců bylo vyzváno, aby uvedli svoji tělesnou výšku a tělesnou výšku otce. Byly zjištěny tyto hodnoty: Vypočtěte koeficient korelace mezi tělesnou výškou syna a otce. • 10 žáků základní školy se podrobilo inteligenčnímu testu. Výsledky testu byly porovnávány s průměrem známek na vysvědčení: Vypočtěte koeficient korelace mezi průměrnou známkou a inteligenčním kvocientem žáků.
KOEFICIENT KORELACE • koeficient korelace je vždy číslo z intervalu • kladný … nadprůměrným hodnotám x zpravidla odpovídají nadprůměrné hodnoty y a podprůměrným podprůměrné • záporný … nadprůměrným hodnotám x zpravidla odpovídají podprůměrné hodnoty y a naopak • čím menší závislost mezi znaky, tím víc se bude koeficient korelace blížit k nule • krajních hodnot 1 a -1 nabývá koeficient korelace tehdy, je-li mezi znaky funkční (konkrétně lineární) závislost
PŘÍKLADY • Z tabulky rozdělení četností vypočtěte koeficient korelace. 2) Z šesti států máme data o roční spotřebě cigaret na jednoho obyvatele (znak x) a o roční míře úmrtnosti na rakovinu plic na 100 000 obyvatel (znak y). Vypočtěte koeficient korelace mezi oběma znaky.
PŘÍKLAD - OPAKOVÁNÍ • V testu při zkoušce dostalo 15 studentů známku 1, dalších 35 studentů dostalo známku 2, známku 3 dostalo 30 studentů, 15 studentů dostalo známku 4 a zbylých 5 studentů dostalo známku 5. Vypočítejte průměrnou známku z testu, modus a medián.