510 likes | 943 Views
Popisná statistika - pokračování. Jeden mrtvý je tragédie. Desítka mrtvých je masakr. Tisíce mrtvých je statistika . . Postup tvorby histogramu. Urči šířku intervalu Urči hranice intervalů (Sturgersovo pravidlo nebo h = 0,08*R) Zařaď vzorky do jednotlivých intervalů
E N D
Popisná statistika - pokračování Jeden mrtvý je tragédie. Desítka mrtvých je masakr. Tisíce mrtvých je statistika.
Postup tvorby histogramu • Urči šířku intervalu • Urči hranice intervalů • (Sturgersovo pravidlo nebo h = 0,08*R) • Zařaď vzorky do jednotlivých intervalů • Zjisti četnosti v jednotlivých intervalech
Histogramy (= rozdělení četností)mohou mít různý tvar normální Příklady zešikmené bimodální
Neparametrické charakteristiky polohy • Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j.Důležitý u bimodálních rozdělení - směsná rozdělení. • Medián ( = 50%-ní kvantil):Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). • Trimean
Míry parametrické(momentové) Jsou založeny na všech hodnotách základního či výběrového souboru. Základní parametrickou mírou je PRŮMĚR – ZASTUPUJE STŘED, STŘEDNÍ HODNOTU SOUBORU
Aritmetický průměr Kde Xi jsou jednotlivé hodnoty veličiny X, N je celkový počet hodnot v souboru
Definice výběrového průměru pomocí pravděpodobnosti Výběrový průměr: Vyjádření výběrových momentů pomocí relativních četností: Výběrový průměr: Kde x – hodnota třídního znaku (střed intervalu), f – počet hodnot v tomto intervalu, n – celkový počet hodnot
Vážený průměr Máme-li dva či více výběrových souborů s výrazně rozdílnými N, ze kterých chcete vypočítat „celkový průměr“, musíme zohlednit tyto rozdílné počty „váhami“ - wi
Vážený průměr - pokračování Vzorek Průměr Počet hodnot Instinkt by vám mohl našeptávat: udělej aritmetický průměr z průměrů. TO NEDĚLEJTE !! Správný postup: X (Špatný postup: (3,85 + 5,21 + 4,7)/3 = 4,58) X
Geometrický průměr Pokud jsme naměřené hodnoty před výpočtem průměru transformovali logaritmováním (při základě = 10), a vypočteme aritmetický průměr těchto logaritmů, jeho zpětným „odlogaritmováním“ nedostaneme aritmetický průměr původních naměřených hodnot, ale GEOMETRICKÝ PRŮMĚR
Geometrický průměr Příklad: naměřili jsme hodnoty 2, 3, 3, 4, 15 (N = 5). Aritmetický průměr by dal („nesprávnou“) hodnotu 5.4 Lepší bude data nejprve transformovat logaritmováním (na hodnoty 0.301, 0.477, 0.477, 0.622, 1,176) a teprve z těchto logaritmů vypočítat průměr = 0.607. Zpětným odlogaritmováním (100.607) dostaneme hodnotu 4.043, která je správným vyjádřením střední hodnoty našeho souboru. Lze ji též vypočítat ze vzorce pro GEOMETRICKÝ PRŮMĚR:
Harmonický průměr Je-li vhodnější transformací původních dat jejich převedení na převrácené hodnoty, pak správným vyjádřením střední hodnoty je harmonický průměr:
Harmonický průměr Příklad výpočtu: (data z předchozího příkladu): suma převrácených hodnot vydělená N=5 je 0,297. Převrácená hodnota tohoto výsledku = 3.37 je HARMONICKÝ PRŮMĚR N.B.: aritmetický průměr z týchž dat = 5.4
Výpočet parametrických měr variability Vyjádření rozptylu pomocí pravděpodobnosti Výběrový rozptyl: nebo: Vyjádření výběrového rozptylu pomocí relativních četností: Výběrový rozptyl:
Dané rozdělení pravděpodobností Výpočet pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0 0,14 0 -1,44 2,07 0,29 1 0,39 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,11 0,33 1,56 2,43 0,27 = 1,44 2 = 0,75 Příklad - výpočet střední hodnoty a rozptylu Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi
Neparametrické charakteristiky polohy • Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j.Důležitý u bimodálních rozdělení - směsná rozdělení. • Medián ( = 50%-ní kvantil):Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). • Trimean
Definice statistických momentů pomocí pravděpodobnosti Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností: Výběrový průměr: Výběrový rozptyl:
Dané rozdělení pravděpodobností Výpočet pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0 0,14 0 -1,44 2,07 0,29 1 0,39 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,11 0,33 1,56 2,43 0,27 = 1,44 2 = 0,75 Příklad - výpočet střední hodnoty a rozptylu Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi
Parametrické míry polohy Průměry - aritmetický - geometrický - harmonický
Definice statistických momentů pomocí pravděpodobnosti Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností: Výběrový průměr: Výběrový rozptyl:
Dané rozdělení pravděpodobností Výpočet pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0 0,14 0 -1,44 2,07 0,29 1 0,39 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,11 0,33 1,56 2,43 0,27 = 1,44 2 = 0,75 Příklad - výpočet střední hodnoty a rozptylu Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi
Neparametrické charakteristiky polohy • Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j.Důležitý u bimodálních rozdělení - směsná rozdělení. • Medián ( = 50%-ní kvantil):Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). • Trimean
Parametrické míry polohy Průměry - aritmetický - geometrický - harmonický
Definice statistických momentů pomocí pravděpodobnosti Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností: Výběrový průměr: Výběrový rozptyl:
Dané rozdělení pravděpodobností Výpočet pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0 0,14 0 -1,44 2,07 0,29 1 0,39 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,11 0,33 1,56 2,43 0,27 = 1,44 2 = 0,75 Příklad - výpočet střední hodnoty a rozptylu Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi
Neparametrické charakteristiky polohy • Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j.Důležitý u bimodálních rozdělení - směsná rozdělení. • Medián ( = 50%-ní kvantil):Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). • Trimean
Parametrické míry polohy Průměry - aritmetický - geometrický - harmonický
Vážený průměr Mějme několik nezávislých nevychýlených měření X1, X2, …, Xn veličiny λ, se směrodatnými odchylkami σ1, σ2,…, σn a vahami w1, w2, …, wn. Jsou-li váhy wi nezávislé na hodnotách Xi, je nevychýleným odhadem střední hodnoty vážený průměr Rozptyl váženého průměru se vypočte dle vzorce
Definice statistických momentů pomocí pravděpodobnosti Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností: Výběrový průměr: Výběrový rozptyl:
Dané rozdělení pravděpodobností Výpočet pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0 0,14 0 -1,44 2,07 0,29 1 0,39 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,11 0,33 1,56 2,43 0,27 = 1,44 2 = 0,75 Příklad - výpočet střední hodnoty a rozptylu Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi
Neparametrické charakteristiky polohy • Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j.Důležitý u bimodálních rozdělení - směsná rozdělení. • Medián ( = 50%-ní kvantil):Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). • Trimean
Parametrické míry polohy Průměry - aritmetický - geometrický - harmonický
Definice statistických momentů pomocí pravděpodobnosti Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností: Výběrový průměr: Výběrový rozptyl:
Dané rozdělení pravděpodobností Výpočet pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0 0,14 0 -1,44 2,07 0,29 1 0,39 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,11 0,33 1,56 2,43 0,27 = 1,44 2 = 0,75 Příklad - výpočet střední hodnoty a rozptylu Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi
Neparametrické charakteristiky polohy • Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j.Důležitý u bimodálních rozdělení - směsná rozdělení. • Medián ( = 50%-ní kvantil):Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). • Trimean
Parametrické míry polohy Průměry - aritmetický - geometrický - harmonický
Definice statistických momentů pomocí pravděpodobnosti Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností: Výběrový průměr: Výběrový rozptyl:
Dané rozdělení pravděpodobností Výpočet pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0 0,14 0 -1,44 2,07 0,29 1 0,39 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,11 0,33 1,56 2,43 0,27 = 1,44 2 = 0,75 Příklad - výpočet střední hodnoty a rozptylu Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi
Dané rozdělení pravděpodobností Výpočet pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0 0,14 0 -1,44 2,07 0,29 1 0,39 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,11 0,33 1,56 2,43 0,27 = 1,44 2 = 0,75 Příklad - výpočet střední hodnoty a rozptylu Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi
On-line statistická modelace http://fltbw2.rug.ac.be/iloapp/Applets/Ap4a.html http://pbil.univ-lyon1.fr/Rweb/ Statlet: Calculate and plot probability distributions: http://www.statlets.com/free/pdist.htm