1 / 49

Popisná statistika - pokračování

Popisná statistika - pokračování. Jeden mrtvý je tragédie. Desítka mrtvých je masakr. Tisíce mrtvých je statistika . . Postup tvorby histogramu. Urči šířku intervalu Urči hranice intervalů (Sturgersovo pravidlo nebo h = 0,08*R) Zařaď vzorky do jednotlivých intervalů

ouida
Download Presentation

Popisná statistika - pokračování

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Popisná statistika - pokračování Jeden mrtvý je tragédie. Desítka mrtvých je masakr. Tisíce mrtvých je statistika.

  2. Postup tvorby histogramu • Urči šířku intervalu • Urči hranice intervalů • (Sturgersovo pravidlo nebo h = 0,08*R) • Zařaď vzorky do jednotlivých intervalů • Zjisti četnosti v jednotlivých intervalech

  3. Histogramy (= rozdělení četností)mohou mít různý tvar normální Příklady zešikmené bimodální

  4. Neparametrické charakteristiky polohy • Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j.Důležitý u bimodálních rozdělení - směsná rozdělení. • Medián ( = 50%-ní kvantil):Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). • Trimean

  5. Míry parametrické(momentové) Jsou založeny na všech hodnotách základního či výběrového souboru. Základní parametrickou mírou je PRŮMĚR – ZASTUPUJE STŘED, STŘEDNÍ HODNOTU SOUBORU

  6. Aritmetický průměr Kde Xi jsou jednotlivé hodnoty veličiny X, N je celkový počet hodnot v souboru

  7. Definice výběrového průměru pomocí pravděpodobnosti Výběrový průměr: Vyjádření výběrových momentů pomocí relativních četností: Výběrový průměr: Kde x – hodnota třídního znaku (střed intervalu), f – počet hodnot v tomto intervalu, n – celkový počet hodnot

  8. Výpočet aritmetického průměru

  9. Vážený průměr Máme-li dva či více výběrových souborů s výrazně rozdílnými N, ze kterých chcete vypočítat „celkový průměr“, musíme zohlednit tyto rozdílné počty „váhami“ - wi

  10. Vážený průměr - pokračování Vzorek Průměr Počet hodnot Instinkt by vám mohl našeptávat: udělej aritmetický průměr z průměrů. TO NEDĚLEJTE !! Správný postup: X (Špatný postup: (3,85 + 5,21 + 4,7)/3 = 4,58) X

  11. Geometrický průměr Pokud jsme naměřené hodnoty před výpočtem průměru transformovali logaritmováním (při základě = 10), a vypočteme aritmetický průměr těchto logaritmů, jeho zpětným „odlogaritmováním“ nedostaneme aritmetický průměr původních naměřených hodnot, ale GEOMETRICKÝ PRŮMĚR

  12. Geometrický průměr Příklad: naměřili jsme hodnoty 2, 3, 3, 4, 15 (N = 5). Aritmetický průměr by dal („nesprávnou“) hodnotu 5.4 Lepší bude data nejprve transformovat logaritmováním (na hodnoty 0.301, 0.477, 0.477, 0.622, 1,176) a teprve z těchto logaritmů vypočítat průměr = 0.607. Zpětným odlogaritmováním (100.607) dostaneme hodnotu 4.043, která je správným vyjádřením střední hodnoty našeho souboru. Lze ji též vypočítat ze vzorce pro GEOMETRICKÝ PRŮMĚR:

  13. Harmonický průměr Je-li vhodnější transformací původních dat jejich převedení na převrácené hodnoty, pak správným vyjádřením střední hodnoty je harmonický průměr:

  14. Harmonický průměr Příklad výpočtu: (data z předchozího příkladu): suma převrácených hodnot vydělená N=5 je 0,297. Převrácená hodnota tohoto výsledku = 3.37 je HARMONICKÝ PRŮMĚR N.B.: aritmetický průměr z týchž dat = 5.4

  15. Výpočet parametrických měr variability Vyjádření rozptylu pomocí pravděpodobnosti Výběrový rozptyl: nebo: Vyjádření výběrového rozptylu pomocí relativních četností: Výběrový rozptyl:

  16. Dané rozdělení pravděpodobností Výpočet  pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0 0,14 0 -1,44 2,07 0,29 1 0,39 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,11 0,33 1,56 2,43 0,27  = 1,44 2 = 0,75 Příklad - výpočet střední hodnoty a rozptylu Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi

  17. Neparametrické charakteristiky polohy • Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j.Důležitý u bimodálních rozdělení - směsná rozdělení. • Medián ( = 50%-ní kvantil):Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). • Trimean

  18. Definice statistických momentů pomocí pravděpodobnosti Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností: Výběrový průměr: Výběrový rozptyl:

  19. Dané rozdělení pravděpodobností Výpočet  pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0 0,14 0 -1,44 2,07 0,29 1 0,39 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,11 0,33 1,56 2,43 0,27  = 1,44 2 = 0,75 Příklad - výpočet střední hodnoty a rozptylu Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi

  20. Parametrické míry polohy Průměry -         aritmetický -         geometrický -        harmonický

  21. Definice statistických momentů pomocí pravděpodobnosti Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností: Výběrový průměr: Výběrový rozptyl:

  22. Dané rozdělení pravděpodobností Výpočet  pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0 0,14 0 -1,44 2,07 0,29 1 0,39 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,11 0,33 1,56 2,43 0,27  = 1,44 2 = 0,75 Příklad - výpočet střední hodnoty a rozptylu Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi

  23. Neparametrické charakteristiky polohy • Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j.Důležitý u bimodálních rozdělení - směsná rozdělení. • Medián ( = 50%-ní kvantil):Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). • Trimean

  24. Parametrické míry polohy Průměry -         aritmetický -         geometrický -        harmonický

  25. Aritmetický průměr vypočtený pomocí pravděpodobnosti

  26. Definice statistických momentů pomocí pravděpodobnosti Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností: Výběrový průměr: Výběrový rozptyl:

  27. Dané rozdělení pravděpodobností Výpočet  pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0 0,14 0 -1,44 2,07 0,29 1 0,39 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,11 0,33 1,56 2,43 0,27  = 1,44 2 = 0,75 Příklad - výpočet střední hodnoty a rozptylu Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi

  28. Neparametrické charakteristiky polohy • Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j.Důležitý u bimodálních rozdělení - směsná rozdělení. • Medián ( = 50%-ní kvantil):Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). • Trimean

  29. Parametrické míry polohy Průměry -         aritmetický -         geometrický -        harmonický

  30. Aritmetický průměr vypočtený pomocí pravděpodobnosti

  31. Vážený průměr Mějme několik nezávislých nevychýlených měření X1, X2, …, Xn veličiny λ, se směrodatnými odchylkami σ1, σ2,…, σn a vahami w1, w2, …, wn. Jsou-li váhy wi nezávislé na hodnotách Xi, je nevychýleným odhadem střední hodnoty vážený průměr Rozptyl váženého průměru se vypočte dle vzorce

  32. Definice statistických momentů pomocí pravděpodobnosti Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností: Výběrový průměr: Výběrový rozptyl:

  33. Dané rozdělení pravděpodobností Výpočet  pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0 0,14 0 -1,44 2,07 0,29 1 0,39 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,11 0,33 1,56 2,43 0,27  = 1,44 2 = 0,75 Příklad - výpočet střední hodnoty a rozptylu Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi

  34. Neparametrické charakteristiky polohy • Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j.Důležitý u bimodálních rozdělení - směsná rozdělení. • Medián ( = 50%-ní kvantil):Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). • Trimean

  35. Parametrické míry polohy Průměry -         aritmetický -         geometrický -        harmonický

  36. Aritmetický průměr vypočtený pomocí pravděpodobnosti

  37. Definice statistických momentů pomocí pravděpodobnosti Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností: Výběrový průměr: Výběrový rozptyl:

  38. Dané rozdělení pravděpodobností Výpočet  pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0 0,14 0 -1,44 2,07 0,29 1 0,39 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,11 0,33 1,56 2,43 0,27  = 1,44 2 = 0,75 Příklad - výpočet střední hodnoty a rozptylu Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi

  39. Neparametrické charakteristiky polohy • Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j.Důležitý u bimodálních rozdělení - směsná rozdělení. • Medián ( = 50%-ní kvantil):Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). • Trimean

  40. Parametrické míry polohy Průměry -         aritmetický -         geometrický -        harmonický

  41. Aritmetický průměr vypočtený pomocí pravděpodobnosti

  42. Definice statistických momentů pomocí pravděpodobnosti Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností: Výběrový průměr: Výběrový rozptyl:

  43. Dané rozdělení pravděpodobností Výpočet  pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0 0,14 0 -1,44 2,07 0,29 1 0,39 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,11 0,33 1,56 2,43 0,27  = 1,44 2 = 0,75 Příklad - výpočet střední hodnoty a rozptylu Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi

  44. Dané rozdělení pravděpodobností Výpočet  pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0 0,14 0 -1,44 2,07 0,29 1 0,39 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,11 0,33 1,56 2,43 0,27  = 1,44 2 = 0,75 Příklad - výpočet střední hodnoty a rozptylu Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi

  45. On-line statistická modelace http://fltbw2.rug.ac.be/iloapp/Applets/Ap4a.html http://pbil.univ-lyon1.fr/Rweb/ Statlet: Calculate and plot probability distributions: http://www.statlets.com/free/pdist.htm

More Related