1 / 109

Explorační analýza aneb jak nelhát se statistikou?

Explorační analýza aneb jak nelhát se statistikou?. Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava.

kato-cook
Download Presentation

Explorační analýza aneb jak nelhát se statistikou?

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Explorační analýza aneb jak nelhátse statistikou? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava

  2. „Mnozí (politici, manažeři, …) používajístatistikujakoopilýčlověkpouličnílampu – spíše na podporu než na osvětlení.” Autor neznámý

  3. Co je to statistika? • teoretická disciplína, která se zabývá metodami sběru a analýzy dat Jak provést statistické šetření? úplné šetření statistické znaky – údaje, které u statistických znaků sledujeme (např. váha, výška, IQ, …) statistická jednotka = ZÁKLADNÍ SOUBOR

  4. Co je to statistika? • teoretická disciplína, která se zabývá metodami sběru a analýzy dat Jak provést statistické šetření? úplné šetření výběrové šetření REPREZENTATIVNÍ výběr rozsah – počet stat. jednotek ve výběru (v populaci)

  5. Co je to statistika? • teoretická disciplína, která se zabývá metodami sběru a analýzy dat Jak analyzovat data? Statistická indukce Exploratorní (popisná) statistika Exploratorní (popisná) statistika

  6. Základní pojmy ze statistické metodologie výběrové šetření Exploratorní (popisná) statistika • Popisná statistika (angl. ExploratoryData Analysis, EDA) - uspořádání • proměnných do názornější formy a jejich popis několika málo • hodnotami, které by obsahovaly co největší množství informací • obsažených v původním souboru.

  7. Základní pojmy ze statistické metodologie výběrové šetření Exploratorní (popisná) statistika

  8. Explorační analýza dat • = Grafická prezentace a uspořádání dat do názornější formy a jejich popis několika málo hodnotami, které by obsahovaly co největší množství informací obsažených v původním souboru.

  9. Typy statistických znaků (proměnných)

  10. EDA pro kategoriální veličinu

  11. Číselné charakteristiky + Modus (název nejčetnější varianty)

  12. Číselné charakteristiky 1% … 2,06 osob 0,00001% ... 0,0000206 osob Pozor na příliš přesná čísla!

  13. Číselné charakteristiky POZOR na zaokrouhlovací chybu!

  14. Číselné charakteristiky Dopočet do 100%!

  15. Číselné charakteristiky Relativní četnosti uvádějme vždy pouze jako doplněk absolutních četností, nikoliv samostatně!

  16. Grafické znázornění • Sloupcový graf (bar chart) „…můžete vytvořit sloupcový graf a dodat mu zcela nový a přitažlivý vzhled“ http://office.microsoft.com/cs-cz/excel-help/prezentace-dat-ve-sloupcovem-grafu-HA010218663.aspx

  17. Grafické znázornění • Sloupcový graf (bar chart)

  18. Grafické znázornění • Sloupcový graf (bar chart)

  19. Grafické znázornění • Sloupcový graf (bar chart)

  20. Grafické znázornění • Sloupcový graf (bar chart)

  21. Grafické znázornění • Sloupcový graf (bar chart)

  22. Grafické znázornění • Sloupcový graf (bar chart) • Na co si dát pozor? • Subjektivně vnímáme plochu (objem), nikoliv výšku jednotlivých „sloupců“.

  23. Grafické znázornění • Sloupcový graf (bar chart) Na co si dát pozor? zdroj dat: http://en.wikipedia.org/wiki/List_of_countries_by_carbon_dioxide_emissions_per_capita

  24. Grafické znázornění • Sloupcový graf (bar chart) • Na co si dát pozor? • Subjektivně vnímáme plochu (objem), nikoliv výšku • jednotlivých „sloupců“. • Nadbytečné názvy grafu, legendy, … • Neefektivní nuly • A na co ještě?

  25. Který z grafů je „správný“?

  26. 241 240 ? Určete pravdivost tvrzení: V žádných dvou letech nebyl počet studentů stejný. Zdroj: Testové příklady určené žákům 9. tříd.

  27. Grafické znázornění • Sloupcový graf (bar chart) • Na co si dát pozor? • Subjektivně vnímáme plochu (objem), nikoliv výšku • jednotlivých „sloupců“. • Nadbytečné názvy grafu, legendy, … • Neefektivní nuly • Informativní hodnota grafu

  28. Grafické znázornění B) Výsečový graf – koláčový graf (pie chart)

  29. Grafické znázornění B) Výsečový graf – koláčový graf (pie chart)

  30. Grafické znázornění B) Výsečový graf – koláčový graf (pie chart) Na co si dát pozor?

  31. Anketa Jste pro navýšení hodinové dotace matematiky? TAKHLE NE!!!

  32. Grafické znázornění B) Výsečový graf – koláčový graf (pie chart) • Na co si dát pozor? • Neuvádění absolutních četností, resp. celkového počtu respondentů v „blízkosti“ grafu • Nadbytečné názvy grafu

  33. Výskyt krevních skupin a Rh faktoru v USA Procentuální zastoupení krevních skupin v populaci USA

  34. Grafické znázornění B) Výsečový graf – koláčový graf (pie chart) • Na co si dát pozor? • Neuvádění absolutních četností, resp. celkového • počtu respondentů v „blízkosti“ grafu • Nadbytečné názvy grafu, legendy, … • Ne vždy je graf přehlednější než tabulka • A na co ještě?

  35. 2 grafy ještě chybí …

  36. 100% skládaný pruhový graf

  37. Grafické znázornění B) Výsečový graf – koláčový graf (pie chart) • Na co si dát pozor? • Neuvádění absolutních četností, resp. celkového počtu respondentů v „blízkosti“ grafu • Nadbytečné názvy grafu, legendy, … • Ne vždy je graf přehlednější než tabulka • „Jediná věc je horší než výsečový graf – několik nebo dokonce mnoho výsečových grafů“ • Van Belle

  38. Zdroj: Testové příklady určené žákům 9. tříd. Co je to A, B, C, D? Jsou výseče odpovídající variantám B a D stejně velké? Lze velikosti jednotlivých výsečí charakterizovat v absolutních číslech i v procentech? Určete pravdivost tvrzení: Místo otazníku patří 20%. Místo otazníku patří 126 Kč. Část C je dvojnásobkem části D. Rozdělení četností kvalitativního znaku se znázorňuje kruhovým diagramem, kde různým hodnotám znaku odpovídají kruhové výseče, jejichž plošné obsahy jsou úměrné četnostem. (Prometheus)

  39. Grafické znázornění • Sloupcový graf (bar chart) • Výsečový graf – koláčový graf (pie chart) • Obrázkové grafy

  40. Obrázkové grafy – užiteční pomocníci? Srovnání průměrných ročních nástupních platů učitelů středních škol v ČR (17 244 $) a Irsku (34 604 $)

  41. Obrázkové grafy – užiteční pomocníci? Srovnání průměrných ročních nástupních platů učitelů středních škol v ČR (17 244 $) a Irsku (34 604 $)

  42. „Úžasnáinfografika o výdajíchstátníhorozpočtuČeskérepubliky v roce2013“ Zdroj: http://www.estat.cz/zpravy/informace-k-projektum/kde-konci-vase-dane/

  43. Zdroj: http://www.estat.cz/zpravy/informace-k-projektum/kde-konci-vase-dane/

  44. Několik praktických příkladů aneb „bo co není stopro, to mě dycky…“

  45. Příklad s klobásou

  46. Příklad s klobásou

  47. Souboj vyhledávačů Zdroj: http://www.zive.cz/clanky/infografika-souboj-vyhledavacu-seznamcz-a-google/sc-3-a-167776/default.aspx

  48. Souboj vyhledávačů Zdroj: http://www.zive.cz/clanky/infografika-souboj-vyhledavacu-seznamcz-a-google/sc-3-a-167776/default.aspx

  49. Jak výsledky šetření zobrazit správně?

More Related