1 / 49

PODRÓŻ 1 Prezentacja i odczytywanie danych statystycznych

PODRÓŻ 1 Prezentacja i odczytywanie danych statystycznych. PODRÓŻ 2 Co to jest średnia?. PODRÓŻ 3 Dominanta i mediana. TEST. PODRÓŻ 4 Nie dajmy się oszukać!. Wyjście z programu. Prezentacja i odczytywanie danych statystycznych.

quinto
Download Presentation

PODRÓŻ 1 Prezentacja i odczytywanie danych statystycznych

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. PODRÓŻ 1 Prezentacja i odczytywanie danych statystycznych PODRÓŻ 2 Co to jest średnia? PODRÓŻ 3 Dominanta i mediana TEST PODRÓŻ 4 Nie dajmy się oszukać! Wyjście z programu

  2. Prezentacja i odczytywanie danych statystycznych

  3. Statystyka zajmuje się metodami gromadzeniai prezentacji danych oraz ich opisu. Dane statystyczne mogą być przedstawione w postaci tabelek, wykresów lub diagramów prostokątnych, słupkowych, kołowych i innych. Dalej

  4. Przeanalizujmy teraz przykładprezentowania danych statystycznych Dalej

  5. Tabela

  6. Diagram kolumnowy

  7. Diagram kołowy

  8. Diagram pierścieniowy

  9. Diagram punktowy

  10. WYKRES WARSTWOWY NAKŁADANY Struktura dochodów na członka rodziny w gospodarstwach emeryckich w miastach Polski (podział wg województw) zaczerpnięte z wykładów M. Sobolewskiego

  11. OBRAZKOWY WYKRES ROZRZUTU (występowanie udarów mózgu w zależności od pory roku i pory dnia) zaczerpnięte z wykładów M. Sobolewskiego

  12. WYKRES MAPKOWY (udział w badaniach profilaktycznych związanych z pewnym schorzeniem) zaczerpnięte z wykładów M. Sobolewskiego

  13. Znamy już sposoby przedstawiania danych statystycznych. Ale czy potrafimy odczytywać dane z wykresów ???

  14. Oto wyniki klasówki w klasach 1a i 1b: 1a: 2,1,2,2,4,5,6,5,1,1,3,5,2,4,3,1,5,2,2,5,2,3,2,2,5,5,2 1b: 4,2,4,3,4,1,4,4,4,1,1,4,2,4,4,4,2,1,4,3,2,4,5,1,2,4,4 klasa 1a (wykres kolumnowy) klasa 1b (wykres kolumnowy)

  15. Wyniki klasówki klasy 1a i 1b(połączony wykres kolumnowy)

  16. Co to jest średnia?

  17. Średnia arytmetyczna n liczb a1,a2,...,an jest to ich suma podzielona przez n.

  18. Na pewno spotkaliśmy się ze średnią arytmetyczną w wielu sytuacjach: liczymy średnią pensję, średnią ocen itd. Jednak często okazuje się, że otrzymana liczba nie zawsze mówi nam „jak jest średnio”.

  19. Jako uczeń pewnie wielokrotnie zastanawiałeś się „Czy liczenie średniej ocen ma sens?”. Przeanalizujmy teraz tabelę przedstawiającą wyniki sprawdzianu w czterech równoległych dwudziestoosobowych klasach.

  20. W każdej klasie średnia ocen wynosi 3,0. Czy można na tej podstawie powiedzieć, że są to „klasy trójkowe”?

  21. Na pewno jest to słuszne stwierdzenie w wypadku 2a. Tutaj najwięcej jest trójek, po równo ocen wyższych i niższych. To właśnie dla takich przypadków pojęcie średniej arytmetycznej zostało stworzone.

  22. Ale już w 2b średnia niczego nie mówio klasie. Nikt tutaj nie dostał trójki! Zdecydowanie nie jest to klasa trójkowa, dużo jest dobrych uczniów (połowa ma co najmniej czwórkę), ale i dużo osób wcale sobie nie radzi. Można przypuszczać, że nauczyciel narzucił tu wysoki poziom i uczniowie zdolni mają dobre warunki rozwoju, ale za to słabsi odpadają.

  23. Klasa 2c jest wyraźnie najsłabsza. Jest wprawdzie kilku zdolnych uczniów, ale połowa nie dostała nawet trójki

  24. Natomiast 2d jest zdecydowanie dobra. Wprawdzie nie ma tam geniuszy, ale połowa ma czwórki, a tylko trzy osoby dostały jedynki.

  25. A w każdej klasie średnia jest taka sama !!! Czy należy zatem zrezygnować z liczenia średniej ocen? Nie zawsze, trzeba jednak pamiętać, że nie w każdym przypadku dobrze opisuje ona rzeczywistość !!! W starym dowcipie pewien statystyk utonął w jeziorze o średniej głębokości pół metra!

  26. Dominanta i mediana

  27. Pojęcie dominanty wyjaśnimy przy pomocy krótkiej historyjki: Właściciel firmy krawieckiej chce się dowiedzieć z iloma kieszeniami ma szyć spodnie, by cieszyły się jak największą popularnością. W tym celu spytał pewną liczbę ludzi, ile kieszeni powinny mieć ich wymarzone spodnie.

  28. Uzyskane od jedenastu osób odpowiedzi uporządkował według wielkości: 0,1,1,2,2,2,4,4,4,4,8. Czy średnia (2,9 kieszeni) jest wartością, którą powinien się kierować właściciel firmy? Raczej wątpliwe. Trudno uszyć spodnie z 2,9 kieszeniami, a jeśli zdecyduje się na 3, to może się zdarzyć, że nie znajdzie na nie nabywcy! Przecież nikt z pytanych nie marzył o 3 kieszeniach.

  29. Krawiec zrobiłby najrozsądniej, wybierając najczęściej spotykaną wśród odpowiedzi liczbę kieszeni. Przyjrzyjmy się jeszcze raz odpowiedziom uczestników sondy: 0,1,1,2,2,2,4,4,4,4,8. Najpopularniejszą liczbą kieszeni jest 4. Ta wielkość, która występuje wśród danych największą liczbę razy nazywa się „modą” albo „dominantą”.

  30. Może się zdarzyć, że na liście danych znajdzie się nie jedna, a kilka danych o takich samych, największych częstościach występowania.Wtedy każdą z nich nazywa się dominantą( modą). Zestaw danych może mieć zatem kilka dominant.

  31. Inną sytuacją, w której średnia zamiast informować – dezinformuje i irytuje są raporty o średnich zarobkach. Łatwo obliczyć średnią płacę w małej firmie zatrudniającej cztery osoby: trzech pracowników zarabiających po 1000 złotych i szefa zarabiającego 5000 złotych miesięcznie. Wynosi ona 2000 złotych chociaż 75% zatrudnionych otrzymuje zaledwie połowę tej sumy. W tym przypadku informację o średniej należy uzupełnić wartością mody równej 1000 złotych.

  32. W takich sytuacjach wielkością niosącą ważną informację jest mediana. „Mediana” znaczy po łacinie „środkowa” i rzeczywiście jest to środkowa wartość na liście danych uporządkowanych według wielkości. Jeśli liczba danych jest parzysta, to medianą jest średnia z dwóch danych najbliższych środka. Można stwierdzić, że 50% danych jest nie większe niż mediana.

  33. n – nieparzysta liczba danych 0,1,1,2,2,2,4,4,4,4,8 mediana Medianą jest środkowa, a więc wielkość o numerze (n+1)/2 na uporządkowanej liście danych.

  34. n – parzysta liczba danych 1,1,2,2,2,4,4,4,4,8 Mediana=(2+4):2=3 „środkowe” wartości Mediana jest średnią arytmetyczną, wielkości o numerach n/2 i n/2+1 na uporządkowanej liście danych.

  35. Przyjrzyjmy się jeszcze raz liście płac firmy „Kowalski i spółka”: 500, 500, 600, 800, 800, 900, 1000, 1000, 1000, 1100, 1500, 1600, 5000, 5000, 5000,5000, 5000, 8000, 10000 (złotych). Jest ona uporządkowanym zestawem 19 liczb, zatem środkową jest dziesiąta wartość. Wynika stąd, że medianą jest 1100 złotych, a więc 50% pracowników firmy nie zarabia więcej niż 1100 złotych.

  36. Warto zwrócić uwagę, jak bardzo różne wartości mają średnia, moda i mediana dla tej listy płac i jak niedoskonały obraz rzeczywistej sytuacji daje znajomość tylko jednej z tych wielkości.

  37. Nie dajmy się oszukać!

  38. A teraz kilka przykładów pokazujących jak łatwo można nabrać się na umiejętnie spreparowane wykresy.

  39. Kilka osób z rady nadzorczej firmy „ABC” uznało, że należy zmienić zarząd. Na posiedzeniu przedstawili dotychczasowe wyniki produkcji za pomocą wykresu, twierdząc, że w „ABC” od lat panuje stagnacja. W tym momencie wtrącił się prezes. Twierdził, że jest wręcz przeciwnie – w „ABC” widać dynamiczny wzrost produkcji. I przedstawił inny wykres prezentujący te same dane.

  40. Produkcja prawie nie rośnie (wykres rady) Produkcja wspaniale rośnie (wykres prezesa)

  41. Różnie dobrane skale na osi pionowej dały dwie różne prezentacje tych samych informacji!

  42. To nie koniec problemów w „ABC”. Związki zawodowe twierdzą, że płace pracowników ostatnio spadły. Zarząd uważa, że pracownicy nie powinni narzekać, bo od lat płace rosną.

  43. Płace stale rosną (wykres zarządu) Płace ostatnio spadły (wykres związkowców)

  44. Związki korzystały z tych samych danych o płacach co zarząd. Dlaczego te wykresy tak różnią się od siebie?

  45. Ostatnio bardzo modne stało się przedstawianie danych nie w formie diagramów, a rozmaitych obrazków. Ulegamy wtedy pewnemu złudzeniu.

  46. Dochody firmy „M&M” 400 tys. 200 tys. 1999 r. 2000 r.

  47. Liczby zamieszczone przy obrazkach mówią, że dochód w 2000 r. był dwa razy większy niż w roku poprzednim. Patrząc na ten rysunek odnosimy jednak wrażenie, że dochody w roku 2000 są znacznie większe niż dwa razy większe od dochodów z roku poprzedniego. Banknot reprezentujący rok 2000 jest co prawda dwa razy wyższy od banknotu reprezentującego rok 1999, ale ma od niego cztery razy większe pole. A wielkość obrazka nieświadomie oceniamy według pola, a nie wysokości!

  48. Graficzne przedstawianie danych ma ułatwiać ich odczytywanie. Po tych przykładach widać, że nie zawsze tak jest. Sam sposób przedstawienia niesie dodatkowe informacje, które mogą utrudnić odczytanie właściwych danych statystycznych.

More Related