570 likes | 829 Views
ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH. Dr inż. Agnieszka Strzelczak Zakład Inżynierii Procesowej i Maszynoznawstwa E-mail: Agnieszka-Strzelczak@zut.edu.pl Tel: +48 91 449 65 36 Pokój: 308 PP Konsultacje: środa 11.30 – 13.30.
E N D
Dr inż. Agnieszka Strzelczak Zakład Inżynierii Procesowej i Maszynoznawstwa E-mail: Agnieszka-Strzelczak@zut.edu.pl Tel: +48 91 449 65 36 Pokój: 308 PP Konsultacje: środa 11.30 – 13.30
Statystyka jest tylko narzędziem pozwalającym sprawdzić nasze pomysły badawcze Analiza wyników badań opopiera się na statystyce
"Istnieją trzy rodzaje kłamstwa: przepowiadanie pogody, statystyka i komunikat dyplomatyczny.” Jean Rigaux
"Statystyka to matematyczny kamuflaż błędu.” Georges Elgozy
„Jeśli mój sąsiad codziennie bije swoją żonę, ja zaś nie biję jej nigdy, to w świetle statystyki obaj bijemy je co drugi dzień.” George Bernard Shaw
„Statystyka jest jak kostium bikini: pokazuje wiele, ale nie pokazuje najważniejszego.” Aaron Levenstein
„Istnieją trzy rodzaje kłamstw: kłamstwa, okropne kłamstwa, statystyki.” Benjamin Disraeli
Po co więc ta „cała” statystyka? Człowiek otoczony jest różnymi zjawiskami i próbuje je poznać, dowiedzieć się w jaki sposób funkcjonują, jakie relacje między nimi zachodzą. Aby coś powiedzieć o jakimś zjawisku należy je najpierw zbadać! Statystyka:obejmuje metody pozyskiwania, prezentacji i analizy danych Użycie statystyki do badania zjawisk sprawia, że badanie jest oparte na sprawdzonych i dopracowanych metodach
Podstawowe pojęcia Pojęcie statystyki Statystyka jest dyscypliną naukową, zajmującą się „konstrukcją metod liczbowego opisu i wnioskowania o zjawiskach masowych”. Z takiej definicji wynika, że należy wyróżnić tutaj dwa pojęcia: metodę i zjawisko masowe.
Podstawowe pojęcia Metoda statystyczna Jest to sposób badania liczbowego określonych zbiorowości, za pomocą odpowiednich narzędzi i procedur.
Podstawowe pojęcia Zjawisko masowe Zjawisko które często występuje, dotyczy ono więc wystarczająco dużej liczby jednostek. Dla odróżnienia, jednostkowym zjawiskiem jest pojedyncze, lub rzadko występujące zdarzenia. Niektóre zjawiska mogą być traktowane jednostkowo jak i masowo, w zależności od perspektywy z jakiej je analizujemy. Przykład:Przyjęcie do przedsiębiorstwa dla nowego pracownika jest zjawiskiem jednostkowym, natomiast dla działu kadr takie zdarzenie będzie jednym z wielu podobnych, a więc będzie traktowane jako zjawisko masowe.
Podstawowe pojęcia Zjawisko masowe cd. Dane zjawisko można zaliczyć do masowych, wówczas gdy miała miejsce duża liczba przypadków jego występowania, co umożliwia zaobserwowanie pewnych prawidłowości statystycznych. Obserwacja pojedynczej jednostki lub niewielkiego zespołu nie prowadzi do wykrycia prawidłowości zjawiska.
Podstawowe pojęcia Zbiorowość statystyczna (populacja) Zespół jednostek objętych badaniem statystycznym (np. istot żywych, przedmiotów, przedsiębiorstw, obszarów geograficznych, zjawisk), które mają chociaż jedną wspólną cechę, a różnią się z innych punktów widzenia.
Podstawowe pojęcia Zbiorowość statystyczna (populacja) cd. Przykład zbiorowości stat.:studenci określonego województwa, mają dwie cechy wspólne: mieszkają w tym samym województwie i studiują, różnią się między sobą rodzajem uczelni do jakich uczęszczają, ocenami, cechami osobowości, wyglądem, płcią itd. Zbiorowością stat. nie sąnp. krzesła w auli wykładowej o takim samym kształcie, kolorze, stopniu zużycia.
Podstawowe pojęcia Próba statystyczna z populacji (zbiorowość) Zbiór obserwacji statystycznych wybranych (zwykle wylosowanych) z populacji.
Podstawowe pojęcia Jednostka statystyczna Elementy składowe zbiorowości (próby) nazywane są jednostkami statystycznymi (jednostki badania, obserwacji).
Podstawowe pojęcia Liczebność zbiorowości (próby) Suma jednostek statystycznych ujmowana jest jako liczebność zbiorowości (oznaczana jest symbolem N)
Podstawowe pojęcia Cechy statystyczne Jednostka statystyczna w ramach zbiorowości statystycznej, charakteryzuje się wieloma właściwościami, czyli cechami statystycznymi. Cechy stałe (wspólne dla wszystkich jednostek danej zbiorowości): Nie podlegają analizie statystycznej Cechy zmienne (różnicujące jednostki między sobą: Podlegają analizie statystycznej
PROCES BADAWCZY 1) Wymyślamy pytanie badawcze - np. „Czy liczebności ryb w 2 zbiornikach istotnie się różnią?” NO3, PO4 .... 2) Znajdujemy lub tworzymy zmienne, które mierzą odpowiednie zjawiska
PROCES BADAWCZY 3) Sprawdzamy statystyki opisowe - oglądamy dane rysunki, wykresy, średnie 4) Sprawdzamy hipotezy testem statystycznym ważny jest poziom istotności (p) <
PROCES BADAWCZY 5) Sprawdzamy czy dane pasują do modelu statystycznego założenia dotyczące testów statystycznych 6) Rozważamy wyjaśnienia alternatywne - szukamy innych teorii (jeśli znajdziemy to powinniśmy powtórzyć od początku)
TERMINOLOGIA Przypadki i zmienne: Przypadki są odpowiednikami rekordów w bazach danych lub wierszy w arkuszach kalkulacyjnych. Zmienne są zaś odpowiednikami pól lub kolumn. Każdy przypadek jest zbiorem wartości zmiennych.
TERMINOLOGIA PRZYPADEK ZMIENNA
ETAPY ANALIZY STATYSTYCZNEJ WYNIKI POPULACJA PRÓBKA OBLICZENIA POMIARY ANALIZA
ETAPY ANALIZY STATYSTYCZNEJ WYNIKI POPULACJA PRÓBKA OBLICZENIA POMIARY ANALIZA
PRÓBKA • WYBÓR PRÓBKI: • Próbka wybrana do badania musi być odpowiednia • Wybór próbki jest kluczowy etapem z punktu widzenia wiarygodności końcowych wyników • DOBRZE POBRANA PRÓBKA JEST REPREZENTATYWNA!!!
REPREZENTATYWNOŚĆ PRÓBKI Próbka reprezentatywna: w dobry sposób odzwierciedla populację, z której została pobrana Dla zapewnienia reprezentatywności konieczna jest odpowiednia liczebność próbki. Im większa próbka, tym bardziej wiarygodne wyniki. Uwaga! Liczności nie można zwiększać w nieskończoność (koszty analiz!). Należy szukać optimum pomiędzy kosztami a wiarygodnością wyników.
Liczebność próby Przeprowadzając badania z populacji generalnej pobieramy próbę: n 100 próba b. duża n 30 próba duża 10 n < 30 próba mała n < 10 próba b. mała
RODZAJE DANYCH • Dana: każda informacja opisująca badane zjawisko/obiekt • Typy danych: • dane kategorialne (uzyskiwane przy ocenie metodą alternatywną) • dane liczbowe (pochodzące z pomiarów)
RODZAJE DANYCH • Typy danych: dane kategorialne Uzyskuje się je w przypadkach: • dzielenia (klasyfikowania) przedmiotów na kategorie • zliczania liczby przedmiotów w danych kategoriach • zliczania proporcji przedmiotów • zliczania liczby braków/obecności
RODZAJE DANYCH Typy danych: dane kategorialne Są one często wykorzystywane w praktyce, bo do ich zebrania zazwyczaj nie potrzeba skomplikowanych i dokładnych urządzeń pomiarowych. Przykład: klasyfikacja czystości wody, stwierdzanie braku/obecności danego gatunku ryby w jeziorze
RODZAJE DANYCH Typy danych: dane kategorialne Zwykle stosuje się 2 kategorie: brak i obecność. Można jednak stosować więcej kategorii, które odzwierciedlać będą jakość. Przykład: klasy czystości wód I, II, III. Klasa I- najwyższej jakości, klasa III- najgorszej.
RODZAJE DANYCH • Typy danych: dane kategorialne Zalety: • prostota czytelność otrzymanych wyników Wady: • nieprecyzyjność
RODZAJE DANYCH • Typy danych: dane liczbowe Uzyskuje się je w przypadkach: • pomiarów cechy obiektu badań • przeliczania numerycznych wartości z dwóch lub więcej pomiarów liczbowych Wymóg: korzystanie z urządzeń pomiarowych
PREZENTOWANIE DANYCH Najprostszy sposób: spisywanie w rzędzie np.: 5,6,9,11,6,7,7,6,5,9,7,8,7,6,7,8,4,8,7,8,10,10,9,7,8,... Ten zapis jest nieczytelny i mało użyteczny
PREZENTOWANIE DANYCH • Użyteczne metody prezentacji danych: • tabela częstości wystąpień (liczności) • histogram • wykres punktowy
PREZENTOWANIE DANYCH Tabela częstości wystąpień
PREZENTOWANIE DANYCH Tabela częstości wystąpień • Z tabeli takiej można łatwo odczytać: • ile pomiarów o danej wartości zarejestrowano • która wartość powtarzała się najczęściej • w jakim zakresie pojawiają się dane (minimum i maksimum)
PREZENTOWANIE DANYCH Histogram • Jest pewnym rozwinięciem tabeli liczności. • Szczególnie przydatny do prezentowania dużej ilości danych liczbowych i kategorialnych.
PREZENTOWANIE DANYCH Histogram
PREZENTOWANIE DANYCH Histogram • Procedura rysowania histogramu: • Posortowanie danych w porządku od najmniejszej do największej: nasze dane są już tak ustawione • Wyznaczenie wartości najmniejszej i największej: w naszym zbiorze wartość najmniejsze xmin=31,820, wartość największa xmax=38,520
PREZENTOWANIE DANYCH Histogram Procedura rysowania histogramu: 3. Obliczenie szerokości zakresu, w jakim pojawiają się dane (rozstępu): R=xmax-xmin=38,520-31,820=6,7 4. Wyznaczenie liczby przedziałów: ilość przedziałów= pierwiastek(ilość pomiarów) =pierwiastek(65)=8,068 UWAGA! Zasady tej nie stosujemy przy dużej liczbie pomiarów (>100). Zasadniczo liczba przedziałów powinna się mieścić w przedziale <6,12>
PREZENTOWANIE DANYCH Histogram Procedura rysowania histogramu: 5. Ustalenie szerokości przedziałów: szerokość przedziału=rozstęp/l-ba przedziałów =6,7/8=0,831 Otrzymaną wartość zaokrąglamy w taki sposób, aby narysowany histogram był jak najbardziej czytelny (tutaj do wartości 1)
PREZENTOWANIE DANYCH Histogram Procedura rysowania histogramu: 6. Rozpisanie przedziałów i obliczenie, ile w każdym z nich znajduje się wyników:
PREZENTOWANIE DANYCH Histogram Procedura rysowania histogramu: 6. Narysowanie wykresu: w zależności od liczby wyników w poszczególnych przedziałach, rysuje się odpowiednią wysokość słupka.
PODSTAWY – DANE I ICH PREZENTACJA PREZENTOWANIE DANYCH Histogram
Typy rozkładów (histogramów) Amodalny = skrajnie asymetryczny