500 likes | 738 Views
Statystyka w doświadczalnictwie. Wydział Technologii Drewna SGGW Studia II stopnia Wykład 1. Treści i efekty kształcenia. Treści: Statystyka matematyczna, planowanie eksperymentu
E N D
Statystyka w doświadczalnictwie Wydział Technologii Drewna SGGW Studia II stopnia Wykład 1
Treści i efekty kształcenia • Treści: Statystyka matematyczna, planowanie eksperymentu • Efekty: umiejętności i kompetencje matematycznego opisu zjawisk, formułowania modeli matematycznych i ich wykorzystania
Statystyka w doświadczalnictwie • Wykłady (10 spotkań w środy, 8:15) • dr hab. Michał Zasada • Ćwiczenia (10 spotkań po 2 godz.) • dr Robert Tomusiak, dr Rafał Wojtan
Statystyka w doświadczalnictwie • Cel zajęć: • Dostarczenie praktycznej umiejętności wyboru odpowiednich metod, planowania eksperymentów badawczych oraz wykorzystywania metod statystycznych, szczególnie w kontekście pisania pracy magisterskiej z zakresu technologii drewna • Nabycie umiejętności posługiwania się oprogramowaniem statystycznym
Wykłady • Statystyka opisowa i prezentacja danych • Estymacja statystyczna i zagadnienia pokrewne • Metoda reprezentacyjna, pobieranie próby • Planowanie eksperymentów • Regresja • Analiza wariancji • Metody nieparametryczne • Zagadnienia uzupełniające
Ćwiczenia • Zastosowanie pakietu statystycznego „Statistica” do przetwarzania danych • Statystyka opisowa i prezentacja danych • Regresja liniowa, wielokrotna i nieliniowa • Analiza wariancji (jednoczynnikowa i wieloczynnikowa) • Metody nieparametryczne • Zagadnienia bardziej zaawansowane
Doświadczalnictwo leśne • Materiały do zajęć (zakres / konspekt poszczególnych zajęć, pliki z danymi, zagadnienia do opracowania na zaliczenie przedmiotu - wkrótce na serwerze: • http://wl.sggw.waw.pl/units/produkcyjnosc/dydaktyka/Statystyka/WTD • Kontakt (pytania, sugestie, problemy): Michal.Zasada@wl.sggw.pl
Podstawowe pojęcia • Badanie statystyczne • Populacja, jednostka, cecha • Rodzaje zmiennych / cech • Skale pomiarowe • Graficzna prezentacja danych • Miary położenia • Miary zmienności
Badanie statystyczne • Eksperymenty planowane / zakładane • Oparte na próbie pobieranej z populacji • Podstawą zastosowania każdej metody wnioskowania statystycznego jest dokładne zdefiniowanie populacji, jednostki i cech
Populacja statystyczna • Obiekt badania • Zbiór elementów / jednostek (obiektów materialnych lub zjawisk) powiązanych ze sobą logicznie (tzn. posiadających wspólną cechę/cechy stałą/stałe) i jednocześnie nieidentycznych (tzn. różniących się ze względu na cechy zmienne) • Populacja skończona i nieskończona
Jednostka statystyczna • Element populacji • Źródło cech
Cecha • Badana własnośćelementów populacji statystycznej, która różnicuje tę populację • Cechy mierzalne (ilościowe): możliwe do opisania za pomocą liczb • ciągłe: przyjmujące dowolne wartości w danym przedziale • skokowe: przyjmująca określonewartości w danym przedziale, • Cechy niemierzalne (jakościowe): można je jedynie opisać słownie lub za pomocą odpowiednich skal
Rodzaje cech • ilościowe • jakościowe Skale pomiarowe • Uzależnione są od rodzaju opisywanych zmiennych • Determinują, co można zrobić z daną zmienną
Skale pomiarowe • Zmienne jakościowe • Skala nominalna • Skala porządkowa (rangowa) • Zmienne ilościowe • Skala przedziałowe (interwałowa) • Skala ilorazowa (stosunkowa)
Skala nominalna • Pozwala rozpoznawać obiekty jednakowe i różne, bez wypowiadania się o relacjach między nimi, np. gatunek, rodzaj drewna, rodzaj zakładu pracy, płeć, itp. • Często pomiar na skali nominalnej jest liczbowym etykietowaniem badanych obiektów, np. kody w niektórych bazach danych • Bardzo słaba skala pomiarowa • Graficzna prezentacja, dominanta
Skala porządkowa • Dodatkowo wprowadza relację porządku w zbiorze zmiennych jakościowych, np. drewno suche, wilgotne; uszkodzenie słabe, średnie, silne; ... • Jest skalą mocniejszą niż nominalna • Powoduje najwięcej problemów i nieporozumień, przedmiot powszechnie popełnianych błędów
Skala porządkowa • Przykład: skala ocen (ndst, dst, db, bdb) • Wszelkiego rodzaju obliczenia są tutaj nadużyciem: nieznana jest odległość między poszczególnymi ocenami (różnica w między różnymi stopniami jest różna; często mieszane kategorie) • Możliwe jest jedynie określenie, że np. silny stopień uszkodzenia jest mocniejszy, niż słaby
Skala przedziałowa • Zachowuje własności skali porządkowej, ale dodatkowo wyposażona jest w stałą jednostkę miary i umowne zero • Możliwy jest pomiar odległości między uporządkowanymi zmiennymi • Jest skalą mocniejszą od porządkowej
Skala przedziałowa • Przykład: skala Celsjusza dla temperatury • Możliwe jest określenie o ile stopni dana temperatura różni się od innej • Ale nie można opisać sensownie stosunku dwóch wartości zmiennych • Np. średnia temperatura lipca w centralnej Polsce (17C) różni się od średniej rocznej temperatury tego obszaru (7C) o 10 stopni, ale nie oznacza to, że w lipcu jest prawie 2,5 raza cieplej, niż średnio w roku
Skala ilorazowa • różni się od skali przedziałowej tym, że jest posiada zero absolutne, a nie umowne • Możliwe jest określenie ile razy dana cecha jest większa od innej • Jest to najsilniejsza skala pomiarowa
Skala ilorazowa • Przykład: skala Kelwina • Gleba o temperaturze 50C(323K) jest 1.1 raza (czyli o 10%) cieplejsza od gleby o temperaturze 20C (293K) • Przykład: liczba kandydatów na studia • Na WTD (100) było 5 razy mniej kandydatów na studia, niż na WL (500) – zerem absolutnym jest tu brak kandydatów na dany kierunek studiów
Graficzna prezentacja danych • Ważny element wstępnej analizy danych • Nieodzowna ilustracja problemu i uzyskanych wyników • Dobór skali i szerokości klas • Wybór sposobu prezentowania danych
Statystyka w doświadczalnictwie Wydział Technologii Drewna SGGW Studia II stopnia Wykład 2
Miary położenia • średnia arytmetyczna i mediana
Miary położenia • Miąższości [m3]: 0.45, 0.39, 0.35, 0.51, 0.41, 0.38, 0.42, 0.4, 0.3, 0.6 • Średnia miąższość [m3]: 0.421
Miary położenia • Miąższości [m3]: 0.45, 0.39, 0.35, 0.51, 0.41, 0.38, 0.42, 0.4, 0.3, 7.1 • Średnia miąższość [m3]: 1.07 • Mediana [m3]: 0.3, 0.35, 0.38, 0.39, 0.4, 0.41, 0.42, 0.45, 0.51, 7.1
Miary położenia • Zależności miar statystycznych w zależności od rodzaju rozkładu: • http://onlinestatbook.com/stat_sim/descriptive/index.html
Miary zmienności • odchylenie standardowe i współczynnik zmienności
Miary zmienności • Pomierzono wysokości w dwóch drzewostanach jodłowych na pogórzu • Uzyskano następujące wyniki:
Miary zmienności • Średnia wysokość d-stanu 1: 40m • Odchylenie standardowe 1: 3m • Średnia wysokość d-stanu 2: 10m • Odchylenie standardowe 2: 3m
Miary zmienności • Średnia wysokość d-stanu 1: 40m • Odchylenie standardowe 1: 3m • Średnia wysokość d-stanu 2: 10m • Odchylenie standardowe 2: 3m • Współczynniki zmienności: 7.5% i 30%
Na zakończenie... • Analiza formy Adama Małysza • 1 turniej: 102 m, 97 m, 116 m, 98 m, 86 m • 2 turniej: 106 m, 110 m, 114 m, 127 m, 120 m • 3 turniej: 108 m, 84 m, 111 m, 82 m, 76 m • Jakie wnioski? Na podstawie: K. Stróżyński „Jej Wysokość Niekompetencja” Matematyka (dwumiesięcznik PTM, online)
Na zakończenie... • Średnie: 99.8, 115.4, 92.2 (102,5) • SD: 10.8, 8.3, 16.1 (15.1) • Porównanie średniej ze wszystkich skoków oraz poszczególnych średnich szczegółowych: zwyżka lub obniżenie formy zawodnika • Odchylenie standardowe dla poszczególnych turniejów: czy rozrzut wyników rośnie czy maleje w miarę kolejnych zawodów (czy forma się stabilizuje)
Na zakończenie... • Zestawienie średnich wyników z odchyleniami standardowymi: czy najlepsze średnie wyniki pochodzą z zawodów, gdzie skoczek ma nierówną formę (wyższe odchylenie standardowe), czy z zawodów charakteryzujących się stabilną formą (niższe odchylenie) • Czy po okresie szczytu formy następuje stabilizacja wyników (nawet gdy średnia spada), czy też rozchwianie kondycji zawodnika (wzrost odchylenia standardowego)? Może to świadczyć o braku odporności psychicznej czy nieumiejętności znoszenia porażek