Statystyka w doświadczalnictwie

Statystyka w doświadczalnictwie Wydział Technologii Drewna SGGW Studia II stopnia

Wykład 5 • Rozkłady statystyczne • Rozkłady empiryczne • Po co rozkłady? • Typy zmiennych • Przykładowe rozkłady • Rozkład normalny • Rozkład dwumianowy

Rozkłady empiryczne • Graficzna reprezentacja danych w formie rozkłady liczebnosci, wieloboku liczebności, histogramu, itp.

Graficzna prezentacja danych

Po co rozkłady? • Niekiedy konieczne jest założenie, że badana cecha posiada określony rozkład • np. możemy założyć, że rozkład cechy „gęstość drewna” jest zgodny z rozkładem normalnym i wykorzystać później tę informację do estymacji, testowania hipotez lub modelowania

Po co rozkłady? • Stwierdzenie zgodności cechy z danym rozkładem pozwala na zrozumienie zależności istniejących w zbiorze danych • W takiej sytuacji zwykle buduje się rozkład teoretyczny na bazie danych pomiarowych i porównuje otrzymane rozkłady

Po co rozkłady? • Do dopasowania rozkładów stosuje się zwykle metodę momentów lub metodę największej wiarygodności • Rozkłady teoretyczne są podstawą wielu metod statystycznych (estymacji, testów, ...), stąd konieczne jest sprawdzenie, czy dane mają rozkład zgodny np. z rozkładem normalnym

Typy zmiennych • Jakościowe (określające przynależność do określonej grupy lub kategorii, np. płeć, kolor, gatunek drewna, ...0 • Ilościowe (możliwe do pomierzenia z wykorzystaniem skali pomiarowych, dla których możliwe jest dodawania czy uśrednianie, np. miąższość kłody, gęstość drewna, ...)

Zmienna a typ rozkładu • Jeżeli zmienna ma postać skończonego zbioru - jest to zmienna skokowa (np. wiek, klasa grubości, ...) możliwa do opisania rozkładem prawdopodobieństwa

Zmienna a typ rozkładu • Jeżeli zmienna może przyjąć dowolna wartość (lub dowolną wartość z określonego przedziału) - mówimy o zmiennej ciągłej (np. długość, grubość, ...) możliwej do opisania gęstością prawdopodobieństwa

Zmienna a typ rozkładu • W wielu przypadkach (z powodu technicznych ograniczeń pomiarów lub z powodów praktycznych) zmienne ciągłe traktowane są ja dyskretne (np. kiedy grubość mierzona jest z zaokrągleniem do 1mm czy długość do 1cm)

Przykładowe rozkłady • Rozkład Beta używany jest do modelowania rozkładów wielkości uporządkowanych, mających naturalny limit dolny i górny • Rozkład dwumianowy używany jest do opisu takich zjawisk, jak np. liczba K/M czy liczba elementów wadliwych w próbie złożonej z n elementów pobranych z populacji

Przykładowe rozkłady • Rozkład chi-kwadrat używany jest do modelowania zmiennych reprezentujących częstości • Rozkład wykładniczy używany jest często do modelowania czasu między zdarzeniami • Rozkład Poisson’a używany jest do modelowania zjawisk rzadkich

Przykładowe rozkłady • Rozkład normalny jest najczęściej stosowany w estymacji statystycznej • Rozkład Weibull’a stosuje się często do modelowania czasu, który mija do momentu wystąpienia awarii • ...

Rozkład normalny • Najczęściej stosowany rozkład w statystyce • Podstawa wielu metod statystycznych: estymacji, testów, regresji, korelacji, analizy wariancji, ...

Rozkład normalny • Opisuje zmienne, które mogą przybierać postać nieskończonej liczby niezależnych zdarzeń losowych • Przykład rozkładu zmiennej ciągłej • Jego funkcję gęstości prawdopodobieństwa można opisać następująco:

Rozkład normalny • gdzie: • x - zmienna • µ - średnia arytmetyczna • σ - odchylenie standardowe

Rozkład normalny

Własności (r-d normalny) • Wartość funkcji gęstości rośnie dla x<µ i maleje dla x>µ • Funkcja gęstości ma maksimum w punkcie x = µ • Wartość oczekiwana zmiennej X wynosi E(X)=µ • Wariancja zmiennej X równa jest D2X = σ2

Własności (r-d normalny) • dla x = µ funkcja gęstości ma wartość • rozkład ma 2 punkty przegięcia dla x=µ - σ i x = µ + σ • rozkład normalny jest symetryczny, a oś symetrii zdefiniowana jest jako x = µ

Własności (r-d normalny) • Im wariancja / odchylenie standardowe jest mniejsze, tym funkcja gęstości jest węższa • funkcja prawdopodobieństwa jest całką z funkcji gęstości prawdopodobieństwa

Własności (r-d normalny)

Standaryzowany r.n. • Każdy rozkład normalny może być znormalizowany, tj. doprowadzony do postaci rozkładu o średniej 0 i odchyleniu standardowym 1: N(0,1). • Wartość oczekiwana standaryzowanego r-du normalnego równa jest zero (EZ = 0) a odchylenie standardowe równe jest 1 (D2Z = 1).

Standaryzowany r.n. • Standaryzacja to zamiana zmiennej x na z, gdzie: • Funkcja gęstości prawdopodobieństwa tej funkcji:

Standaryzowany r.n.

Własności (r-d normalny) • Pomiędzy µ - σ i µ + σ znajduje się około 68% wszystkich wartości zmiennej • W przedziale od μ - 2*σ do μ + 2*σ jest około 95% wszystkich wartości zmiennej • W przedziale od μ - 3*σ do μ + 3*σ mamy około 99,7% wszystkich obserwacji

Rozkład skumulowany

Rozkład dwumianowy • Przykład funkcji rozkładu prawdopodobieństwa • Opisuje prawdopodobieństwo uzyskania k sukcesów w n niezależnych próbach, gdzie prawdopodobieństwo sukcesu w jednej próbie wynosi p

Rozkład dwumianowy

Własności (r-d dwum.) • Wykres funkcji rozkładu jest symetryczny dla p = 0.5 • dla p < 0.5 rozkład jest skośny dodatnio • dla p > 0.5 rozkład jest skośny ujemnie

Własności (r-d dwum.) • Wartość oczekiwana E(X) = n * p • Wariancja D2X = n p q • Odchylenie standardowe

Dziekuje za uwagę!

Statystyka w doświadczalnictwie

Statystyka w doświadczalnictwie

Presentation Transcript

Czesław Domański POLSKA STATYSTYKA W STATYSTYCE ŚWIATOWEJ

Wiesław Łagodziński, Główny Urząd Statystyczny Krzysztof Jakóbik, Urząd Statystyczny w Krakowie STATYSTYKA ZDROWIA

Statystyka

Statystyka - to nie boli

Statystyka opisowa

Jan Paradysz, Statystyka

Statystyka – zadania, część 2

Statystyka matematyczna i stosowana

Statystyka

Projekt „STATYSTYKA W SZKOLE”

Statystyka – zadania 4

Statystyka w doświadczalnictwie

Statystyka w d oświadczalnictw i e

STATYSTYKA TURYSTYKI

„Ekonomia społeczna – pojęcie, statystyka, zakres oddziaływania”

Statystyka w analizie rynku i wycenie nieruchomości (cz.1)

STATYSTYKA

Statystyka społeczna - edukacja

W drodze do Rzymu…

Rachunek P-stwa i Statystyka

W DRODZE DO

W ycieczka do Helsinek