390 likes | 646 Views
Statystyka w doświadczalnictwie. Wydział Technologii Drewna SGGW Studia II stopnia. Wykład 5. Rozkłady statystyczne Rozkłady empiryczne Po co rozkłady? Typy zmiennych Przykładowe rozkłady Rozkład normalny Rozkład dwumianowy. Rozkłady empiryczne.
E N D
Statystyka w doświadczalnictwie Wydział Technologii Drewna SGGW Studia II stopnia
Wykład 5 • Rozkłady statystyczne • Rozkłady empiryczne • Po co rozkłady? • Typy zmiennych • Przykładowe rozkłady • Rozkład normalny • Rozkład dwumianowy
Rozkłady empiryczne • Graficzna reprezentacja danych w formie rozkłady liczebnosci, wieloboku liczebności, histogramu, itp.
Po co rozkłady? • Niekiedy konieczne jest założenie, że badana cecha posiada określony rozkład • np. możemy założyć, że rozkład cechy „gęstość drewna” jest zgodny z rozkładem normalnym i wykorzystać później tę informację do estymacji, testowania hipotez lub modelowania
Po co rozkłady? • Stwierdzenie zgodności cechy z danym rozkładem pozwala na zrozumienie zależności istniejących w zbiorze danych • W takiej sytuacji zwykle buduje się rozkład teoretyczny na bazie danych pomiarowych i porównuje otrzymane rozkłady
Po co rozkłady? • Do dopasowania rozkładów stosuje się zwykle metodę momentów lub metodę największej wiarygodności • Rozkłady teoretyczne są podstawą wielu metod statystycznych (estymacji, testów, ...), stąd konieczne jest sprawdzenie, czy dane mają rozkład zgodny np. z rozkładem normalnym
Typy zmiennych • Jakościowe (określające przynależność do określonej grupy lub kategorii, np. płeć, kolor, gatunek drewna, ...0 • Ilościowe (możliwe do pomierzenia z wykorzystaniem skali pomiarowych, dla których możliwe jest dodawania czy uśrednianie, np. miąższość kłody, gęstość drewna, ...)
Zmienna a typ rozkładu • Jeżeli zmienna ma postać skończonego zbioru - jest to zmienna skokowa (np. wiek, klasa grubości, ...) możliwa do opisania rozkładem prawdopodobieństwa
Zmienna a typ rozkładu • Jeżeli zmienna może przyjąć dowolna wartość (lub dowolną wartość z określonego przedziału) - mówimy o zmiennej ciągłej (np. długość, grubość, ...) możliwej do opisania gęstością prawdopodobieństwa
Zmienna a typ rozkładu • W wielu przypadkach (z powodu technicznych ograniczeń pomiarów lub z powodów praktycznych) zmienne ciągłe traktowane są ja dyskretne (np. kiedy grubość mierzona jest z zaokrągleniem do 1mm czy długość do 1cm)
Przykładowe rozkłady • Rozkład Beta używany jest do modelowania rozkładów wielkości uporządkowanych, mających naturalny limit dolny i górny • Rozkład dwumianowy używany jest do opisu takich zjawisk, jak np. liczba K/M czy liczba elementów wadliwych w próbie złożonej z n elementów pobranych z populacji
Przykładowe rozkłady • Rozkład chi-kwadrat używany jest do modelowania zmiennych reprezentujących częstości • Rozkład wykładniczy używany jest często do modelowania czasu między zdarzeniami • Rozkład Poisson’a używany jest do modelowania zjawisk rzadkich
Przykładowe rozkłady • Rozkład normalny jest najczęściej stosowany w estymacji statystycznej • Rozkład Weibull’a stosuje się często do modelowania czasu, który mija do momentu wystąpienia awarii • ...
Rozkład normalny • Najczęściej stosowany rozkład w statystyce • Podstawa wielu metod statystycznych: estymacji, testów, regresji, korelacji, analizy wariancji, ...
Rozkład normalny • Opisuje zmienne, które mogą przybierać postać nieskończonej liczby niezależnych zdarzeń losowych • Przykład rozkładu zmiennej ciągłej • Jego funkcję gęstości prawdopodobieństwa można opisać następująco:
Rozkład normalny • gdzie: • x - zmienna • µ - średnia arytmetyczna • σ - odchylenie standardowe
Własności (r-d normalny) • Wartość funkcji gęstości rośnie dla x<µ i maleje dla x>µ • Funkcja gęstości ma maksimum w punkcie x = µ • Wartość oczekiwana zmiennej X wynosi E(X)=µ • Wariancja zmiennej X równa jest D2X = σ2
Własności (r-d normalny) • dla x = µ funkcja gęstości ma wartość • rozkład ma 2 punkty przegięcia dla x=µ - σ i x = µ + σ • rozkład normalny jest symetryczny, a oś symetrii zdefiniowana jest jako x = µ
Własności (r-d normalny) • Im wariancja / odchylenie standardowe jest mniejsze, tym funkcja gęstości jest węższa • funkcja prawdopodobieństwa jest całką z funkcji gęstości prawdopodobieństwa
Standaryzowany r.n. • Każdy rozkład normalny może być znormalizowany, tj. doprowadzony do postaci rozkładu o średniej 0 i odchyleniu standardowym 1: N(0,1). • Wartość oczekiwana standaryzowanego r-du normalnego równa jest zero (EZ = 0) a odchylenie standardowe równe jest 1 (D2Z = 1).
Standaryzowany r.n. • Standaryzacja to zamiana zmiennej x na z, gdzie: • Funkcja gęstości prawdopodobieństwa tej funkcji:
Własności (r-d normalny) • Pomiędzy µ - σ i µ + σ znajduje się około 68% wszystkich wartości zmiennej • W przedziale od μ - 2*σ do μ + 2*σ jest około 95% wszystkich wartości zmiennej • W przedziale od μ - 3*σ do μ + 3*σ mamy około 99,7% wszystkich obserwacji
Rozkład dwumianowy • Przykład funkcji rozkładu prawdopodobieństwa • Opisuje prawdopodobieństwo uzyskania k sukcesów w n niezależnych próbach, gdzie prawdopodobieństwo sukcesu w jednej próbie wynosi p
Własności (r-d dwum.) • Wykres funkcji rozkładu jest symetryczny dla p = 0.5 • dla p < 0.5 rozkład jest skośny dodatnio • dla p > 0.5 rozkład jest skośny ujemnie
Własności (r-d dwum.) • Wartość oczekiwana E(X) = n * p • Wariancja D2X = n p q • Odchylenie standardowe