1 / 39

Statystyka w doświadczalnictwie

Statystyka w doświadczalnictwie. Wydział Technologii Drewna SGGW Studia II stopnia. Wykład 5. Rozkłady statystyczne Rozkłady empiryczne Po co rozkłady? Typy zmiennych Przykładowe rozkłady Rozkład normalny Rozkład dwumianowy. Rozkłady empiryczne.

maren
Download Presentation

Statystyka w doświadczalnictwie

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Statystyka w doświadczalnictwie Wydział Technologii Drewna SGGW Studia II stopnia

  2. Wykład 5 • Rozkłady statystyczne • Rozkłady empiryczne • Po co rozkłady? • Typy zmiennych • Przykładowe rozkłady • Rozkład normalny • Rozkład dwumianowy

  3. Rozkłady empiryczne • Graficzna reprezentacja danych w formie rozkłady liczebnosci, wieloboku liczebności, histogramu, itp.

  4. Graficzna prezentacja danych

  5. Graficzna prezentacja danych

  6. Po co rozkłady? • Niekiedy konieczne jest założenie, że badana cecha posiada określony rozkład • np. możemy założyć, że rozkład cechy „gęstość drewna” jest zgodny z rozkładem normalnym i wykorzystać później tę informację do estymacji, testowania hipotez lub modelowania

  7. Po co rozkłady? • Stwierdzenie zgodności cechy z danym rozkładem pozwala na zrozumienie zależności istniejących w zbiorze danych • W takiej sytuacji zwykle buduje się rozkład teoretyczny na bazie danych pomiarowych i porównuje otrzymane rozkłady

  8. Po co rozkłady? • Do dopasowania rozkładów stosuje się zwykle metodę momentów lub metodę największej wiarygodności • Rozkłady teoretyczne są podstawą wielu metod statystycznych (estymacji, testów, ...), stąd konieczne jest sprawdzenie, czy dane mają rozkład zgodny np. z rozkładem normalnym

  9. Typy zmiennych • Jakościowe (określające przynależność do określonej grupy lub kategorii, np. płeć, kolor, gatunek drewna, ...0 • Ilościowe (możliwe do pomierzenia z wykorzystaniem skali pomiarowych, dla których możliwe jest dodawania czy uśrednianie, np. miąższość kłody, gęstość drewna, ...)

  10. Zmienna a typ rozkładu • Jeżeli zmienna ma postać skończonego zbioru - jest to zmienna skokowa (np. wiek, klasa grubości, ...) możliwa do opisania rozkładem prawdopodobieństwa

  11. Zmienna a typ rozkładu • Jeżeli zmienna może przyjąć dowolna wartość (lub dowolną wartość z określonego przedziału) - mówimy o zmiennej ciągłej (np. długość, grubość, ...) możliwej do opisania gęstością prawdopodobieństwa

  12. Zmienna a typ rozkładu • W wielu przypadkach (z powodu technicznych ograniczeń pomiarów lub z powodów praktycznych) zmienne ciągłe traktowane są ja dyskretne (np. kiedy grubość mierzona jest z zaokrągleniem do 1mm czy długość do 1cm)

  13. Przykładowe rozkłady • Rozkład Beta używany jest do modelowania rozkładów wielkości uporządkowanych, mających naturalny limit dolny i górny • Rozkład dwumianowy używany jest do opisu takich zjawisk, jak np. liczba K/M czy liczba elementów wadliwych w próbie złożonej z n elementów pobranych z populacji

  14. Przykładowe rozkłady • Rozkład chi-kwadrat używany jest do modelowania zmiennych reprezentujących częstości • Rozkład wykładniczy używany jest często do modelowania czasu między zdarzeniami • Rozkład Poisson’a używany jest do modelowania zjawisk rzadkich

  15. Przykładowe rozkłady • Rozkład normalny jest najczęściej stosowany w estymacji statystycznej • Rozkład Weibull’a stosuje się często do modelowania czasu, który mija do momentu wystąpienia awarii • ...

  16. Rozkład normalny • Najczęściej stosowany rozkład w statystyce • Podstawa wielu metod statystycznych: estymacji, testów, regresji, korelacji, analizy wariancji, ...

  17. Rozkład normalny • Opisuje zmienne, które mogą przybierać postać nieskończonej liczby niezależnych zdarzeń losowych • Przykład rozkładu zmiennej ciągłej • Jego funkcję gęstości prawdopodobieństwa można opisać następująco:

  18. Rozkład normalny • gdzie: • x - zmienna • µ - średnia arytmetyczna • σ - odchylenie standardowe

  19. Rozkład normalny

  20. Własności (r-d normalny) • Wartość funkcji gęstości rośnie dla x<µ i maleje dla x>µ • Funkcja gęstości ma maksimum w punkcie x = µ • Wartość oczekiwana zmiennej X wynosi E(X)=µ • Wariancja zmiennej X równa jest D2X = σ2

  21. Własności (r-d normalny) • dla x = µ funkcja gęstości ma wartość • rozkład ma 2 punkty przegięcia dla x=µ - σ i x = µ + σ • rozkład normalny jest symetryczny, a oś symetrii zdefiniowana jest jako x = µ

  22. Własności (r-d normalny) • Im wariancja / odchylenie standardowe jest mniejsze, tym funkcja gęstości jest węższa • funkcja prawdopodobieństwa jest całką z funkcji gęstości prawdopodobieństwa

  23. Własności (r-d normalny)

  24. Standaryzowany r.n. • Każdy rozkład normalny może być znormalizowany, tj. doprowadzony do postaci rozkładu o średniej 0 i odchyleniu standardowym 1: N(0,1). • Wartość oczekiwana standaryzowanego r-du normalnego równa jest zero (EZ = 0) a odchylenie standardowe równe jest 1 (D2Z = 1).

  25. Standaryzowany r.n. • Standaryzacja to zamiana zmiennej x na z, gdzie: • Funkcja gęstości prawdopodobieństwa tej funkcji:

  26. Standaryzowany r.n.

  27. Własności (r-d normalny) • Pomiędzy µ - σ i µ + σ znajduje się około 68% wszystkich wartości zmiennej • W przedziale od μ - 2*σ do μ + 2*σ jest około 95% wszystkich wartości zmiennej • W przedziale od μ - 3*σ do μ + 3*σ mamy około 99,7% wszystkich obserwacji

  28. Rozkład skumulowany

  29. Rozkład skumulowany

  30. Rozkład skumulowany

  31. Rozkład skumulowany

  32. Rozkład skumulowany

  33. Rozkład dwumianowy • Przykład funkcji rozkładu prawdopodobieństwa • Opisuje prawdopodobieństwo uzyskania k sukcesów w n niezależnych próbach, gdzie prawdopodobieństwo sukcesu w jednej próbie wynosi p

  34. Rozkład dwumianowy

  35. Rozkład dwumianowy

  36. Własności (r-d dwum.) • Wykres funkcji rozkładu jest symetryczny dla p = 0.5 • dla p < 0.5 rozkład jest skośny dodatnio • dla p > 0.5 rozkład jest skośny ujemnie

  37. Własności (r-d dwum.) • Wartość oczekiwana E(X) = n * p • Wariancja D2X = n p q • Odchylenie standardowe

  38. Dziekuje za uwagę!

More Related