1 / 37

Analiza wariancji jednoczynnikowa

Analiza wariancji jednoczynnikowa. Dr hab. inż. Dariusz Piwczyński. Zastosowanie. Porównanie większej niż 2 liczby grup (k>2) Zmienna zależna – skala przedziałowa Zmienna niezależna – skala nominalna lub porządkowa. Ronald Fisher ( angielski biolog i genetyk).

mandy
Download Presentation

Analiza wariancji jednoczynnikowa

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Analiza wariancji jednoczynnikowa Dr hab. inż. Dariusz Piwczyński

  2. Zastosowanie • Porównanie większej niż 2 liczby grup (k>2) • Zmienna zależna – skala przedziałowa • Zmienna niezależna – skala nominalna lub porządkowa

  3. Ronald Fisher (angielski biolog i genetyk) • Istota teorii analizy wariancji opiera się na podziale zmienności głównej na pewne frakcje i na analizowaniu tych poszczególnych zmienności.

  4. Rodzaje zmienności • zmienność ogólna • zmienność międzygrupowa • zmienność wewnątrzgrupowa

  5. Zmienność ogólna • wyraża się zróżnicowaniem poszczególnych wartości zmiennej w stosunku do ogólnej średniej (obliczonej dla całej zbiorowości).

  6. Zmienność międzygrupowa • występuje na skutek różnic powstałych między grupami doświadczalnymi, wywołana jest działaniem czynnika doświadczalnego na poszczególne grupy doświadczalne, • wyraża się zróżnicowaniem średnich poszczególnych grup doświadczalnych w stosunku do ogólnej średniej.

  7. Zmienność wewnątrzgrupowa • istnieje między poszczególnymi zmiennymi wewnątrz każdej grupy, • wywołana jest czynnikami osobniczymi czyli indywidualnymi cechami poszczególnych osobników, • wyraża się zróżnicowaniem poszczególnych wartości zmiennej wewnątrz każdej grupy w stosunku do średniej dla tej grupy.

  8. Założenia analizy wariancji: • Niezależność zmiennych objaśniających (czynników) • Homogeniczność wariancji (test Levene) • Normalność rozkładu

  9. Normalność rozkładu • Rozkład cechy w każdej z grup winien być normalny. • W praktyce często badamy czy czynnik losowy, tj. eij posiada rozkład normalny. • W celu sprawdzenia tego założenia, od każdego pomiaru odejmujemy średnią wartość grupy, z której ten pomiar pochodzi,a następnie badamy rozkład tychże różnic. • Jeśli reszty nie mają rozkładu normalnego, to zaleca się transformacje zmiennych.

  10. Reszty

  11. Normalność rozkładu sprawdzamy za pomocą: testów Shapiro-Wilkoraz Kolmogorov-Smirnoff Ocena graficzna: histogram Teoretycznie, rozkład powinien być oceniany oddzielnie dla każdej porównywanej grupy. W praktyce rozkład jest oceniany dla całej objętej badaniami populacji.

  12. Homogeniczność wariancji (równość wariancji) • Porównywane grupy nie powinny różnić się między sobą pod względem zmienności. • Jeśli nie ma homogeniczności, to możliwe są logarytmiczne transformacje zmiennych lub też usunięcie grupy, która pod względem zmienności wyraźnie odstaje od pozostałych.

  13. Homogeniczność wariancji • wariancje odnoszące się do porównywanych grup powinny być takie same: • Test Bartlett wykonujemy w odniesieniu do zmiennych o rozkładzie normalnym • Test Brown i Forsythe • Test Levene

  14. Założenie dotyczące homogeniczności nie są spełnione! • Transformacje zmiennej zależnej w celu zmiany rozkłady zmiennych i skorygowania nierównych wariancji. • Test Welch (Analiza wariancji Welch) • Nieparametryczna analiza wariancji (rozkład jest silnie skośny lub występują wartości skrajnie odbiegające od pozostałych)

  15. Transformacje zmiennych • Transformacje zmiennych z reguły wpływają jednocześnie na homogeniczność wariancji i rozkład! • Oznacza to, że transformacje mające na celu poprawę „normalności rozkładu” mogą powodować problemy z homogenicznością wariancji i odwrotnie. Ln(Y)

  16. Rozkład F • Jeśli z populacji o rozkładzie normalnym wybieralibyśmy losowo po dwie próby i badalibyśmy wzajemne relacje ich wariancji (iloraz), to ten stosunek miałby rozkład zgodny z rozkładem F.

  17. Rozkład F • stosunek kwadratów odchyleń międzygrupowych do wewnątrzgrupowych kształtuje się według określonego rozkładu (rozkład F) lub inaczej • stosunek zmienności międzygrupowej do wewnątrzgrupowej kształtuje się według określonego rozkładu (rozkład F)

  18. Rozkład F

  19. Hipoteza zerowa • H0: Wszystkie średnie są równe, tzn.H0: 1= 2= 3= 4 = 5= 6...

  20. Hipoteza zerowa – krety • Zakładamy, że masa ciała samic gatunku kret jest taka sama we wszystkich porach roku

  21. Hipoteza alternatywna • H1:Istnieje co najmniej jedna para średnich, które różnią się ze sobą. • H1: 12 lub 1  3 lub 2  3 itd....

  22. Kolejność obliczeń

  23. Liczba stopni swobody • Ogólna: N  1 (N – liczebność populacji) • Międzygrupowa: k –1 (k – liczba grup doświadczalnych) • Wewnątrzgrupowa: N –k

  24. Sumy kwadratów odchyleń • Zmienność ogólna • Zmienność międzygrupowa • Zmienność wewnątrzgrupowa: Sw = So - Sm

  25. Średnie kwadraty odchyleń • Zmienność międzygrupowa: Sm2 = Sm / (k –1) • Zmienność wewnątrzgrupowa:Sw2 = Sw/ (N –k)

  26. Statystyka F wartość krytyczna

  27. Interpretacja • Obliczoną wartość statystyki F (tzw. F empiryczne - Femp.) odnosimy do wartości krytycznej z rozkładu F dla założonego poziomu istotności () i określonej liczby stopni swobody (1=k-1 oraz 2=N-k) (F tabelaryczne - Ftab.). Jeżeli Femp. Ftab. – to mamy podstawę do odrzucenie hipotezy zerowej i stwierdzenia, iż istnieje co najmniej jedna para średnich, które różnią się ze sobą. Zatem czynnik doświadczalny wpływa statystycznie na cechę. W przeciwnym przypadku, nie mamy podstaw do odrzucenia H0.

  28. ANOVA za pomocą MS EXCEL Badamy wpływ pory roku, w której zostały odłowione zwierzęta na ich masę ciała! Czy masa ciała jest uzależniona od pory roku?

  29. Obliczamy średnie w zakresie masy ciała – tabela przestawna

  30. Wyniki, g

  31. a co z rozkładem? (Analiza danych)

  32. Przygotowanie danych Poukładać dane w kolumnach! Każda kolumna to inna pora roku!

  33. Analiza wariancji

  34. Wyniki analizy wariancji

  35. I to samo w SAS EG

  36. Wyniki • Decyzję o odrzuceniu H0 podejmujemy na podstawie kolumny P r> F na wysokości nazwy czynnika, tj. PoraRoku. • p jest mniejsze aniżeli 0,0001 (0,05) zatem mamy podstawę do odrzucenia H0!

  37. Homogeniczność wariancji

More Related