1 / 49

Statystyczna analiza danych za pomocą arkusza kalkulacyjnego EXCEL oraz aplikacji SAS Enterprise Guide v. 4.2

Statystyczna analiza danych za pomocą arkusza kalkulacyjnego EXCEL oraz aplikacji SAS Enterprise Guide v. 4.2. Piwczyński Dariusz Katedra Genetyki i Podstaw Hodowli Zwierząt. Rodzaje analiz.

bluma
Download Presentation

Statystyczna analiza danych za pomocą arkusza kalkulacyjnego EXCEL oraz aplikacji SAS Enterprise Guide v. 4.2

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Statystyczna analiza danych za pomocą arkusza kalkulacyjnego EXCELoraz aplikacji SAS Enterprise Guide v. 4.2 Piwczyński Dariusz Katedra Genetyki i Podstaw Hodowli Zwierząt

  2. Rodzaje analiz • Statystyki opisowe zjawisk masowych (miary średnie i pozycyjne, miary zmienności, miary asymetrii i koncentracji) • Estymacja przedziałowa • Testowanie hipotezy o równości dwóch wariancji • Testowanie hipotezy o równości dwóch średnich • Analiza wariancji • Analiza korelacji i regresji • Test chi kwadrat

  3. Statystyki opisowe Jak obliczyć? • Klasyczne podejście – funkcje statystyczne • Dodatek – Analiza danych • Tabela przestawna

  4. Funkcje Funkcje są wstępnie zdefiniowanymi formułami wykonującymi obliczenia z wykorzystaniem określonych wartości nazywanych argumentami i w konkretnym porządku nazywanym składnią. Składnia funkcji:=nazwa.funkcji(argumenty)

  5. Dane

  6. Funkcje – tworzymy legendę

  7. Funkcje – kreator funkcji

  8. Pomoc do funkcji

  9. Funkcje – obliczamy kolejne średnie

  10. Funkcje – przeciągnij Arkusze kalkulacyjne posiadają ceną własność, która polega na szybkim powielaniu przez przeciąganie rozwiązań (obliczonych funkcji) z jednej kolumny na wszystkie następne

  11. Funkcje – przeciągnij

  12. Funkcje – przykłady

  13. Wykaz funkcji statystycznych (83)

  14. Dodatek Analiza danych

  15. Jak włączyć Analiza danych? Zaznaczyć pole wyboru Analysis ToolPak

  16. Analiza danych – obliczenia Zaznaczamy zmienne, które chcemy objąć obliczeniami –możemy podać zakres z klawiatury Zaznaczamy pole wyboru „Tytuły w pierwszym wierszu”, ponieważ wiersz ten zawiera nazwy zmiennych Liczymy miary położenia, zmienności, asymetrii i skupienia rozkładu ! Te same dane – jagnięta. Zaznaczamy pole wyboru „Statystyki podsumowujące”

  17. Analiza danych – wyniki

  18. Tabela przestawna Zanim uruchomimy ten mechanizm! • Eliminujemy dublujące się nazwy zmiennych • Usuwamy puste kolumny i wiersze w istniejącym bloku danych

  19. Sytuacja niedopuszczalna!

  20. Liczymy za pomocą tabeli przestawnej • średnią arytmetyczną w odniesieniu do wybranych cech użytkowości rzeźnej z podziałem na grupy rasowe i z uwzględnieniem płci zwierzęcia

  21. a zatem... 2. w zakładce Wstawianie klikamy na pole TABELA PRZESTAWNA, wybieramy z listy TABELA PRZESTAWNA 1. Klikamy na dowolną komórkę należącą do listy danych!

  22. Tabela, krok po kroku Sprawdźmy wzrokowo czy proponowany przez program zakres (obszar zaznaczony przerywaną linią) pokrywa się z rzeczywistym obszarem naszych danych!

  23. Tabela (kolejny krok), projektujemy układ! Element kolumn i wierszy – obszary na które przeciągamy z LISTY PÓL nazwy zmiennych utożsamianych z czynnikami doświadczalnymi, np. GEN, PLEC! Element danych – na ten obszar przeciągamy z LISTY PÓL nazwy tych zmiennych, dla których obliczamy średnią arytmetyczną, odchylenie standardowe, np. MCPOM, WYSKLAB!

  24. Tabela – ustawiamy rodzaj obliczanej miary i format liczby Wskazujemy miarę, którą chcemy obliczyć Określamy format liczby, np. ilość miejsc po przecinku

  25. Tabela – różne układy

  26. Estymacja przedziałowa – Analiza danych (Wyznaczamy przedział ufności dla średniej arytmetycznej) W celu wyznaczenia przedziału ufności obliczone przez program wartości należy odjąć a następnie dodać do średniej arytmetycznej. W pierwszym przypadku obliczymy lewą, w drugim prawą stronę przedziału ufności. Przykład. Średnia wysokość w kłębie wyniosła 56,5 cm. Zatem lewa strona przedziału ufności wynosi: 56,5 cm – 0,67 = 55,83. Z kolei prawa strona przedziału wynosi 57,17 cm (56,5 cm + 0,67 cm).

  27. Testowanie hipotezy o równości dwóch wariancji (funkcja) • Hipoteza zerowa: zakładamy, że zmienność (wariancja) populacji generalnej mieszańców i jagnią czystorasowych w zakresie wymiarów zoometrycznych oraz cech użytkowości rzeźnej jest podobna! • Wykonujemy test Fishera! Korzystamy z funkcji statystycznej test.f()

  28. Test Fishera Jeżeli otrzymane prawdopodobieństwo jest większe niż 0,05 to nie mamy podstaw do odrzucenia H0! H0:D2(X1) = D2(X2) H0 odrzucamy w odniesieniu do obwodu klatki piersiowej! Wnioskujemy zatem, że zmienność obwodu klatki piersiowej w populacji mieszańców i zwierząt czystorasowych jest statystycznie różna!

  29. Test Fishera – Analiza danych W przypadku, gdy hipoteza alternatywna posiada następującą postać: H1:D2(X1) D2(X2), otrzymane prawdopodobieństwo (P(F <= f)) należy pomnożyć przez 2.

  30. Testowanie hipotezy o równości dwóch średnich Wpisujemy liczbę „2”, gdy zmienność w porównywanych grupach jest podobna! H0:E(X1) = E(X2) Wpisujemy liczbę „3”, gdy zmienność w porównywanych grupach jest różna!

  31. to samo za pomocą Analiza danych

  32. Analiza wariancji, jednoczynnikowa Zanim zaczniemy analizę wariancji musimy odpowiednio przygotować dane! Układamy wartości zmiennej „udział wyrębów wartościowych” w trzech kolumnach – reprezentują one trzy grupy rasowe! Następnie uruchamiamy moduł Analiza danych – Analiza wariancji jednoczynnikowa!

  33. Analiza wariancji jednoczynnikowa – wyniki SS – Suma kwadratów odchyleń df– liczba stopni swobody MS– średni kwadrat odchyleń F– F empiryczne Wartość p – prawdopodobieństwo otrzymania hipotezy zerowej Test F – wartość krytyczna testy Fishera-Snedecora Pomiędzy grupami – międzygrupowa W obrębie grup – wewnątrzgrupowa Razem – ogólna

  34. Korelacja prostoliniowa

  35. Korelacje – Analiza danych Wskazujemy kolumny zawierające zmienne, które chcemy skorelować Zaznaczamy to pole, ponieważ pierwszy wiersz zawiera dane nienumeryczne – nazwy zmiennych

  36. Korelacja, wyniki Mnóstwo liczb, tj. obliczonych współczynników korelacji Pearsona! Czy zależności są istotne?

  37. Wykres rozrzutu 1. Zaznaczamy zmienne (pierwsza niezależna, druga zależna) 2. W zakładce Wstawianie kilkamy na wykres Punktowy

  38. Wykres po obróbce

  39. Regresja, funkcje Współczynnik regresji • = NACHYLENIE(znane_y; znane_x) – • Znane_y jest to tablica lub zakres komórek liczbowych zależnych punktów danych. • Znane_x jest to zbiór niezależnych punktów danych

  40. Regresja, funkcje

  41. Współczynnik regresji, wynik

  42. Regresja, Analiza danych

  43. Regresja, wyniki

  44. Test niezależności chi kwadrat fo – wartość otrzymana; fe – wartość oczekiwana

  45. Dodatek Merlin v 2.5. (Neil Millar) Merlin umożliwia przeprowadzenie szeregu testów nieparametrycznych, jak np.: test U Mann-Whitney, Kruskal-Wallis, Wilcoxona, Friedmana. Pobrać ze strony: http://www.heckgrammar.kirklees.sch.uk/index.php?p=10310 W celu aktywacji dodatku Merlina należy skopiować pobrany plik merlin.xla do folderu: C:\Program Files\Microsoft Office\OFFICE11\Library (wersja OFFICE możebyćinna, np. OFFICE 10, 12) Dodatek uaktywniamy podobnie, jak moduł Analiza danych (W OFFICE 11 i niższych wersjach klikamy w pasku menu na Narzędzia, a następnie na Dodatki).

  46. Merlin – funkcje

  47. Merlin – test U Mann-Whitney

  48. Merlin – Kruskal-Wallis

  49. Merlin – Wilcoxon

More Related