520 likes | 1.25k Views
Statystyczna analiza danych za pomocą arkusza kalkulacyjnego EXCEL oraz aplikacji SAS Enterprise Guide v. 4.2. Piwczyński Dariusz Katedra Genetyki i Podstaw Hodowli Zwierząt. Rodzaje analiz.
E N D
Statystyczna analiza danych za pomocą arkusza kalkulacyjnego EXCELoraz aplikacji SAS Enterprise Guide v. 4.2 Piwczyński Dariusz Katedra Genetyki i Podstaw Hodowli Zwierząt
Rodzaje analiz • Statystyki opisowe zjawisk masowych (miary średnie i pozycyjne, miary zmienności, miary asymetrii i koncentracji) • Estymacja przedziałowa • Testowanie hipotezy o równości dwóch wariancji • Testowanie hipotezy o równości dwóch średnich • Analiza wariancji • Analiza korelacji i regresji • Test chi kwadrat
Statystyki opisowe Jak obliczyć? • Klasyczne podejście – funkcje statystyczne • Dodatek – Analiza danych • Tabela przestawna
Funkcje Funkcje są wstępnie zdefiniowanymi formułami wykonującymi obliczenia z wykorzystaniem określonych wartości nazywanych argumentami i w konkretnym porządku nazywanym składnią. Składnia funkcji:=nazwa.funkcji(argumenty)
Funkcje – przeciągnij Arkusze kalkulacyjne posiadają ceną własność, która polega na szybkim powielaniu przez przeciąganie rozwiązań (obliczonych funkcji) z jednej kolumny na wszystkie następne
Jak włączyć Analiza danych? Zaznaczyć pole wyboru Analysis ToolPak
Analiza danych – obliczenia Zaznaczamy zmienne, które chcemy objąć obliczeniami –możemy podać zakres z klawiatury Zaznaczamy pole wyboru „Tytuły w pierwszym wierszu”, ponieważ wiersz ten zawiera nazwy zmiennych Liczymy miary położenia, zmienności, asymetrii i skupienia rozkładu ! Te same dane – jagnięta. Zaznaczamy pole wyboru „Statystyki podsumowujące”
Tabela przestawna Zanim uruchomimy ten mechanizm! • Eliminujemy dublujące się nazwy zmiennych • Usuwamy puste kolumny i wiersze w istniejącym bloku danych
Liczymy za pomocą tabeli przestawnej • średnią arytmetyczną w odniesieniu do wybranych cech użytkowości rzeźnej z podziałem na grupy rasowe i z uwzględnieniem płci zwierzęcia
a zatem... 2. w zakładce Wstawianie klikamy na pole TABELA PRZESTAWNA, wybieramy z listy TABELA PRZESTAWNA 1. Klikamy na dowolną komórkę należącą do listy danych!
Tabela, krok po kroku Sprawdźmy wzrokowo czy proponowany przez program zakres (obszar zaznaczony przerywaną linią) pokrywa się z rzeczywistym obszarem naszych danych!
Tabela (kolejny krok), projektujemy układ! Element kolumn i wierszy – obszary na które przeciągamy z LISTY PÓL nazwy zmiennych utożsamianych z czynnikami doświadczalnymi, np. GEN, PLEC! Element danych – na ten obszar przeciągamy z LISTY PÓL nazwy tych zmiennych, dla których obliczamy średnią arytmetyczną, odchylenie standardowe, np. MCPOM, WYSKLAB!
Tabela – ustawiamy rodzaj obliczanej miary i format liczby Wskazujemy miarę, którą chcemy obliczyć Określamy format liczby, np. ilość miejsc po przecinku
Estymacja przedziałowa – Analiza danych (Wyznaczamy przedział ufności dla średniej arytmetycznej) W celu wyznaczenia przedziału ufności obliczone przez program wartości należy odjąć a następnie dodać do średniej arytmetycznej. W pierwszym przypadku obliczymy lewą, w drugim prawą stronę przedziału ufności. Przykład. Średnia wysokość w kłębie wyniosła 56,5 cm. Zatem lewa strona przedziału ufności wynosi: 56,5 cm – 0,67 = 55,83. Z kolei prawa strona przedziału wynosi 57,17 cm (56,5 cm + 0,67 cm).
Testowanie hipotezy o równości dwóch wariancji (funkcja) • Hipoteza zerowa: zakładamy, że zmienność (wariancja) populacji generalnej mieszańców i jagnią czystorasowych w zakresie wymiarów zoometrycznych oraz cech użytkowości rzeźnej jest podobna! • Wykonujemy test Fishera! Korzystamy z funkcji statystycznej test.f()
Test Fishera Jeżeli otrzymane prawdopodobieństwo jest większe niż 0,05 to nie mamy podstaw do odrzucenia H0! H0:D2(X1) = D2(X2) H0 odrzucamy w odniesieniu do obwodu klatki piersiowej! Wnioskujemy zatem, że zmienność obwodu klatki piersiowej w populacji mieszańców i zwierząt czystorasowych jest statystycznie różna!
Test Fishera – Analiza danych W przypadku, gdy hipoteza alternatywna posiada następującą postać: H1:D2(X1) D2(X2), otrzymane prawdopodobieństwo (P(F <= f)) należy pomnożyć przez 2.
Testowanie hipotezy o równości dwóch średnich Wpisujemy liczbę „2”, gdy zmienność w porównywanych grupach jest podobna! H0:E(X1) = E(X2) Wpisujemy liczbę „3”, gdy zmienność w porównywanych grupach jest różna!
Analiza wariancji, jednoczynnikowa Zanim zaczniemy analizę wariancji musimy odpowiednio przygotować dane! Układamy wartości zmiennej „udział wyrębów wartościowych” w trzech kolumnach – reprezentują one trzy grupy rasowe! Następnie uruchamiamy moduł Analiza danych – Analiza wariancji jednoczynnikowa!
Analiza wariancji jednoczynnikowa – wyniki SS – Suma kwadratów odchyleń df– liczba stopni swobody MS– średni kwadrat odchyleń F– F empiryczne Wartość p – prawdopodobieństwo otrzymania hipotezy zerowej Test F – wartość krytyczna testy Fishera-Snedecora Pomiędzy grupami – międzygrupowa W obrębie grup – wewnątrzgrupowa Razem – ogólna
Korelacje – Analiza danych Wskazujemy kolumny zawierające zmienne, które chcemy skorelować Zaznaczamy to pole, ponieważ pierwszy wiersz zawiera dane nienumeryczne – nazwy zmiennych
Korelacja, wyniki Mnóstwo liczb, tj. obliczonych współczynników korelacji Pearsona! Czy zależności są istotne?
Wykres rozrzutu 1. Zaznaczamy zmienne (pierwsza niezależna, druga zależna) 2. W zakładce Wstawianie kilkamy na wykres Punktowy
Regresja, funkcje Współczynnik regresji • = NACHYLENIE(znane_y; znane_x) – • Znane_y jest to tablica lub zakres komórek liczbowych zależnych punktów danych. • Znane_x jest to zbiór niezależnych punktów danych
Test niezależności chi kwadrat fo – wartość otrzymana; fe – wartość oczekiwana
Dodatek Merlin v 2.5. (Neil Millar) Merlin umożliwia przeprowadzenie szeregu testów nieparametrycznych, jak np.: test U Mann-Whitney, Kruskal-Wallis, Wilcoxona, Friedmana. Pobrać ze strony: http://www.heckgrammar.kirklees.sch.uk/index.php?p=10310 W celu aktywacji dodatku Merlina należy skopiować pobrany plik merlin.xla do folderu: C:\Program Files\Microsoft Office\OFFICE11\Library (wersja OFFICE możebyćinna, np. OFFICE 10, 12) Dodatek uaktywniamy podobnie, jak moduł Analiza danych (W OFFICE 11 i niższych wersjach klikamy w pasku menu na Narzędzia, a następnie na Dodatki).