340 likes | 466 Views
Plan na dziś. Ogólny model liniowy (GLM) Model mieszany (MIXED). Ogólny model liniowy. OML ł ączy zalety ANOVA i analizy regresji. gr. słoniny = stado + masa półtuszy + reszta. zm. klasyfikująca. zm. ciągła. Parametry modelu. β 0 = efekt wspólny β 1 = efekt stada A
E N D
Plan na dziś • Ogólny model liniowy (GLM) • Model mieszany (MIXED)
Ogólny model liniowy • OML łączy zalety ANOVA i analizy regresji gr. słoniny = stado + masa półtuszy + reszta zm. klasyfikująca zm. ciągła
Parametry modelu β0 = efekt wspólny β1 = efekt stada A β2 = efekt stada B efekt stada C = 0 β3 = regr. na masę półtuszy Jeden poziom efektu stałego jest zawsze wyzerowany!
23 mm stado A 42 kg 24 mm stado B 40 kg 22 mm stado C 41 kg 23 = 1β0+ 1β1 + 0β2+ 42β3+ e1 24 = 1β0+ 0β1 + 1β2+ 40β3+ e2 22 = 1β0+ 0β1 + 0β2+ 41β3+ e3
Zapis macierzowy β0 β1 β2 β3 23 24 = 22 e1 + e2 e3 1 1 0 42 1 0 1 40 1 0 0 41 y = X + e
General Linear Model data swinie ; infile “C:\...\mojplik.txt” ; input slonina stado $ waga ; procGLMdata=swinie; class stado ; model slonina = stado waga ; run ;
Sumy kwadratów • Typu I-ego: zależą od pozycji efektu w modelu! Oszacowany efekt masy półtuszy uzględnia wpływ stada, ale nie odwrotnie. • Typu III-ego: nie zależne od pozycji efektu w modelu! Każdy efekt jest poprawiony względem pozostałych.
Rozwiązania procGLMdata=swinie; class stado ; model slonina = stado waga / solutions; run ; Testowanie efektów: H0 1 = 0 H1 1 0 (test dwustronny) poziom istotności w kolumnie Pr > |t| Jeden poziom wyzerowany!
Średnie najmniejszych kwadratów to średnie jakich byśmy oczekiwali dla zbalansowanych danych. Średnie NK Układ niezbalanowany Tu brakuje obserwacji
Średnie NK procGLMdata=swinie; class stado ; model slonina = stado waga ; lsmeans stado / stderr ; run ; Oblicza błąd standardowy i testuje hipotezę średnia=0 Oblicza średnie least-squares
Interakcja Y = ABA*B Interakcja A1 A2B1 B2A1B1 A1B2 A2B1 A2B2
Efekty zagnieżdżone A1 A2 B1 B2 B1 B2 Y = AB(A) A1 A2B1 B2A1B1 A1B2 A2B1 A2B2 B nie występuje jako efekt główny.
Porównania wielokrotne procGLMdata=swinie; class stado ; model slonina = stado waga ; means stado / opcja; run ; DUNCAN LSD – najmniejsza istotna różnica TUKEY Means oblicza nie poprawione średnie, SNK Student-Newman-Keuls
Porównania średnich NK lsmeans stado / pdiff=all adjust=tukey; Testuje hipotezę H0: LSM(i)=LSM(j)
Pomiary powtarzane 23 mm 23 mm 22 mm stado A 42 kg 19 mm 18 mm 17 mm stado B 40 kg 22 mm 21 mm 22 mm stado C 41 kg Pomiary wykonywane na tych samych obiektach (świniach) mogą być skorelowane!
Pomiary powtarzane – c.d • y1 y2 y3 stado waga • 23 22 A 42 • 19 18 17 B 40 • 22 21 22 C 41 procGLM; class stado ; modely1-y3 = stado waga ; repeated czas; run ; Dowolna nazwa dla czynnika wewnątrz- obiektowego
Model mieszany y = X +Zu + e Zawiera zarówno efekty stałejak i losoweu
Kiedy efekt losowy? Efekt jest losowy, jeżeli po powtórzeniu próbkowania możemy wylosować inne jego poziomy. Np. losowanie 30 koni I próbkowanie: umaszczenie gniade 20 koni. umaszczenie pstrokate 10 koni II próbkowanie umaszczenie gniade 15 umaszczenie myszate 15
Kiedy efekt losowy? Gdy chcemy wnioskować o czynniku, ale nie mamy wszystkich jego poziomów. Np. Analizujemy wpływ pór roku, ale mamy dane tylko z lata i jesieni.
Kiedy efekt losowy? Gdy chcemy uwględnić fakt, że obserwacje są skorelowane ...lub gdy efekty skorelowane są naszym przedmiotem zainteresowania. Np. Wartość hodowlana świni A jest skorelowana z w.h. świni B, bo A i B są spokrewnione.
Zależności między efektami y = X +Zu + e Zależności między efektami zdefiniowane w macierzy G Zależności między resztami zdefiniowane w macierzy R
Przykład buhaj 2 krowa 3 krowa 4 stado A stado B y=11 y=6 buhaj 3 krowa 5 krowa 6 stado A stado B y=7 y=14 buhaj 1 krowa 1 krowa 2 stado A stado B y=9 y=12 y = X+e 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 V = R = 6 9 12 11 6 7 14 1 0 0 1 1 0 1 0 1 0 0 1 stado A stado B = Y = X = Zakładamy, że obserwacje nie są skorelowane, ale to nieprawda!
Przykład buhaj 2 krowa 3 krowa 4 stado A stado B y=11 y=6 buhaj 3 krowa 5 krowa 6 stado A stado B y=7 y=14 buhaj 1 krowa 1 krowa 2 stado A stado B y=9 y=12 y = X+Zu + e 8 2 0 0 0 0 2 8 0 0 0 0 0 0 8 2 0 0 0 0 2 8 0 0 0 0 0 0 8 2 0 0 0 0 2 8 buhaj 1 buhaj 2 buhaj 3 V=ZGZ`+R = 1 0 0 1 0 0 0 1 0 0 1 0 0 0 1 0 0 1 u = Z = 1 0 0 0 1 0 0 0 1 Teraz obserwacje są skorelowane, ale błędy nie! 2 G =
Poziomy efektów losowych mogą być także skorelowane np. zależności między efektami proporcjonalne do spokrewnień (Animal Model) ojciecmatka córka ojciec1 0 1/2 matka01 1/2 córka1/21/2 1 matka ojciec G=A2A córka
Model mieszany w SASie procMIXED ; class A B ; model Y = A B ; random C ; run ;
BLUP AM Y = stado + animal + reszta Krowa 1 Buhaj 2 stado A y=3,1 • Założenia: • wariancja add. 2A = 1,0 • wariancja reszt 2E = 1,5 • ...czyli G = A×1,0 R = I×1,5 Córka 3 Córka 4 stado B y=3,5 stado B y=3,3
BLUP AM krowa 11 0 0,5 0 buhaj 20 1 0,5 0,5 córka 30,5 0,5 1 0,25 córka 40 0,5 0,25 1 dataG ; inputRow Col1-Col4 ; cards ; 1 1 0 0.5 0 2 0 1 0.5 0.5 3 0.5 0.5 1 0.25 4 0 0.5 0.25 1 ; • dataG ; • inputRow Col Value ; • cards ; • 1 1 0 • 30.5 • 2 1 • 3 0.5 • itd.
BLUP AM data mleko ; input stado $ animal $ Y ; cards ; A 1 3.1 A 2 . B 3 3.5 B 4 3.3 ; procmixeddata=mleko ; class stado animal ; model Y = stado ; random animal / type=un gdata=G s; parms1.5 / hold=1 ; run ;
Zadanie 1 Zbadaj wpływ leku (1-4) i choroby (1-3) oraz interakcji między nimi na wskaźnik wydajnościowy organizmu. Czy układ jest zbalansowany? Który efekt jest istotny? Porównaj średnie najmniejszych kwadratów w parach. Dane: Procedura wczytania danych: 1 1 42 44 36 13 19 22 1 2 33 . 26 . 33 21 1 3 31 -3 . 25 25 24 2 1 28 . 23 34 42 13 2 2 . 34 33 31 . 36 2 3 3 26 28 32 4 16 3 1 . . 1 29 . 19 3 2 . 11 9 7 1 -6 3 3 21 1 . 9 3 . 4 1 24 . 9 22 -2 15 4 2 27 12 12 -5 16 15 4 3 22 7 25 5 12 . data a; input lekchoroba @; do i=1 to 6; input y @; output; end; cards ;
Zadanie 2 Zbadaj skuteczność antybiotyku (a-f) na stopień zakażenia pacjentów (po) uwzględniając stopień zakażenia przed leczeniem (przed) jako drugi efekt w modelu. Wytłumacz różnicę między wynikiem dla antybiotyku obliczonym wg sum kw. typu I i III. data AB; input anty $ przed po @@; cards; a 11 6 a 8 0 a 5 2 a 14 8 a 19 11 a 6 4 a 10 13 a 6 1 a 11 8 a 3 0 d 6 0 d 6 2 d 7 3 d 8 1 d 18 18 d 8 4 d 19 14 d 8 9 d 5 1 d 15 9 f 16 13 f 13 10 f 11 18 f 9 5 f 21 23 f 16 12 f 12 5 f 12 16 f 7 1 f 12 20
Zadanie 3 Analizowano wpływ mutacji w genie leptyny (CC, CG, GG) na ekspresję tego genu (poziom mRNA). Zbadano 14 świń i dla każdej wykonano 3 pomiary ekspresji genu. Zbadaj wpływ genu. http://jay.au.poznan.pl/~mcszyd/dyda/pakiety/index.html dane22.txt kol 1: genotyp Leptyny kol 2: pomiar 1 kol 3: pomiar 2 kol 4: pomiar 3
Zadanie 4 Analizowano wpływ genotypu w genie leptyny (CC, CG) na średnią grubość słoniny. Wykonaj obliczenia (a) ignorując wpływ ojca i (b) traktując wpływ ojca jako efekt losowy. Uwzględnij wiek uboju i masę półtuszy. http://jay.au.poznan.pl/~mcszyd/dyda/pakiety/index.html dane23.txt kol 1: kod rasy kol 2: numer próby kol 3: numer ojca kol 4: genotyp RYR kol 5: genotyp Leptyny kol 6: średnia gr. słoniny (cm) kol 7: wiek uboju (dni) kol 8: masa półtuszy (kg)
Zadanie dla chętnych Oceń wartość hodowlaną buhajów i krów wzg. zawartości tłuszczu w mleku przyjmując, że wariancja genetyczna addytywna = 0,75, a wariancja reszt = 1,3. 1 2 3 4 5 krowa stado %tłuszczu 2 A 3,3 3 A 3,1 5 B 3,0 6 B 2,9 8 B 3,4 9 A 3,5 10 B 3,2 6 7 8 9 10 zwierzęta ponumerowane rosnąco od najstarszych do najmłodszych