150 likes | 402 Views
Metody analizy zależności filogenetycznych. 1. A. B. 1. Metoda UPGMA (Unweighted Pair Group Method with Arthmatic Mean). Macierz odległości miedzy 6 OTU Wybieramy parę o najmniejszej odległości, czyli A i B (różnią się dwiema substytucjami).
E N D
1 A B 1 Metoda UPGMA (Unweighted Pair Group Method with Arthmatic Mean) Macierz odległości miedzy 6 OTU Wybieramy parę o najmniejszej odległości, czyli A i B (różnią się dwiema substytucjami) Punkt rozgałęzienia sytuujemy w odległości równej dAB/2, czyli 1substytucja
2 D E 2 • Kalkulacja nowej macierzy odległości (traktujemy parę AB jako osobny OTU stanowiący całość): • Drugi cykl : • Znajdujemy nową parę o najmniejszej odległości (DE)
Trzecia iteracja Czwarta iteracja 1 1 A 1 1 B A 1 1 2 B 2 C C 1 2 D 1 2 E
1 A 1 B 1 1 2 C 2 D 1 2 E • Ostatni krok-przyłączanie OTU F i ukorzenianie drzewa Midpoint rooting – teoretyczny wspólny przodek powinien być równoodległy od wszystkich OTU, czyli ; d(ABCDE,F)/2 = 8/2 =4 1 ROOT 4 F
Założenia i ograniczenia metody UPGMA • Jednakowe tempo mutacji wzdłuż wszystkich gałęzi drzewa • Są spełnione założenia „three point conditions”; Dla każdych trzech taksonów A,B, C prawdziwy jest warunek że: dAC<=max(dAB,dBC) Analiza skupień działa dobrze tylko jeżeli dane są ultrameryczne
Metoda NJ (Neighbor Joining) • OTU – operational taxonomic unit • Pair of neighbors- para sąsiadów – dwie jednostki taksonomiczne połączone jednym wewnętrznym węzłem na nieukorzenionym bifurkacyjnym drzewie filogenetycznym 5 Para sąsiadów Względem węzła A 1 4 1,2,3 4 Para sąsiadów względem węzła B A C D E B 2 6 F 7 3 8
Macierz odległości • N OTU = 6A,B,C,D,E,F • Elementy macierzy (dij ) • -odległości między OTU liczone jako liczba różnic między każda parą dopasowanych sekwencji (np. liczba substytucji zaobserwowanych między sekwencja A i B) • Net divergence- r i– suma odległości miedzy OTU i-tym a wszystkimi pozostałymi OTU • Kalkulacja nowej macierzy odległości wg formuły:
A E B 1 wspólny węzeł F C D Nowa macierz odległości Drzewko wyjściowe- star tree Wybieramy 1 z dwóch par o minimalnej wartości Mij
Dodawanie węzła A E SAU U B Kalkulujemy odległości między węzłem U a pozostałymi OUTu F C D
Iteracja • powtórzenie całej procedury dla NOTU=N-1=5 • i macierzy odległości ; • Liczymy r(X) • i nową macierz Mij • wyznaczamy parę OTU o minimalnej wartości Mij • wstawiamy kolejny węzeł W
Metoda FM (Fitch-Margoliash) Algebraiczna kalkulacja długości gałęzi a+b=22 a+c=39 b+c=41 a=10 b-=12 c=29 A a c C b B
A c a f g d b e B D E średnia odległość między D i ABC= 32.7 =d+m, gdzie m=g+[(c+2f+a+b)/2] E i ABC = 34.7 = e+ m 10=d+e układ trzech równań z trzema niewiadomymi – wyliczamy m, d i e C (39+41+18)/3 (41+43+20)/3
SSQ suma kwadratów odchyleń Average percent standard deviation