450 likes | 555 Views
Co-evolution mellem malaria-parasitter ( Plasmodium ) og deres værter. Formål. At undersøge slægtskab hos h.h.v malaria-parasitter af slægten Plasmodium og deres værter. At sammenligne fylogenier med henblik på at konstatere om der er sket co-evolution eller spring mellem værter. Metode.
E N D
Co-evolution mellem malaria-parasitter (Plasmodium) og deres værter
Formål • At undersøge slægtskab hos h.h.v malaria-parasitter af slægten Plasmodium og deres værter. • At sammenligne fylogenier med henblik på at konstatere om der er sket co-evolution eller spring mellem værter.
Metode • Download af gensekvenser (rRNA SSU) for parasitter og værter fra GenBank. • Alignment med CLUSTALw • Konstruktion af fylogenetiske træer v.h.a. • Neighbor-joining (NJ) • Maximum Parsimony (MP) • Maximum Likelihood (ML)
Neighbour-joiningMinimum evolution • Distance Matrix Method • Fordele • Hurtig. Velegnet til store datasæt • Tillader lineages med forskellige grenlængder (forskellig mutationsrater/evolutionshastgheder) • Tillader korrektion af multiple substitutioner • Ulemper • Sekvensinformation er reduceret • Giver kun et muligt træ • Stærkt afhængigt af den anvendte evolutionsmodel
Neighbour-joining • Da afstanden mellem AC er kortere end AB ville AC klade sammen ved brug af UPGMA • Derfor......
Neighbour-joining • ialt 6 OTUs (N=6). • Step 1: nettodivergens r(i) beregnes • r(A) = 5+4+7+6+8=30 • r(B) = 42 • r(C) = 32 • r(D) = 38 • r(E) = 34 • r(F) = 44
Neighbour-joining • Step 2: Ny distance beregnes for hvert OTU par: • M(ij)=d(ij) - [r(i) + r(j)]/(N-2) • M(AB)=d(AB) -[(r(A) + r(B)]/(N-2) • M(AB)=5-[30+42]/(6-2)=-13
Neighbour-joining A F | B \ | / \ | / \|/ /|\ / | \ / | \ E | C D
Neighbour-joining • Step 3: Nu udvælges som naboer de to OTUer for hvem Mij er mindst • A & B og D & E. • Fx A & B som naboer. Ny noder som kaldes U • Grenlængder beregnes fra den interne node U til de eksterne OTUer A & B • S(AU) =d(AB) / 2 + [r(A)-r(B)] / 2(N-2) = 1 S(BU) =d(AB) -S(AU) = 4
Neighbour-joining • Step 4: Nye afstande defineres fra U til alle andre terminale noder: • d(CU) = d(AC) + d(BC) - d(AB) / 2 = 3 d(DU) = d(AD) + d(BD) - d(AB) / 2 = 6 d(EU) = d(AE) + d(BE) - d(AB) / 2 = 5 d(FU) = d(AF) + d(BF) - d(AB) / 2 = 7
Neighbour-joining C D | \ | A \ |___/ 1 / | \ / | \ 4 E | \ F \ B Hele proceduren gentages
Maximum Parsimony • Parsimony indebærer at den mest simple hypotese foretrækkes • Maximum parsimony er en karakterbaseret metode der udleder fylogenetiske træer ved at minimere det totale antal af evolutionære trin der kræves for at forklare et givent datasæt. Minimering af trælængden (antal substitutioner) • Trin kan være base eller aminosyre substitutioner for sekvensdata
Maximum Parsimony Site Sekv. 1 2 3 4 5 6 7 8 9 1 A A G A G T G C A 2 A G C C G T G C G 3 A G A T A T C C A 4 A G A G A T C C G * * *
Maximum Parsimony 1) GGA ACA (3) \1 1/ Antal mutationer \ 2 / GGG --- ACG Træ I: 4 / \ /0 0\ (2) GGG ACG (4)
Maximum Parsimony (1) GGA GGG (2) \1 1/ Antal mutationer \ 1 / GCA --- GCG Træ II: 5 / \ /1 1\ (3) ACA ACG (4)
Maximum Parsimony (1) GGA GGG (2) \2 1/ Antal mutationer \ 0 / GCG --- GCG Træ III: 6 / \ /1 2\ (4) ACG ACA (3)
Maximum Parsimony • Mindste antal substitutioner vinder.. • Et informativt site favoriserer ET træ • Træ I støttes af 2 sites • Træ II støttes af 1 site • Træ III støttes 0 sites • MP søger efter det optimale (minimale) træ • Men der kan være mere end et! • Exhaustive search af alle mulige træer • MEEEEEN............
Maximum Parsimony • Branch and Bound: en variation af MP der garanterer at finde det minimale træ uden at evaluerer samtlige træer • Heuristic searches branch swapping metoder. Ingen garanti for at finde bedste træ • Nearest neighbour interchange • Subtree pruning and regrafting • Treebisection and reconnection
Maximum Parsimony • Fordele: • Reducerer ikke sekvensinformation til et enkelt tal • Prøver at give information om ancestrale sekvenser • Evaluerer forskellige træer • Ulemper: • Langsom i forhold til distancebaserede metoder • Bruger ikke al sekvensinformation • Korrigerer ikke for multiple mutationer • Giver ikke information om grenlængder
Maximum Likelihood • Maximum Likelihood evaluerer en hypotese om en evolutionær historie som en sandsynlighed for at den foreslåede model og den hypotetiserede historie ville ligge til grund for de observerede data • Det antages at en historie med en højere sandsynlighed for at nå det observerede stadium er at foretrække frem for en en historie med en lavere sandsynlighed • Metoden søger efter træet med den højeste sandsynlighed eller likelihood
Maximum Likelihood • Fordele med ML • Ofte lavere varians end andre metoder (den metode mindst påvirket af sampling error!) • Mindre påvirkelig over for brud på antagelser af den evolutionære model • Selv med meget korte sekvenser er den ofte bedre en d MP og distancemetoder • Al sekvensinformation bruges
Maximum Likelihood • Ulemper med ML • ML er MEGET langsom • Resultatet er beroende på evolutionsmodellen som anvendes • Vægtning af mutationer • Transition • Purin til purin A til G, G til A • Pyrimidin til pyrimidin T til C, C til T • Transversion • Purin til pyrimidin A til T, A til C, G til T, G til C • Pyrimidin til purin C til A, C til G, T til A, T til G
Maximum Likelihood • Maximum likelihood evaluerer sandsynligheden for at den valgte evolutionsmodel vil have genereret de observerede sekvenser • Fylogenier konstrueres ved at finde træer med den højeste likelihood
Maximum Likelihood • Antag at vi har følgende alignede nukleotidsekvenser for 4 taxa: • 1 j ....N • (1) A G G C U C C A A ....A • (2) A G G U U C G A A ....A • (3) A G C C C A G A A.... A • (4) A U U U C G G A A.... C
Maximum Likelihood • Under antagelse af at nukleotidsites udvikler sig uafhængigt (the Markovian model of evolution), kan likelihood for hvert site beregnes separat og en samlet likelihood for alle sites kan beregnes • Alle muligheder for nukleotidudviklingen for site j må beregnes • Sandsynligheden/Likelihooden for et bestemt site er summeringen af alle mulige rekonstruktioner for en bestemt basesubstitutionsmodel • I dette tilfælde samtlige mulige nukleotider A,G,C,T ved node 5 og 6 eller 4 x 4 = 16 muligheder
Maximum Likelihood • Og vi vil evaluere sandsynligheden/likelihooden for det urodede træ repræsenteret ved nukleotiderne ved site j • (1,C) (2,C) • \ / • \ / • (5,?) --- (6,?) • / \ • / \ • (3,A) (4,G)
Maximum Likelihood N • L= L(1) x L(2) ..... x L(N) = ½ L(j) j=1 • Da likelihoodværdier er små summes log likelihoods for hver enkelt site og likelihood for hele træet opgives som log likelihood N • ln L= ln L(1) + ln L(2) ....+ ln L(N) = SUM ln L(j) j=1
Maximum Likelihood • Proceduren gentages for alle topologier/træer • Træet med den højeste sandsynlighed er træet med maximum likelihood.
Sample 1 0 1 2 0 3 0 1 2 0 1 A A G G C U C C A A A B A G G U U C G A A A C A G C C C C G A A A D A U U U C C G A A C Pseudosample A G G G U U U C A A A B G G G U U U G A A A C G C C C C C G A A A D U U U C C C G A A C A B C B 1 C 6 5 D 8 7 4 Bootstrapping
Sample 2 1 0 0 0 2 2 2 0 0 3 A A G G C U C C A A A B A G G U U C G A A A C A G C C C C G A A A D A U U U C C G A A C Pseudoreplicates A A U U C C C C A A A B A U U C C G G A A A C A C C C C G G A A A D A C C C C G G C C C A B C B 2 C 4 2 D 7 5 3 Bootstrapping
Sample 3 1 0 0 0 2 2 2 0 0 3 A A G G C U C C A A A B A G G U U C G A A A C A G C C C C G A A A D A U U U C C G A A C Pseudoreplicates A A U U C C C C A A A B A U U C C G G A A A C A C C C C G G A A A D A C C C C G G C C C A B C B 1 C 3 2 D 6 3 4 Bootstrapping
Parasitter • Fugl: P. gallinaceum • Firben: P. mexicanum • Gnaver: P. berghei • Østaber: P. cynomolgi, P. knowlesi • Chimpanse: P. reichenowi • Menneske: P. falciparum, P. vivax, P. ovale, P. malariae
Co-evolution eller spring mellem værter? • Hvis parasitternes stamtræ har samme topologi som de tilsvarende værters, kan det tolkes som co-evolution (parasitterne er udviklet med værterne). • Hvis parasitternes stamtræ ikke har samme topologi som værternes, tyder det på, at parasitterne har sprunget mellem værter.
Hvad siger litteraturen? • Waters et al. 1991: Fylogeni baseret på SSU rRNA, NJ. P. falciparum er opstået ved spring fra fuglevært til menneskelig vært. • Quari et al. 1996: Fylogeni baseret på SSU rRNA, ML. Pattedyrsparasitter er evolutionært adskilt fra fugle/krybdyr-parasitter. P.falciparum og P. reichenowi (chimpanse) er søstergrupper og evolutionært adskilt fra resten af pattedyrsparasitterne • Perkins & Schall 2002: Fylogeni baseret på cytochrom b,MP og ML. Samme konklusion som Quari et al.
Hvad understøtter vores resultater? • MP-træet: Meget rodet, generelt parafyletiske arter. Støtter teori om spring fra fugl til menneske. Fastholder dog søstergruppeforholdet ml. P. falciparum og P. Reichenowi. • NJ- og MP-træerne: Støtter teorien om adskillelse ml. krybdyr/fugleparasitterne og pattedyrsparasitterne. P. falciparum og P. reichenowi er søstergrupper og evolutionært adskilt fra resten af pattedyrsparasitterne.