1 / 39

Stage au LIRMM (Montpellier)

Stage au LIRMM (Montpellier). Sous la direction d’Olivier Gascuel et de Denis Bertrand. juin/août 2004. Propriétés topologiques des arbres de duplication. http://philippe.gambette.free.fr/LIRMM. Plan.  Le processus de duplication en tandem.

paley
Download Presentation

Stage au LIRMM (Montpellier)

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Stage au LIRMM (Montpellier) Sous la direction d’Olivier Gascuel et de Denis Bertrand juin/août 2004 Propriétés topologiques des arbres de duplication http://philippe.gambette.free.fr/LIRMM

  2. Plan Le processus de duplication en tandem Sa modélisation : l’arbre de duplication, un arbre phylogénétique particulier  Suppression d’une feuille dans un arbre de duplication  Réarrangements topologiques dans un arbre de duplication  Conclusion sur les résultats trouvés

  3. La recombinaison inégale chromatine condensée cytoplasme noyau Avant la méiose : ADN du père ADN de la mère

  4. La recombinaison inégale noyau Prophase I : cytoplasme chromosome venant du père chromosome venant de la mère

  5. La recombinaison inégale noyau Prophase I : cytoplasme chromosome venant du père chromosome venant de la mère

  6. La recombinaison inégale noyau Prophase I : cytoplasme chromosome venant du père chromosome venant de la mère

  7. La recombinaison inégale noyau Prophase I : cytoplasme chromosome venant du père chromosome venant de la mère

  8. La recombinaison inégale noyau Prophase I, recombinaison inégale : cytoplasme chromosome venant du père chromosome venant de la mère

  9. L’histoire de duplication (duplication simple) segment dupliqué en tandem ...CATTGATTG…CATTGAGCTATGACCTATGATTC segment dupliqué en tandem 1 2 …CATTGAGCTATGATTG…CATTGACCTATGATTC

  10. L’histoire de duplication (duplication multiple) 1 2 ...CATTGATTC...CATTGAGTATGACCTATGAGCTATGACCTATTGATAC ...CATTGAGTATGACCTATGATTC...CATTGAGCTATGACCTATTGATAC 3 4 1 2 3 4 On a la séquence finale, on veut retrouver l’histoire des duplications.

  11. Retrouver l’histoire de duplication 1 CATTGAGTATGACCTATGAGCTATGACCTATTGATAC 2a 1 a 1 : GAG TAT 2 : GACCTAT 3 : GAGCTAT 4 : GACCTATT 4 2c 2b 1’ 2’ 3 2 1 2 3 4 On a la séquence finale, on veut retrouver l’histoire des duplications : 1- Détecter les motifs répétés. 2- Aligner tous les motifs pour en réaliser un arbre phylogénétique afin d’en déduire un arbre de duplication qui modélise l’histoire de duplication. CATTGAGTATGACCTATGAGCTATGACCTATTGATAC travail du biologiste alignement multiple de séquences déduction de l’arbre de duplication construction de phylogénie

  12. Qu’est-ce qu’un arbre phylogénétique ? c a b d Il présente les relations de parenté entre être vivants. L’abeille est génétiquementplus proche de la moucheque du singe. abeille mouche rat singe homme On peut les construire grâce à des algorithmes gloutons optimisant les paramètres suivants : - distance - maximum de vraisemblance - parcimonie (minimiser le nombre de transformations élémentaires)

  13. Reconstruire un arbre phylogénétique (distance) f1 f1 f1 f4 f4 f1,4 f1,4 f5 f5 f2 f1,3,4 f3 f2 f3 f3 f3 f5 f2 On connaît la matrice des distances entre tout couple de feuille (fi,fj). En partant d’un arbre en étoile, on regroupe progressivement en des consensus les feuilles les plus proches pour construire l’arbre. L’arbre obtenu n’est pas enraciné

  14. Reconstruire un arbre phylogénétique L’arbre phylogénétique obtenu peut être amélioré par des réarrangements locaux : - NNI (Nearest Neighbor Exchange, permettent d’explorer l’espace des phylogénies) NNI - SPR (Subtree Pruning and Regrafting) SPR Peut-on faire de même pour les arbres de duplication ?

  15. Qu’est-ce qu’un arbre de duplication ? C’est un arbre phylogénétique dont les feuilles sont des gènes dupliqués en tandem.Les feuilles sont donc ordonnées. Tout arbre phylogénétique n’est donc pas un arbre de duplication.On peut les déduire d’alignements multiples grâce à des méthodes similaires à celles sur les phylogénies. On obtient des arbres de duplication enracinés ou non. Les arbres de duplication ne permettent pas de modéliser les délétions.

  16. La recombinaison inégale : duplication simple segment dupliqué en tandem …CATTGAGCTATGATTG...CATTGACCTATGATTC ...CATTGATTG…CATTGAGCTATGACCTATGATTC segment dupliqué en tandem 1 2 a 1 2 arbre de duplicationenraciné (1-RDT)

  17. La recombinaison inégale : duplication multiple ...CATTGATTC...CATTGAGCTATGACCTATGAGCTATGACCTATGATAC ...CATTGAGCTATGACCTATGATTC...CATTGAGCTATGACCTATGATAC 1 2 1 a 4 3 4 1 2 3 4 1’ 2’ 3 2 1 2 3 4 arbre de duplicationenraciné (RDT) arbre de duplicationnon enraciné (DT)

  18. Définition d’un arbre de duplication (RDT) c e r T 3 6 a 5 8 événement deduplication multiple événement deduplication simple g d b c e d 1 2 g 4 7 1 2 3 4 5 6 7 8 O=(1,2,3,4,5,6,7,8) Soit T, un arbre, et O un ordre sur ses feuilles. Si f1 et f2 sont deux feuilles de T, et n un nœud de T, alors (f1,n,f2) est une cerise de T. C(T) est l’ensemble des cerises de T. Si f1 et f2 sont adjacentes, on note f1f2.

  19. Définition d’un arbre de duplication (RDT) r r T’ T agglomération de (c,d,e) a a b g b c e d g 1 2 c d e O’=(1,2,c,d,e) 4 7 1 2 3 5 6 8 O=(1,2,3,4,5,6,7,8) (T’,O’) est un arbre de duplication enraciné (RDT) de racine r si :- (T’,O’) contient uniquement rou- il existe dans C(T) une série de cerises (gi,ui,di), (gi+1,ui+1,di+1), ... , (gk,uk,dk) avec ki et gigi+1...gkdidi+1...dk dans O, telle que (T',O') soit un arbre de duplication de racine r, où T' est obtenu à partir de T en enlevant gi, gi+1,...,gk,di,di+1,...,dk, et O' est obtenu en remplaçant (gi, gi+1,..., gk,di,di+1,...,dk) par (ui,ui+1,...,uk) dans O.

  20. Suppression d’une feuille dans un 1-RDT r r r r r r r r a a a a a a a b b b b b b c d e c d e c d e c d e c d e 9 5 6 7 8 9 10 11 1 2 h 6 4 5 11 9 8 7 i 2 7 1 h 11 10 8 3 1 1 10 11 9 j i 2 1 9 2 i j 10 1 f e 11 10 h e b e d c 1 b f f f f i j j h i j 1-RDT : On garde un arbre de duplication après suppression La feuille est dite supprimable. suppression de la feuille 1

  21. Suppression d’une feuille dans un 1-RDT r r r r r r r suppression de la feuille 1 b b b b b c d e c d e c d e c d e b c d e f d e i j 9 10 11 f 2 i 10 10 11 h 2 i 7 9 j c 9 e 5 11 h 2 5 6 7 8 b 10 10 4 9 9 11 3 11 2 8 6 7 h 8 f f i j j f h i j 1-RDT : On garde un arbre de duplication après suppression La feuille est dite supprimable. L’arbre obtenu est l’arbre de départ dans lequel on a supprimé la feuille 1

  22. Suppression d’une feuille f dans un RDT Cas 1 : f n'est pas issue de duplication multiplef est supprimable. suppression de f a p’ p c u a u c p’ b p a u p’ a b u p’ 2 3 2 6 3 4 2 4 1 5 6 6 4 5 6 1 2 3 4 5 1 5 Cas 2 : f est feuille centrale issue de duplication multiplef est supprimable. suppression de f 6 cas se présentent :

  23. Suppression d’une feuille f dans un RDT Cas 3 : f est feuille interne issue de duplication multiplef n’est pas supprimable. suppression de f a p’ u b p a b u a p u b p’ a u b p’ p’ 3 3 1 6 3 4 2 4 1 5 6 1 4 5 6 1 2 3 4 5 6 2 5 Cas 4 : f est une feuille extrême issue de duplication multiple, et u n'est pas adjacent possible d'une feuille extrême issue de cette duplication f n’est pas supprimable. suppression de f

  24. Suppression d’une feuille f dans un RDT Cas 5 : f est une feuille extrême issue de duplication multiple, et u est adjacent possible d'une feuille extrême issue de cette duplication, et p est supprimable f estsupprimable. suppression de f u p b a u b a p’ a p’ d c p’ b a d c p’ b p 1 2 3 0 2 6 6 5 4 6 1 4 1 1 6 3 5 0 4 2 2 4 5 5 Cas 6 : f est une feuille extrême issue de duplication multiple, et u n'est pas adjacent possible d'une feuille extrême issue de cette duplication f n’est pas supprimable. suppression de f

  25. Suppression d’une feuille f d’un RDT pourcentage d’arbres qui perdent leur caractère de duplication 30 26,6 20 15 10 5 0 4 10 20 30 40 50 60 nombre de feuilles Proportion d'arbres qui perdent le caractère de duplication, en fonction du nombre de feuilles , ou de la feuille supprimée  pourcentage d’arbres qui perdent leur caractère de duplication 45 40 35 30 26,6 20 15 0 50 100 150 200 250 300 feuille supprimée

  26. Suppression d’une feuille f d’un RDT 100 feuilles100 feuilles100 feuilles24 feuilles18 feuilles12 feuilles10 feuilles8 feuilles Cas 1 Cas 2 Cas 5 Cas 3 Cas 4 Cas 6 Proportion des feuilles dans chaque cas Le modèle est donc relativement robuste, avec 3/4 des arbres qui restent de duplication. On a besoin de vérifier les conditions de délétions sur le père pour seulement 8% des feuilles.

  27. Suppression d’un sous-arbre dans un RDT T T’ suppression du sous-arbre si si ui ui r si si r Ti T’k agglomérations agglomérations suppression de ren tant que feuille Soit (T,O), un arbre de duplication enraciné.Soit r, la racine du sous-arbre à supprimer dans cet arbre.L'arbre (T',O') résultant de la suppression du sous-arbre de racine r dans (T,O) est un arbre de duplication  une des trois conditions de délétion est vérifiée.

  28. Les réarrangements topologiques SPR (Subtree Pruning and Regrafting) y (T,O) x x SPR(r,(x,y),(T,O)) r y r Le SPR est valide si l’arbre résultant du SPR est un arbre de duplication. Les SPR valides permettent d’explorer l’espace des RDT.

  29. SPR sur un sous-arbre Soit (T,O) un arbre de duplication. L'arbre d'agglomération minimale pour r et (T,O) est l'arbre obtenu après un minimum d'agglomérations dans lequel r est feuille. Soient r, x et y des sommets de T, et (Ti,Oi), l'arbre d'agglomération minimale pour r et (T,O). SPR(r,(x,y),(T,O)) est valide si et seulement si SPR(r,(x,y),(Ti,Oi)) est valide. Il suffit de donc d’étudier les SPR sur les feuilles !

  30. Une déception e f b c d b a f e p d a 2 7 1 5 4 3 1 6 6 3 4 5 7 2 Un SPR peut être valide bien que la feuille concernée ne soit pas supprimable... SPR(2,(f,4),(T,O))

  31. Divers SPR SPR 1 T T’ SPR1 SPR 2 T’’ T’ T SPR1 SPR1 un u1 x p p x u1 y un y x x x x u2 x u2 f d1 y p’ y p p’ f y p y f p’ f y d2 f g2 dn d1 g2 v dn g1 d2 g1 f v v f SPR 3 T T’ SPR3

  32. Divers SPR SPR 4 T T’ SPR4 x x un u2 x u1 p x u2 u2 p un u1 y un y u2 un d2 av dn av v v dn f g2 af dn d2 gn f g2 d2 af gn av g1 av y g1 dn d2 y af af f v v f SPR 5 T T’ SPR5

  33. Bilan quantitatif sur les SPR SPR 1 SPR 2 SPR 3 SPR 4 SPR 5 SPR validesnon reconnus SPR non valides Proportion des SPR dans chaque cas

  34. Conclusion Les résultats sur les feuilles sont intéressants sur la proportion d’arbres corrects, mais doivent être complétés par des analyses biologiques d’arbres de duplication vérifiés, puisque les arbres de duplications observés contiennent moins de duplications multiples qu’en théorie. Les conditions de suppression des feuilles sont plus complexes qu’espérées, l’obligation de vérifier les conditions sur les ancêtres notamment. Les SPR identifiés ne couvrent pas une grande portion de l’espace des SPR, et sont trop compliqués pour être utiles.

  35. Annexe : Montpellier Le Peyrou et le Château d’Eau

  36. Annexe : Montpellier L’Arc de Triomphe à la sortie du Peyrou

  37. Annexe : Montpellier Immeuble habité par Guyslain Naves dans sa jeunesse L’aqueduc

  38. Annexe : Montpellier La Faculté de Médecine

  39. Annexe : Montpellier La Préfecture, face à un magasin Gibert

More Related