400 likes | 537 Views
Stage au LIRMM (Montpellier). Sous la direction d’Olivier Gascuel et de Denis Bertrand. juin/août 2004. Propriétés topologiques des arbres de duplication. http://philippe.gambette.free.fr/LIRMM. Plan. Le processus de duplication en tandem.
E N D
Stage au LIRMM (Montpellier) Sous la direction d’Olivier Gascuel et de Denis Bertrand juin/août 2004 Propriétés topologiques des arbres de duplication http://philippe.gambette.free.fr/LIRMM
Plan Le processus de duplication en tandem Sa modélisation : l’arbre de duplication, un arbre phylogénétique particulier Suppression d’une feuille dans un arbre de duplication Réarrangements topologiques dans un arbre de duplication Conclusion sur les résultats trouvés
La recombinaison inégale chromatine condensée cytoplasme noyau Avant la méiose : ADN du père ADN de la mère
La recombinaison inégale noyau Prophase I : cytoplasme chromosome venant du père chromosome venant de la mère
La recombinaison inégale noyau Prophase I : cytoplasme chromosome venant du père chromosome venant de la mère
La recombinaison inégale noyau Prophase I : cytoplasme chromosome venant du père chromosome venant de la mère
La recombinaison inégale noyau Prophase I : cytoplasme chromosome venant du père chromosome venant de la mère
La recombinaison inégale noyau Prophase I, recombinaison inégale : cytoplasme chromosome venant du père chromosome venant de la mère
L’histoire de duplication (duplication simple) segment dupliqué en tandem ...CATTGATTG…CATTGAGCTATGACCTATGATTC segment dupliqué en tandem 1 2 …CATTGAGCTATGATTG…CATTGACCTATGATTC
L’histoire de duplication (duplication multiple) 1 2 ...CATTGATTC...CATTGAGTATGACCTATGAGCTATGACCTATTGATAC ...CATTGAGTATGACCTATGATTC...CATTGAGCTATGACCTATTGATAC 3 4 1 2 3 4 On a la séquence finale, on veut retrouver l’histoire des duplications.
Retrouver l’histoire de duplication 1 CATTGAGTATGACCTATGAGCTATGACCTATTGATAC 2a 1 a 1 : GAG TAT 2 : GACCTAT 3 : GAGCTAT 4 : GACCTATT 4 2c 2b 1’ 2’ 3 2 1 2 3 4 On a la séquence finale, on veut retrouver l’histoire des duplications : 1- Détecter les motifs répétés. 2- Aligner tous les motifs pour en réaliser un arbre phylogénétique afin d’en déduire un arbre de duplication qui modélise l’histoire de duplication. CATTGAGTATGACCTATGAGCTATGACCTATTGATAC travail du biologiste alignement multiple de séquences déduction de l’arbre de duplication construction de phylogénie
Qu’est-ce qu’un arbre phylogénétique ? c a b d Il présente les relations de parenté entre être vivants. L’abeille est génétiquementplus proche de la moucheque du singe. abeille mouche rat singe homme On peut les construire grâce à des algorithmes gloutons optimisant les paramètres suivants : - distance - maximum de vraisemblance - parcimonie (minimiser le nombre de transformations élémentaires)
Reconstruire un arbre phylogénétique (distance) f1 f1 f1 f4 f4 f1,4 f1,4 f5 f5 f2 f1,3,4 f3 f2 f3 f3 f3 f5 f2 On connaît la matrice des distances entre tout couple de feuille (fi,fj). En partant d’un arbre en étoile, on regroupe progressivement en des consensus les feuilles les plus proches pour construire l’arbre. L’arbre obtenu n’est pas enraciné
Reconstruire un arbre phylogénétique L’arbre phylogénétique obtenu peut être amélioré par des réarrangements locaux : - NNI (Nearest Neighbor Exchange, permettent d’explorer l’espace des phylogénies) NNI - SPR (Subtree Pruning and Regrafting) SPR Peut-on faire de même pour les arbres de duplication ?
Qu’est-ce qu’un arbre de duplication ? C’est un arbre phylogénétique dont les feuilles sont des gènes dupliqués en tandem.Les feuilles sont donc ordonnées. Tout arbre phylogénétique n’est donc pas un arbre de duplication.On peut les déduire d’alignements multiples grâce à des méthodes similaires à celles sur les phylogénies. On obtient des arbres de duplication enracinés ou non. Les arbres de duplication ne permettent pas de modéliser les délétions.
La recombinaison inégale : duplication simple segment dupliqué en tandem …CATTGAGCTATGATTG...CATTGACCTATGATTC ...CATTGATTG…CATTGAGCTATGACCTATGATTC segment dupliqué en tandem 1 2 a 1 2 arbre de duplicationenraciné (1-RDT)
La recombinaison inégale : duplication multiple ...CATTGATTC...CATTGAGCTATGACCTATGAGCTATGACCTATGATAC ...CATTGAGCTATGACCTATGATTC...CATTGAGCTATGACCTATGATAC 1 2 1 a 4 3 4 1 2 3 4 1’ 2’ 3 2 1 2 3 4 arbre de duplicationenraciné (RDT) arbre de duplicationnon enraciné (DT)
Définition d’un arbre de duplication (RDT) c e r T 3 6 a 5 8 événement deduplication multiple événement deduplication simple g d b c e d 1 2 g 4 7 1 2 3 4 5 6 7 8 O=(1,2,3,4,5,6,7,8) Soit T, un arbre, et O un ordre sur ses feuilles. Si f1 et f2 sont deux feuilles de T, et n un nœud de T, alors (f1,n,f2) est une cerise de T. C(T) est l’ensemble des cerises de T. Si f1 et f2 sont adjacentes, on note f1f2.
Définition d’un arbre de duplication (RDT) r r T’ T agglomération de (c,d,e) a a b g b c e d g 1 2 c d e O’=(1,2,c,d,e) 4 7 1 2 3 5 6 8 O=(1,2,3,4,5,6,7,8) (T’,O’) est un arbre de duplication enraciné (RDT) de racine r si :- (T’,O’) contient uniquement rou- il existe dans C(T) une série de cerises (gi,ui,di), (gi+1,ui+1,di+1), ... , (gk,uk,dk) avec ki et gigi+1...gkdidi+1...dk dans O, telle que (T',O') soit un arbre de duplication de racine r, où T' est obtenu à partir de T en enlevant gi, gi+1,...,gk,di,di+1,...,dk, et O' est obtenu en remplaçant (gi, gi+1,..., gk,di,di+1,...,dk) par (ui,ui+1,...,uk) dans O.
Suppression d’une feuille dans un 1-RDT r r r r r r r r a a a a a a a b b b b b b c d e c d e c d e c d e c d e 9 5 6 7 8 9 10 11 1 2 h 6 4 5 11 9 8 7 i 2 7 1 h 11 10 8 3 1 1 10 11 9 j i 2 1 9 2 i j 10 1 f e 11 10 h e b e d c 1 b f f f f i j j h i j 1-RDT : On garde un arbre de duplication après suppression La feuille est dite supprimable. suppression de la feuille 1
Suppression d’une feuille dans un 1-RDT r r r r r r r suppression de la feuille 1 b b b b b c d e c d e c d e c d e b c d e f d e i j 9 10 11 f 2 i 10 10 11 h 2 i 7 9 j c 9 e 5 11 h 2 5 6 7 8 b 10 10 4 9 9 11 3 11 2 8 6 7 h 8 f f i j j f h i j 1-RDT : On garde un arbre de duplication après suppression La feuille est dite supprimable. L’arbre obtenu est l’arbre de départ dans lequel on a supprimé la feuille 1
Suppression d’une feuille f dans un RDT Cas 1 : f n'est pas issue de duplication multiplef est supprimable. suppression de f a p’ p c u a u c p’ b p a u p’ a b u p’ 2 3 2 6 3 4 2 4 1 5 6 6 4 5 6 1 2 3 4 5 1 5 Cas 2 : f est feuille centrale issue de duplication multiplef est supprimable. suppression de f 6 cas se présentent :
Suppression d’une feuille f dans un RDT Cas 3 : f est feuille interne issue de duplication multiplef n’est pas supprimable. suppression de f a p’ u b p a b u a p u b p’ a u b p’ p’ 3 3 1 6 3 4 2 4 1 5 6 1 4 5 6 1 2 3 4 5 6 2 5 Cas 4 : f est une feuille extrême issue de duplication multiple, et u n'est pas adjacent possible d'une feuille extrême issue de cette duplication f n’est pas supprimable. suppression de f
Suppression d’une feuille f dans un RDT Cas 5 : f est une feuille extrême issue de duplication multiple, et u est adjacent possible d'une feuille extrême issue de cette duplication, et p est supprimable f estsupprimable. suppression de f u p b a u b a p’ a p’ d c p’ b a d c p’ b p 1 2 3 0 2 6 6 5 4 6 1 4 1 1 6 3 5 0 4 2 2 4 5 5 Cas 6 : f est une feuille extrême issue de duplication multiple, et u n'est pas adjacent possible d'une feuille extrême issue de cette duplication f n’est pas supprimable. suppression de f
Suppression d’une feuille f d’un RDT pourcentage d’arbres qui perdent leur caractère de duplication 30 26,6 20 15 10 5 0 4 10 20 30 40 50 60 nombre de feuilles Proportion d'arbres qui perdent le caractère de duplication, en fonction du nombre de feuilles , ou de la feuille supprimée pourcentage d’arbres qui perdent leur caractère de duplication 45 40 35 30 26,6 20 15 0 50 100 150 200 250 300 feuille supprimée
Suppression d’une feuille f d’un RDT 100 feuilles100 feuilles100 feuilles24 feuilles18 feuilles12 feuilles10 feuilles8 feuilles Cas 1 Cas 2 Cas 5 Cas 3 Cas 4 Cas 6 Proportion des feuilles dans chaque cas Le modèle est donc relativement robuste, avec 3/4 des arbres qui restent de duplication. On a besoin de vérifier les conditions de délétions sur le père pour seulement 8% des feuilles.
Suppression d’un sous-arbre dans un RDT T T’ suppression du sous-arbre si si ui ui r si si r Ti T’k agglomérations agglomérations suppression de ren tant que feuille Soit (T,O), un arbre de duplication enraciné.Soit r, la racine du sous-arbre à supprimer dans cet arbre.L'arbre (T',O') résultant de la suppression du sous-arbre de racine r dans (T,O) est un arbre de duplication une des trois conditions de délétion est vérifiée.
Les réarrangements topologiques SPR (Subtree Pruning and Regrafting) y (T,O) x x SPR(r,(x,y),(T,O)) r y r Le SPR est valide si l’arbre résultant du SPR est un arbre de duplication. Les SPR valides permettent d’explorer l’espace des RDT.
SPR sur un sous-arbre Soit (T,O) un arbre de duplication. L'arbre d'agglomération minimale pour r et (T,O) est l'arbre obtenu après un minimum d'agglomérations dans lequel r est feuille. Soient r, x et y des sommets de T, et (Ti,Oi), l'arbre d'agglomération minimale pour r et (T,O). SPR(r,(x,y),(T,O)) est valide si et seulement si SPR(r,(x,y),(Ti,Oi)) est valide. Il suffit de donc d’étudier les SPR sur les feuilles !
Une déception e f b c d b a f e p d a 2 7 1 5 4 3 1 6 6 3 4 5 7 2 Un SPR peut être valide bien que la feuille concernée ne soit pas supprimable... SPR(2,(f,4),(T,O))
Divers SPR SPR 1 T T’ SPR1 SPR 2 T’’ T’ T SPR1 SPR1 un u1 x p p x u1 y un y x x x x u2 x u2 f d1 y p’ y p p’ f y p y f p’ f y d2 f g2 dn d1 g2 v dn g1 d2 g1 f v v f SPR 3 T T’ SPR3
Divers SPR SPR 4 T T’ SPR4 x x un u2 x u1 p x u2 u2 p un u1 y un y u2 un d2 av dn av v v dn f g2 af dn d2 gn f g2 d2 af gn av g1 av y g1 dn d2 y af af f v v f SPR 5 T T’ SPR5
Bilan quantitatif sur les SPR SPR 1 SPR 2 SPR 3 SPR 4 SPR 5 SPR validesnon reconnus SPR non valides Proportion des SPR dans chaque cas
Conclusion Les résultats sur les feuilles sont intéressants sur la proportion d’arbres corrects, mais doivent être complétés par des analyses biologiques d’arbres de duplication vérifiés, puisque les arbres de duplications observés contiennent moins de duplications multiples qu’en théorie. Les conditions de suppression des feuilles sont plus complexes qu’espérées, l’obligation de vérifier les conditions sur les ancêtres notamment. Les SPR identifiés ne couvrent pas une grande portion de l’espace des SPR, et sont trop compliqués pour être utiles.
Annexe : Montpellier Le Peyrou et le Château d’Eau
Annexe : Montpellier L’Arc de Triomphe à la sortie du Peyrou
Annexe : Montpellier Immeuble habité par Guyslain Naves dans sa jeunesse L’aqueduc
Annexe : Montpellier La Faculté de Médecine
Annexe : Montpellier La Préfecture, face à un magasin Gibert