220 likes | 471 Views
Synténie bactérienne : aide pour l’annotation de Cenibacterium arsenoxydans. Laurent Labarre AGC - UMR 8030 - Génoscope. labarre@genoscope.cns.fr. Plan. Génomique comparative avec les mains Détection de groupes de synténie Détection de régions spécifiques Les synténies dans MaGe.
E N D
Synténie bactérienne : aide pour l’annotation deCenibacterium arsenoxydans Laurent Labarre AGC - UMR 8030 - Génoscope labarre@genoscope.cns.fr
Plan • Génomique comparative avec les mains • Détection de groupes de synténie • Détection de régions spécifiques • Les synténies dans MaGe
Régions conservées Comparaison de génomes éloignés Bacillus subtilis Escherichia coli k12
Région spécifique Comparaison de génomes proches Escherichia coli O157 H7 Escherichia coli k12
Génomique comparative : remarques • Aspect multi-génome • Comparaison toujours par rapport à … • Présence / absence de gènes • orthologie/paralogie/gènes spécifiques ? • correspondance fonctionnelle ? • Conservation de l’organisation des gènes • groupes de synténie, groupes de gènes spécifiques ? • couplage fonctionnel ?
Applications Familles de gènes "Universels" Similitude Attribution Fonctionnelle Contextuelle Opérons ? Régulation Transcriptionelle Voies Métaboliques La synténie : pourquoi ?
Synténie bactérienne : modélisation "co-localisation" Génome A "correspondance" Génome B "co-localisation" Nous utilisons le formalisme des graphes pour modéliser les groupes de synténie. Les gènes sont les nœuds du graphe et sont connectés par deux types d’arêtes : Relation de "correspondance" (inter génomes) principalement résultats de comparaisons de séquences (avec contraintes restrictives sur la similitude) mais aussi classifications fonctionnelles ou conservation de domaines protéiques Relation de "co-localisation" (intra génome) paramètre de gap qui autorise tous types de réarrangements => L’algorithme développé recherche les groupes de gènes (‘syntons’) qui vérifient ces deux relations.
Synténie bactérienne : modélisation Génome A Synton #1 Synton #2 gap <= 2 Génome B Réarrangement Inversion Insertion Duplication Fusion => Correspondances multiples, réarrangements et insertions autorisés
Synténie bactérienne : un exemple Cet exemple montre quels types de groupes de synténie peuvent être détectés. Le système de sécrétion de type III : On détecte aussi ce groupe de gènes chez Y. pseudotuberculosis, S. typhi, S. typhimurium et E. coli O157. Ce groupe n’a pas d’équivalent chez E coli
"co-localisation" Génome A "absence de correspondance" Génome B Régions spécifiques : modélisation Comme pour les synténies, nous utilisons les graphes pour modéliser les régions spécifiques avec deux types d’arêtes : Relation d’ "absence de correspondance" (inter génomes) représentée explicitement Relation de "co-localisation" (intra génome) paramètre de gap qui autorise les insertions => Détecter les régions spécifiques revient à rechercher les gènes qui vérifient ces deux relations (trivial)
gap <= 2 Région spécifique Génome A Insertion Génome B Régions spécifiques : modélisation => Insertions autorisés
Régions spécifiques : remarque "Orthologue putatif" Critère de correspondance inter-génomes ?! "Absence de correspondant" => Statuer sur l’absence de correspondance n’est pas simple !
Algorithme (2/2) 1 4 1 4 1 1 c1 c2 c3 c4 c5 c6 c7 c8 4 1 ccA1/ccB1 ccA2/ccB2 ccA1 ccA2 c4 c4 c4 c4 ccA2/ccB3 c1 c1 c1 c1 c2 c2 c2 c2 c3 c3 c3 c3 c5 c5 c5 c5 c6 c6 c6 c6 c7 c7 c7 c7 c8 c8 c8 c8 gap <= 1 2 2 ccB1 ccB2 ccB3 2 2 2 2 => Raffinement de partition de l’ensemble des couples de gènes correspondant suivant leur co-localisation sur les deux génomes
Les synténies dans Mage • Représentation cartographique • Détails de syntons • Recoupement de synténies
Le Syntonizer • Un outil dédié au calcul et à l’exploration des synténies bactériennes • Calcul dynamique • Différents types de correspondances (Blast, COG, EC, Pfam)