1 / 23

Réunion GDR Arsenic du 30/03/2005 - Institut Pasteur

Réunion GDR Arsenic du 30/03/2005 - Institut Pasteur. Activités et projets de l’équipe A telier de G énomique C omparative. Rôle de l’Atelier de Génomique Comparative au sein du GDR Arsenic. Resp. Claudine Médigue. Ingénieurs :. Thèses :. Post-doctorants :. Laurent Labarre.

lavender
Download Presentation

Réunion GDR Arsenic du 30/03/2005 - Institut Pasteur

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Réunion GDR Arsenic du 30/03/2005 - Institut Pasteur Activités et projets de l’équipe Atelier de Génomique Comparative Rôle de l’Atelier de Génomique Comparative au sein du GDR Arsenic Resp. Claudine Médigue • Ingénieurs : • Thèses : • Post-doctorants : • Laurent Labarre • Zoé Rouy • Stéphane Cruveiller • Géraldine Pascal • Aurélie Lajus • Stéphanie Bocs • David Vallenet • Stagiaire : (Etudiant Chinois en thèse courant 2005) • Catherine Devaud

  2. Développements de bases de données • Base multigénomes PkGDB (Prokaryotic Genome DataBase) • Bases thématiques pour des projets de (ré)-annotation • Bases de connaissances (plateforme de génomique exploratoire Genostar) • Applications biologiques • (Ré)-Annotation de génomes bactériens Thématiques de l’équipe AGC • Génomique comparative : régions conservées et/ou spécifiques, fusions de gènes, voies métaboliques. • Composition en codons et en acides aminés des séquences bactériennes. • Développements méthodologiques : • Méthodes (Langage C, Perl) et Stratégies d’analyse (Java) • Interfaces graphiques (Langages PHP, HTML) • Serveurs Web

  3. Génomes complets(Refseq NCBI) • Intégration dans PkGDB Homogénéité des données Gestion des ‘frameshifts’ • Ré-annotation syntaxique Complétion /correction des données • Génomes nouveaux(projets d’annotation) • Résultats d’analyses : PkGDB : Procaryotic Genome DataBase • Intrinsèques : gènes, signaux, répétitions,… • Extrinsèques : Blast, InterPro, COG, synténies … Objectif : données d’annotation ‘propres’, cohérentes, à la source des méthodologies de génomique comparative • SGBD relationnel (MySQL)

  4. Modèle relationnel Modèle objet AROM (java) Class IV (256) Class III (397) PkGDB AFC Clustering Class II (1551) Class I (1791) http://www.genoscope.cns.fr/agc/tools/micheck/html/database_status.html AMIMat : analyse de l’usage des codons des génomes bactériens Objectif : caractériser des groupes de gènes homogènes dans l’usage des codons au sein d’un génome bactérien.

  5. Class IV (256) Class III (397) Class II (1551) Heuristique de sélection des CDSs les plus probables Class I (1791) start stop + + Patterns starts/stops + RBS (RBS-Finder) P(X/X1...Xk) Matrice(s) de transitions Chevauchements Inclusions, … phase 1 phase 2 w phase 3 GeneMark http://www.genoscope.cns.fr/agc/tools/amigene AMIGene : prédiction de gènes codants bactériens Bocs et al. (2003)AMIGene: Annotation of MIcrobial Genes. Nucleic Acids Research, 31, 3723-3726. Objectif : Détecter les gènes de composition atypique et les petits gènes

  6. Fichier EMBL ou GenBank Séq. nucl Annotations Calcul de la probabilité moyenne de codage + Modèle(s) de gènes COMPARAISON Gènes annotés CDS prédites Position des codons stop CDS UNIQUES AMIGene CDS UNIQUES Banques CDS communes http://www.genoscope.cns.fr/agc/tools/micheck MICheck : ré-annotation (syntaxique) de génomes bactériens Cruveiller et al. (2005)MICheck : A Web tool to fast check annotations of bacterial genomes. Nucleic Acid Research (en révision) Objectif : Vérifier rapidement si les annotations répertoriées dans les banques de séquences pour un génome donné sont complètes.

  7. A Synteny Group #2 Synteny Group #1 B Rearrangement Fusion Duplication Insertion Inversion http://www.genoscope.cns.fr/agc/tools/syntonizer Syntonizer : Groupes de synténies dans les génomes bactériens Labarre et al. Syntonizer: an interactive Web tool for identifying bacterial synteny group using multiple correspondences.(soumis BMC Bioinf.). Objectif : Détecter des groupes de gènes ‘localement’ conserver dans les génomes bactériens.

  8. PkGDB MySQL DB tRNAscan-SE Blast Bacillus Scope Yersinia Scope ColiScope PRIAM COGnitor InterProScan TMHMM FrankiaDB AcinetoDB HaloplanktisDB «Auto- FAssign» Databases for re-annotation and annotation projects Automatic functional assignment combining multiple evidence and synteny results GRAPHICAL ANNOTATION INTERFACE (Web server connected to the data base) MaGe : plateforme d’annotation de génomes bactériens • Validation and completion of the automatic annotation • User friendly and adaptable annotator editor • (Re) Annotation using synteny results Vallenet et al. MaGe - a microbial genome annotation system supported by synteny results. (en préparation)

  9. Connection à MaGe http://www.genoscope.cns.fr/agc/mage/project _name • Bacterial annotation projects in progress : Login name and password are required. • Available re-annotation and annotation projects : project _name = AcinetoScope (Acinetobacter sp. ADP1) = BacillusScope (Bacillus species) = YersiniaScope (Yersinia species)

  10. Projet MicroScope (ACI IMPBio 2004) • Développement et maintenance des bases thématiques • Analyse complète d’un génome nouvellement séquencé • Recherche de synténies avec l’ensemble des procaryotes complets • Métabolisme bactérien: Connection à KEGG + construction de la base BioCyc (P. Karp) • Mise à la disposition des données via l’interface MaGe • Optimisation de l’architecture des bases et des ressources machines (Equipe informatique de Claude Scarpelli) • Gestion efficace des mises à jour des données (avancée du “Finishing”/update des banques de séquence) • Formation et suivit des utilisateurs (outils d’annotation et interface MaGe) • Aujourd’hui : 12 projets en cours + 2 en préparation Bases de données thématiques pour l’annotation/ré-annotation de génomes bactériens

  11. Bactéries de l’environnement et symbiotes de plantes Séquençage Bactérie(s) Collaborateurs BD P. Marlière (Evologic) & N. Orlston (Yale U., USA) Acinetobacter ADP1 Genoscope AcinetoScope Environnement (sol) Environnement (métabolise l’N) Kuenenia stuttgartiensis M Jetten (Univ. Nijmegen, Holl.) AnnamoScope Genoscope Genoscope Pseudomonas haloplanktis A. Danchin (IP, Paris) PsychroScope Environnement (antartique) Frankia alni Genoscope P. Normand (Lyon) FrankiaScope Symbiote de plantes Frankia sp. CcI3 D. Benson (Univ. Connecticut, USA) DOE JGI Frankia sp. EAN1 Microflore de la station d’épuration des eaux d’Evry D. Le Paslier & A. Sghir (Genoscope, Evry) CloacaScope Métagénomes Genoscope Cenibacterium arsenoxidans Environnement (Métabolise l’arsenic) P. Bertin (ULP, Strasbourg) Consortium GDR Arsenic ArseniScope Genoscope Thiomonas spp. Bradyrhizobium sp. ORS278 BradyrhizoScope E. Giraud (LSTM, Montpellier) Genoscope Symbiote de plantes

  12. Taille génome : 3424 326 pb %GC = 54.3 % • Les gènes de RNA • 45 tRNA au total, tous les acides aminés sont représentés • 2 clusters de rRNA : 16S 23S 5S, au début du génome 3376 CDSs annotées • Les gènes de protéines : 36.8% «definitive assignment» - fonctions «connues» : 2127 / 63 % - conserved hypothetical : 607 / 18 % - hypothetical protein : 642 / 19 % 26.2% «putative assignment» • Parmi les similarités « significatives » : • - Regulators : 136 / 4 % • Transports : 191 / 5.7 % • DNA replication, recombinaison, • modification and repair : 89 / 2.4 % • Related to phage,transposase : 51 / 1.5 % • Reductases : 93 / 2.8 % Caractéristiques générales du génome de C. arsenoxidans - Resistance : 40 / 1.2% (Arsenic, Cobalt-zinc-cadmium, Copper, multidrug,…)

  13. Groupes de synténies entre C. arsenoxydans et quelques génomes

  14. Synténies et voies métaboliques folC asd truA leuD trpA leuB trpB accD leuC trpF CENAR1163

  15. Synténie S. oneidensis et C. arsenoxydans

  16. 6.3.2.12 1.1.1.85 4.2.1.20 6.4.1.2 1.2.1.33 5.3.1.24 Synténies et voies métaboliques folC asd truA leuD trpA leuB trpB accD leuC trpF CENAR1163

  17. Connectivité à la base métabolique KEGG Enzymes encoded by genes in the MaGe region Enzymes encoded by genes elsewhere in the C. arsenoxydans genome Additional enzymes in E. coli

  18. Editeur d’annotation de MaGe (partiel)

  19. Lien MaGe - Bases de données BioCyc (P. Karp)

  20. Voie de biosynthèse de la Leucine chez C. arsenoxydans

  21. Reconstitution des voies métaboliques chez C. arsenoxydans Show Pathway Report Show Pathway Hole Report

  22. Résistance à l’arsenic … Arsenical pump arsC-like arsB arsC atoC ABC transporters (pts) 2-component reg. syst arsR-like Arsenate reductase Acetoacetate metabolism aoxCBA Arsenical resistance lipoprotein Arsenite oxydase

  23. Assitance à l’annotation experte des génomes • Bases de données multigénomes • Organisation d’une formation à MaGe • Support continu aux annotateurs • Construction de bases GenoList (Antoine D., I. Moszer) • Interface d’interrogation et de navigation dans les bases thématiques multigénomes (PkGDB) • Métagénomique (arsenic) • Modification de MaGe pour la gestion et l’annotation de ‘métagénome’ • Création de catalogues de gènes et de familles de protéine Rôle de l’AGC dans le cadre du GDR arsenic • Construction de la base thématique ArseniScope: • Génomes de C. arsenoxydans et de Thiomonas spp. • Intégration à MaGe d’autres génomes très proches en cours de séquençage ? • Calculs des synténies et régions uniques • Mise en place des bases BioCyc

More Related