510 likes | 699 Views
LES CRISPRS, INSTRUMENTS D'ETUDE DE L'EVOLUTION INTER ET INTRA-SPÉCIFIQUE CHEZ LES MICROORGANISMES. Ibtissem GRISSA. Soutenance de thèse, le 24 Juin 2008, IGM. Introduction Résultats Discussion Perspectives. P LAN. Introduction : Les CRISPRs avant 2006 Etat des lieux But de la thèse
E N D
LES CRISPRS, INSTRUMENTS D'ETUDE DE L'EVOLUTION INTER ET INTRA-SPÉCIFIQUE CHEZ LES MICROORGANISMES Ibtissem GRISSA Soutenance de thèse, le 24 Juin 2008, IGM
Introduction • Résultats • Discussion • Perspectives PLAN Introduction : Les CRISPRs avant 2006 Etat des lieux But de la thèse Résultats Investigation des CRISPRs Le CRISPR pour la phylogénie Discussion Investigations du CRISPR Utilisation du CRISPR pour la phylogénie Perspectives Les metagenomes • Introduction : Les CRISPRs avant 2006 • Etat des lieux • But de la thèse • Résultats • Investigation des CRISPRs • Le CRISPR pour la phylogénie • Discussion • Investigations du CRISPR • Utilisation du CRISPR pour la phylogénie • Perspectives • Améliorer les outils • Les métagénomes
Introduction La découverte des CRISPRs (1) TTAGGGTTACGTCCCCCCCGATTCTTGTGACCCTCTTTTTATCACTATGACTAACGTATTGATTTTTATGCTACTCAGGTATTTCACTAAAAAAAGGGTTTTTACGCATTTTGCGCCATTGCTCATTGATAAACATCGGGTTATCCGTATTATCTTACGTTCACTGCCGCACAGGCAGCTTAGAAAATGTTCGACGATTTATTTTATTTGTATTTCAGGTTCACTGCCGCACAGGCAGCTTAGAAAATTTATTAAAGATGCTGACAAAAAGAACTTAAGTTCACTGCCGCACAGGCAGCTTAGAAAGTCAACGCTTCACTCCCTGCGCGGGGTATAACGTTCACTGCCGCACAGGCAGCCCAATAA Yersinia pestis CO92 (NC_003143_2 ) DR dégénéré spacers Leader DR • 1ère observation : Escherichia coli (Ishino 1987) • succession de séquences répétées de 29pb espacées de séquences uniques de 32-33pb. • 2 locus séparés de 24 kb (14 et 7 répétitions)
Introduction La découverte des CRISPRs (2) 1991 : découverte d’un CRISPR dans le complexe Mycobacterium tuberculosis • Structure présente chez tous les membres du complexe M. tuberculosis • Marqueur génétique assez polymorphe pour différencier les souches • 1996 : Le spoligotypage pour le typage épidémiologique de M. tuberculosis (Membrane d’oligonuclétides composée de 43 spacers) • Obeservations chez les archées : • 2 Haloferax volcanii et H. mediterranei (Mojica et col. 1993, 1995) • Sulfolobus (She 1994)
Introduction L’acronyme CRISPR • CRISPR Clustered Regularly Interspaced Short Palindromic Repeat Jansen 2002 • TREP Tandem Repeat • SRSR Short Regularly Spaced Repeats • DVR Direct Variable Repeat • LCTRLong Cluster of Tandem Repeat • SPIDRSpacers Interspaced Direct Repeats • E. coli • DR : 29bp, spacer : 32-33pb • CGGTTTATCCCCGCTGGCGCGGGGAACTC • H. mediterranei et H. volcanii • DR : 30bp, spacer : 33-39pb • GTTACAGACGAACCCTAGTTGGGTTGAAGC • M. tuberculosis • DR : 36pb spacer : 35-41pb • GTCGTCAGACCCAAAACCCCGAGAGGGGACGGAAAC
Introduction Un groupe de gènes associés Le système CASS : CRISPR + cas DR dégénéré gènes cas spacers Leader DR Jansen 2002 • cas1 : réparation de l’ADN • cas2 : transposase • cas3 : hélicase • cas4 : recB exonuclease Makarova 2002 20 gènes impliqués dans la réparation de l’ADN • Etude phylogénétique des gènes cas • Présence du même DR chez des espèces éloignées Transfert horizontal
Introduction Transcription du locus CRISPR Tang et col. PNAS 2002 Identification of 86 candidates for small non-messenger RNAs from the archeon Archaeoglobus fulgidus.
Introduction Origine des spacers Acquisition du spacer à partir d’éléments génétiques préexistants d’origine extrachromosomique (phages, plasmides) ou chromosomique 2005 : origine des spacers et suggestions sur le rôle du CRISPR Pourcel 2005 Bolotin 2005 Mojica 2005 67 procaryotes Yersinia pestis Y. pseudotuberculosis Streptococcus pyogenes Streptococcus thermophilus S. vestibularis (Mojica 2005) • Corrélation avec la résistance aux phages Hypothèse : Le CRISPR est un système immunitaire chez les procaryotes utilisant l’interférence ARN
Introduction Un système de résistance par interférence ARN Modèle d’action du CRISPR Leader sp4 sp3 sp2 sp1 DR DR’ Transcription ARN Cas Cas sRNA Protéines Cas Cas sRNA phage ADN invasif Dégradation du phage
Introduction Evolution de la structure CRISPR Acquisition polarisée adjacente à la séquence leader Perte interstitielle de spacers Les spacers communs renseignent sur un ancêtre commun ADN invasif Cas + Cas + Leader sp3 sp2 sp1 DR DR’ = Leader sp4 sp3 sp2 sp1 DR DR’ Le polymorphisme des spacers est un indicateur phylogénétique
Introduction Problématique Comprendre l’organisation de la structure CRISPR Comprendre l’origine et le rôle du CRISPR Comprendre le fonctionnement du CRISPR et son parcours évolutif Outil de génotypage : le CRISPR comme marqueur de microévolution? Transfert horizontal : détermination de la structure minimale transposée chez différentes bactéries Transposition des CRISPRs et des séquences adjacentes sur le même génome Outils informatiques pour faciliter l’exploration, la compréhension et l’utilisation des CRISPRs
PLAN Introduction : Les CRISPRs avant 2006 Etat des lieux jusqu’à fin 2005 But de la thèse Résultats Investigation des CRISPRs Le CRISPR pour la phylogénie Discussion Investigations du CRISPR Utilisation du CRISPR pour la phylogénie Perspectives Les metagenomes • Résultats • Introduction : Les CRISPRs avant 2006 • Etat des lieux • But de la thèse • Résultats • Investigation des CRISPRs • Le CRISPR pour la phylogénie • Discussion • Investigations du CRISPR • Utilisation du CRISPR pour la phylogénie • Perspectives • Les metagenomes
Introduction Outils informatiques créés Données Gold Oct. 2005 315 génomes complets 804 procaryotes en cours Analyse systématique de tous les CRISPRs des génomes séquencés Utilisation du CRISPR pour la phylogénie intra-espèce • Créer une base de données Analyser les séquences flanquantes Stocker les DR Stocker les spacers (tronçons de virus) Effectuer des BLAST • Analyse de la microévolution Comparaison des CRISPRs Identifier les spacers Construire un catalogue par espèce CRISPRdb CRISPRcompar Identifier les CRISPRs
Les programmes utilisés • Résultats Patscan p1=24...47 15...70 p1 • Programmes non spécifiques aux CRISPRs • Besoin de traitement manuel supplémentaire REPuter Repeat size Start position TRF Consensus pattern (60 bp): GTGTTCCCCGCGCATCGCGGGGGTTGAAGGGTCAGGTCTGCATCAACGATCGCCCACTCC • Besoin d’automatisation • Définition des limites du DR
Création de CRISPRFinder a A b c A d • Résultats CRISPRFinder Utilisation de Vmatch (Reputer) -Liste des répétitions maximales ayant une taille bien définie, séparées par des séquences de taille prédéfinie
CRISPRFinder : difficultés (1) • Résultats ! Y. pestis C092 Positions : 1773655-1773862 Les bornes du DR: DR consensus 29 pb La taille des spacers Clostridium botulinum A3 Positions : 131045- 131754 Entre 21 et 37 pb 30 pb
CRISPRFinder : difficultés (2) (2875721) TTATTGGGCTGCCTGTGCGGCAGTGAAC 1 GTTATACCCCGCGCAGGGAGTGAAGCGTTGAC 32 ** ** TTTCTAAGCTGCCTGTGCGGCAGTGAAC 2 TTAAGTTCTTTTTGTCAGCATCTTTAATAAA T 32 TTTCTAAGCTGCCTGTGCGGCAGTGAAC 3 CTGAAATACAAATAAAATAAATCGTCGAACAT 32 TTTCTAAGCTGCCTGTGCGGCAGTGAAC 4 (2875928) Sulfolobus tokodaii str. 7 (CRISPR_2) (32702) GATGAATCCCAAAAGGAATTGAAAG 7 TGATTGATCACAATGAGAAGACTGTAAAGCTGATAAAC 38 GATGAATCCCAAAAGGAATTGAAAG 8 TGTTGAGGCATAAATTAATCTATCCTTAATGAAAAAT 37 GATGAATCCCAAAAGGAATTGAAAG 9 TTCTTCCTCAGCCTCCATTTTGTTTATGATTTGTAGTGCC 40 GATGAATCCCAAAAGGAATTGAAAG 10 TTCAATAATCTCTATCTTTCCAAAATCTGTAAATGAAGAC 40 GATGAATCCCAAAAGGAATTGAAAG 109 AAAGCACAGTCAATAACGTTATCTGGTATCATATTATCAAA 41 GATGAATCCCAAAAGGAATTGAAAG 110 CTTTCT CCTTCCCTCTGATCTCTCGCTGAATTGAAAAGA 39 GATGAATCCCAAAAGGAATTGAAAG 111 GTAAGTATTGATGCTAACATTGACTTCGCTGTCCCAGGGGC 41 GATGAATCCCAAAAGGAATTGAAGG 112 AAGTATAATAACGATAGTACTAAAATTAATTGATCC 36 * * *** (39896) GATGATTCTCAAAAGGAATTGATAA 113 • Résultats Shewanella sp. ANA-3 (CRISPR_2) (4626121) AGGTTTTGCTGCCTTTTCGGCGGGTAT C 1 TCAAAGTCAACTTGTAAATGACGATTTTCACG 32 ******** ATTTTCAGCTGCCTATTCGGCAGGTCA C 2 AGTTTGGGGCTGAGTTTGCCATTTTCCTAAAT 32 ATTTTCAGCTGCCTATTCGGCAGGTCA C 3 GATGAAGCAGACCACCTCGATTACCCCACGCT 32 ATTTTCAGCTGCCTATTCGGCAGGTCA C 4 ACTATTTATCAAGACCTTCTTTAAAATCAAAC 32 ATTTTCAGCTGCCTATTCGGCAGGTCA C 5 AGTTTGGGGCTGAGTTTGCCATTTTCCTAAAC 32 ATTTTCAGCTGCCTATTCGGCAGGTCA C 6 (4626448) Yersinia pestis KIM (CRISPR_4) Le DR dégénéré
CRISPRFinder : difficultés (3) Alignement des leader • Résultats Les petits CRISPRs Aquifex aeolicus VF5 NC_000818_6, positions : 988518-988611
Les grandes étapes de CRISPRFinder DR Vérification de la structure [0.6DR - 2.5DR] DR’ DR DR [ , ] DR 23bp - 55bp • Résultats Sequence(s) Localisations possibles 25bp - 60bp DR DR 23bp - 55bp Répétition maximale ? Identification des DR candidats CRISPRs confirmés CRISPRs putatifs Elimination des Répétitions en tandem Vérification des DR aux extrémités
Création de la base CRISPRdb • Résultats Filtres ajoutés pour la base Télécharger les génomes complets sur le site NCBI ftp://ftp.ncbi.nih.gov/genomes/Bacteria Appliquer CRISPRFinder Filtres sur les CRISPRs putatifs Blast des DR et vérification de la terminaison Vérification de la taille des DR et spacers Vérification manuelle Validation
Bilan CRISPRdb • Résultats Mise à jour du 05/06/2008 • Des CRISPRs de un à presque 300 motifs de long (moyenne : 23) (22 pour les bactéries et 27 pour les archées) • Une espèce peut posséder jusqu’à 20 CRISPRs (Methanocaldococcus jannaschii) • 2 ou plusieurs CRISPRs de DR identiques ou différents • Les CRISPRs constituent presque 1% du génome qui les portent (1,1% chez Sulfolobus tokodaii) • Les souches d’une même espèce ne partagent pas toujours les mêmes CRISPRs
PLAN Introduction : Les CRISPRs avant 2006 Etat des lieux jusqu’à fin 2005 But de la thèse Résultats Investigation des CRISPRs Le CRISPR pour la phylogénie Discussion Investigations du CRISPR Utilisation du CRISPR pour la phylogénie Perspectives Les metagenomes • Résultats • Introduction : Les CRISPRs avant 2006 • Etat des lieux jusqu’à fin 2005 • But de la thèse • Résultats • Investigation des CRISPRs • Le CRISPR pour la phylogénie • Discussion • Investigations du CRISPR • Utilisation du CRISPR pour la phylogénie • Perspectives • Améliorer les outils • Les métagénomes
Le CRISPR pour la phylogénie intra-espèce Mécanisme d’évolution par délétion ou par insertion polarisée Analyse de multiples allèles de différentes souches pour un locus CRISPR donné Lorsque l’espèce contient un ou plusieurs CRISPRs Lorsque le CRISPR présente un polymorphisme intra-espèce important Espèces jeunes (Y. pestis, M. tuberculosis) ou complexes clonaux (Pseudomonas aeruginosa) contrairement aux espèces plus anciennes (Y. pseudotuberculosis, M. canetti) • Résultats
Investigations (1) Identification d’un (plusieurs) CRISPRs Consultation de la base CRISPRdb Utilisation de CRISPRFinder Quantifier le polymorphisme du CRISPR Utilisation de CRISPRcomparison MyCRISPRdb • Résultats
Investigations (3) Choisir les amorces PCR : 20-30pb à 40 pb du CRISPR Flankalign CRISPRcomparison Leader sp4 sp3 sp2 sp1 DR DR’ • Résultats R2 F1 R1 • Manipulations techniques sur une collection représentative d’une espèce (amplification PCR et séquençage)
Analyse des données (1) • Résultats • Constituer un catalogue de spacers http://crispr.u-psud.fr/crispr/Dict/Dict.php
Analyse des données (2) Organisation des locus CRISPR dans six souches Y. pestis • Résultats Fichiers de sortie TableCodedAlleles Fichier binaire
PLAN Introduction : Les CRISPRs avant 2006 Etat des lieux jusqu’à fin 2005 But de la thèse Résultats Investigation des CRISPRs Le CRISPR pour la phylogénie Discussion Investigations du CRISPR Utilisation du CRISPR pour la phylogénie Perspectives Les metagenomes • Discussion • Introduction : Les CRISPRs avant 2006 • Etat des lieux jusqu’à fin 2005 • But de la thèse • Résultats • Investigation des CRISPRs • Le CRISPR pour la phylogénie • Discussion • Investigations du CRISPR • Utilisation du CRISPR pour la phylogénie • Perspectives • Améliorations des outils • Les métagénomes
Comparaison de PILER-CR, CRT et CRISPRFinder PILER-CR Rapidité Peu de faux positifs • Discussion CRT • Rapidité • Trouver le DR dégénéré • Définition du DR consensus Mais • DR dégénéré • DR consensus • Petits CRISPRs • Faux positifs • Chevauchement de CRISPRs • Plusieurs propositions • Petits CRISPRs
Comparaison de PILER-CR, CRT et CRISPRFinder Discussion Streptococcus sanguinis SK36,
Problématique Comprendre l’organisation de la structure CRISPR Comprendre l’origine et le rôle du CRISPR Comprendre le fonctionnement du CRISPR et son parcours évolutif Outil de génotypage : le CRISPR comme marqueur de microévolution? Transfert horizontal : détermination de la structure minimale transposée chez différentes bactéries Transposition des CRISPRs et des séquences adjacentes sur le même génome • Discussion
Organisation du CRISPR (1) Structure secondaire (kunin 2008) Clustering des DR (12 groupes) (kunin 2008, Horvath 2008) • Discussion DR Le DR : DR • Taille : 23-47pb, terminaison particulière : (C/G)AA(A)(G/C) • Diversité d’un CRISPR à l’autre (533 DR distincts pour 873 CRISPRs) • Conservation presque parfaite au sein d’un même CRISPR
Organisation du CRISPR (1) Verminephrobacter eiseniae :294 DRs exactement identiques Discussion DR Thermoproteus neutrophilus Un système de maintenance de l’intégrité du DR?
Organisation du CRISPR (2) Taille constante ou variable Signature particulière sur le génome d’origine (proto-spacer) (Deveau 2008) Identification de virus à partir des spacers (Andersson, science 2008) Le même spacer sur deux CRISPRs différents du même génome ou chez des souches voisines Duplication ou acquisition indépendante d’un spacer sur le même CRISPR (Horvath 2008) 417 spacers présents en deux copies parmi 21497 (< 2%) 89 souches parmi 712 (~13%) • Discussion DR Les spacers : Methanothermobacter thermautotrophicusus
Problématique Comprendre l’organisation de la structure CRISPR Comprendre l’origine et le rôle du CRISPR Comprendre le fonctionnement du CRISPR et son parcours évolutif Outil de génotypage : le CRISPR comme marqueur de microévolution? Transfert horizontal : détermination de la structure minimale transposée chez différentes bactéries Transposition des CRISPRs et des séquences adjacentes sur le même génome • Discussion
Démonstration du rôle du CRISPR Implication dans l’acquisition d’une résistance contre les phages (Barrangou et col., Science 2007), (Horvath 2008), (Devau 2008) • Discussion • Autre rôle? • Régulation de certains gènes? • Modèle interférence ARN chez les procaryotes (Makarova 2006)
Problématique Comprendre l’organisation de la structure CRISPR Comprendre l’origine et le rôle du CRISPR Comprendre le fonctionnement du CRISPR et son parcours évolutif Outil de génotypage : le CRISPR comme marqueur de microévolution? Transfert horizontal : détermination de la structure minimale transposée Transposition des CRISPRs et des séquences adjacentes sur le même génome • Discussion
Confirmation de l’acquisition polarisée • Discussion Acquisition polarisée : (lillestol 2006), (Barrangou 2007), (Horvath 2008), (Tyson& Banfield 2008), (Andersson 2008) Leader • Le CRISPR NC_007503_3 de Carboxydothermus hydrogenoformans Z-2901. • Le DR jaune + le leader chez NC_007503_3 et NC_007503_4
Acquisition de nouveaux motifs • Discussion Comment le dernier motif est-il ajouté? ADN invasif Leader sp3 sp2 sp1 DR3 DR2 DR1 DR’ DR3 copie sp4 DR3 copie DR3 Leader sp3 sp2 sp1 DR2 DR1 DR’ DR3 copie sp4 sp3 sp2 sp1 DR3 DR2 DR1 DR’ Leader Le DR adjacent au leader est le dernier DR acquis ou le premier DR acquis? sp4 Leader sp3 sp2 sp1 DR2 DR1 DR’ sp3 sp2 sp1 DR3 DR3 DR2 DR1 DR’ Leader sp4
Problématique Comprendre l’organisation de la structure CRISPR Comprendre l’origine et le rôle du CRISPR Comprendre le fonctionnement du CRISPR et son parcours évolutif Outil de génotypage : le CRISPR comme marqueur de microévolution? Transfert horizontal : détermination de la structure minimale transposée chez différentes bactéries Transposition des CRISPRs et des séquences adjacentes sur le même génome • Discussion
Le CRISPR comme marqueur phylogénétique Avantages: Facilité technique (PCR ou spoligotypage) Rapidité Importation et échangeabilité inter-laboratoires Limites: 60% des bactéries n’ont pas de CRISPR Acquisition indépendante du même spacer CRISPR non polymorphes ou absents (Lactobacillus casei ) CRISPR très polymorphe (Y. pseudotuberculosis, M. canettii) Bon outil de différenciation de souches + outil complémentaire pour étudier la micro-évolution • Discussion
Problématique Comprendre l’organisation de la structure CRISPR Comprendre l’origine et le rôle du CRISPR Comprendre le fonctionnement du CRISPR et son parcours évolutif Outil de génotypage : le CRISPR comme marqueur de microévolution? Transfert horizontal : détermination de la structure minimale transposée chez différentes bactéries Transposition des CRISPRs et des séquences adjacentes sur le même génome • Discussion
Transfert horizontal du CRISPR • Discussion • Transport à travers les plasmides (Godde 2007) • Même leader et même DR Legionella pneumophila Lens • Le même DR chez des espèces éloignées • %GC différent du reste du génome (Horvath 2008)
Problématique Comprendre l’organisation de la structure CRISPR Comprendre l’origine et le rôle du CRISPR Comprendre le fonctionnement du CRISPR et son parcours évolutif Outil de génotypage : le CRISPR comme marqueur de microévolution? Transfert horizontal : détermination de la structure minimale transposée chez différentes bactéries Transposition des CRISPRs et des séquences adjacentes sur le même génome • Discussion
Création d’un nouveau CRISPR Les essaimages de CRISPRs Un seul groupe de gènes associés Le même DR (quelques déviations parfois) Spacers différents Hypothèse : structure minimale transposée formée d’un leader et un DR • Discussion DR DR
PLAN • Perspectives • Introduction : Les CRISPRs avant 2006 • Etat des lieux jusqu’à fin 2005 • But de la thèse • Résultats • Investigation des CRISPRs • Le CRISPR pour la phylogénie • Discussion • Investigations du CRISPR • Utilisation du CRISPR pour la phylogénie • Perspectives • Améliorations des outils • Les métagénomes
Perspectives (1) Investigations des petits CRISPRs Confirmation des CRISPRs putatifs (blast DR, …) Vérifications manuelles? Recherche des gènes cas Recherche de proto spacer Epidémiologie, phylogénie (Projets en cours) Exploitation des données de métagénomes Explorer des génomes de l’environnement (communautés multi-espèces) Nature des CRISPRs, statistiques, transfert horizontal… Exploration des phages pour chercher les proto-spacer et identifier leurs sites de reconnaissance Stockage des DR et des spacers avec possibilité de BLAST • Perspectives
Perspectives (2) • Perspectives • Diversité des DR : 24-43 pb • Nombre de motifs : jusqu’à plus de 250 motifs
LES CRISPRS, INSTRUMENTS D'ETUDE DE L'EVOLUTION INTER ET INTRA-SPÉCIFIQUE CHEZ LES MICROORGANISMES Ibtissem GRISSA Soutenance de thèse, le 24 Juin 2008, IGM