590 likes | 685 Views
Étude du décalage de phase de lecture dans le génome de Saccharomyces cerevisiæ. Michaël Bekaert. Université Pierre et Marie Curie Directeur de thèse : Jean-Pierre Rousset Institut de Génétique et Microbiologie. La levure Saccharomyces cerevisiae. P. A. E. La traduction.
E N D
Étude du décalage de phase de lecture dans le génome de Saccharomyces cerevisiæ Michaël Bekaert Université Pierre et Marie Curie Directeur de thèse : Jean-Pierre Rousset Institut de Génétique et Microbiologie
P A E La traduction Un messager, un polypeptide ARNt ribosome ARNm CAU AUG GAU UAC AUG GUC UAA GAU
P A E La traduction Un messager, un polypeptide CAU AUG GAU UAC AUG GUC UAA GAU
P A E La traduction Un messager, un polypeptide CAU AUG GAU UAC AUG GUC UAA GAU
P A E La traduction Un messager, un polypeptide CAU AUG GAU UAC AUG GUC UAA GAU
P A E La traduction Un messager, un polypeptide CAU AUG GAU UAC AUG GUC UAA GAU
P A E La traduction Un messager, un polypeptide CAU AUG GAU UAC AUG GUC UAA GAU
P A E La traduction Un messager, un polypeptide CAU AUG GAU UAC AUG GUC UAA GAU
P A E La traduction Un messager, un polypeptide CAU AUG GAU UAC AUG GUC UAA GAU
P A E La traduction Un messager, un polypeptide CAU AUG GAU UAC AUG GUC UAA GAU
P A E La traduction Un messager, un polypeptide CAU AUG GAU UAC AUG GUC UAA GAU
Le recodage Translecture Décalage de phase de lecture en -1 Décalage de phase de lecture en +1 Saut de ribosome
Pourquoi des virus et des transposons ? • Vestige d’un monde à ARN… • Compacité des génomes • Biais des analyses Le recodage Un messager, deux polypeptides • Dépend de séquences et de structures sur l’ARNm • Observé principalement dans des petits éléments génétiques autonomes (virus et transposons)
Le décalage de phase de lecture en -1 Recherche de sites de décalage de phase de lecture dans les génomes • Développer des outils d’identification d’événements de recodage eucaryote • Caractériser le décalage de phase de lecture en -1
rev nef vpr vpu tat gag LTR LTR .. pro vif env pol int Le décalage de phase de lecture en -1 Virus HIV ARNm
Le décalage de phase de lecture en -1 gag pol Protéine Gag-Pol 5% Protéine Gag 95%
1000 2000 3000 4000 +1 0 -1 1000 2000 3000 4000 Heptamère Brilerly, 1993 X XXY YYZ Le décalage de phase de lecture en -1 Site canonique de décalage de phase de lecture Modèle Jacks et Varmus, 1985 et 1988
Nouveaux gènes Mécanisme Impact del’environnement Levure Transposons Modélisation Espaceur Virus HMM Site E Similarité Les expériences Décalage de phase de lecture en -1
Décalage de phase de lecture en -1 Mécanisme Impact del’environnement Transposons Modélisation Espaceur Aujourd’hui Nouveaux gènes Levure Virus HMM Site E Similarité
1000 2000 3000 4000 +1 0 -1 1000 2000 3000 4000 Le décalage de phase de lecture en -1 Recherche de sites de décalage de phase de lecture dans les génomes Recherches à partir de ce modèle Hammell et al.,1999 Liphardt,1999
Le décalage de phase de lecture en -1 Deux approches complémentaires • Modèle pas assez précis (ou incomplet) • Affiner le modèle • Modèle trop rigide (mécanismes différents ou dégénérés) • Approche sans a priori sur le mécanisme
Le décalage de phase de lecture en -1 Affiner le modèle • Identifier de nouveaux attributs • Composition de l’espaceur • Dissymétrie entre un appariement C-G et G-C (Bekaert et al., Bioinformatics, 2003)
S2 3’ L1 L’1 S1 L2 5’ X XXY YYZ SP P Le décalage de phase de lecture en -1 Recherche basée sur le modèle affiné
NNN N AUG NN XXX YYY Z Le décalage de phase de lecture en -1 Rechercher un heptemère
Le décalage de phase de lecture en -1 Rechercher un pseudonoeud
S2 3’ L1 L’1 S1 L2 5’ X XXY YYZ SP P Le décalage de phase de lecture en -1 Affiner le modèle
Retroviridea Betaretrovirus Retroviridea Alpharetovirus Mason-Pfizer monkey virus Simian type D Enzootic nasal tumor virus Rous sarcoma virus Retroviridea Deltaretrovirus Mouse mammary tumor virus Retroviridea Lentivirus Bovine leukemia virus Visna virus Human T-cell lymphotropic virus 2 Feline immunodeficiency virus Simian T-cell lymphotropic virus 1 Equine infectious anemia virus Human T-cell lymphotropic virus 1 Human immunodeficiency virus 2 Simian immunodeficiency virus Luteoviridae Luteovirus Simian retrovirus type 2 Barley yellow dwarf virus-PAS Human immunodeficiency virus 1 Cereal yellow dwarf virus-RPV Luteoviridea Polerovirus Potato leafroll virus Turnip yellows virus Cucurbit aphid-borne yellows virus Totiviridae Totivirus L-A virus Giardia virus Pea enation mosaic virus 2 Groundnut rosette virus Trichomonas vaginalis virus II Totiviridae Giardiavirus Carrot mottle mimic virus Umbravirus Human astrovirus Red clover necrotic mosaic virus PRRSV Human coronavirus Cocksfoot mottle virus Astroviridea Mamadtroviruss Murine hepatitis virus SARS Tombusviridea Dianthovirus Avian infectious bronchitis virus Arteriviridae Arterivirus Coronaviridae Coronavirus Le décalage de phase de lecture en -1 Valider des sites putatifs (Bekaert et al.,Mol Cell, sous presse) Retrovirus Virus à ARN double brin Virus à ARN positif
+1 0 -1 Région de décalage lacZ luc b-galactosidase b-galactosidase-luciférase Le décalage de phase de lecture en -1 pAC99 : évaluation in vivo
Le décalage de phase de lecture en -1 Plus de virus Virus Heptamère Décalage BChV .cC GGgAAAu gGa. 15,8%±2 BLV gag/pro .UC aaAAAAC Uaa. 8,1%±1 BWYV .UC GGgAAAC gGG. 12,0%±1 BYDV .gu GGguuuu UaG. 12,2%±1 CABYV .UC GGgAAAC gGG. 17,5%±1 EIAV .cC aaAAAAC gGG. 7,0%±1 FIV .UC GGgAAAC UGG. 9,0%±1 HIV1 .aa uuuuuua gGG. 6,0%±1 IBV .Ua uuuAAAC gGG. 19,3%±1 L-A .ca GGguuua gGa. 10,0%±1 L-BC .Uu GGauuuu cGu. 13,0%±2 LDV .gC uuuAAAC UGc. 13,1%±1 MMTV gag/pro .UC aaAAAAC UuG. 20,2%±2 PEMV1 .UC GGgAAAC gGa. 31,0%±2 PLRV .cC GGgAAAu gGG. 19,0%±1 PLRV-W .cC uuuAAAu gGG. 17,8%±2 PRRSV .Ug uuuAAAC UGc. 15,7%±1 SARS .Uu uuuAAAC gGG. 10,3%±1 ScYLV .ca GGgAAAu gaG. 0,7%±0 SRV1 gag/pro .ca GGgAAAC gGa. 13,0%±2 Pseudo-consensus UC GGGAAAC GGG Profil HMM
Le décalage de phase de lecture en -1 Identifier de nouveaux virus 1500 génomes profil HMM 285 candidats inspection manuelle • pas dans la bonne phase • pas de structure secondaire 74 séquences
80 60 Chi2 40 20 0 -9/-10 -8/-9 -7/-8 -6/-7 -5/-6 -4/-5 -3/-4 -2/-3 -1/-2 dinucléotide Le décalage de phase de lecture en -1 biais nucléotidique
Le décalage de phase de lecture en -1 Dinucléotide en amont du site glissant
25% 20% 15% 10% 5% 0% AA AC UA UC UG UU AG AU CA CC CG CU GA GC GG GU Le décalage de phase de lecture en -1 Dinucléotide en amont du site glissant Taux décalage de phase dinucléotide
180° O O H N H HN HN 1 5 O O O O 5 1 P P O N O - O - O O CH CH O 2 2 O O HOH H+ OH O OH OH O uridine pseudouridine () 38-39 Y Y Pus3p (Lecointe et al, 1998) Le décalage de phase de lecture en -1 Propriété de Pus3p Réaction catalysée par Pus3p
25% WT 20% pus3 15% 10% 5% 0% CG GA UA UC Le décalage de phase de lecture en -1 Effet de l’absence de pseudouridine en position 39 taux de décalage de phase dinucléotide
P A E Le décalage de phase de lecture en -1 Et le site E ?
La traduction Influence de l’ARNt au site E sur la traduction Adapté de Frank et al., 1999
Le décalage de phase de lecture en -1 Un site de décalage de phase étendue… • Influence de la pseudouridine sur le l’ARNt au site E • L’ARNt est éjecté prématurément ? • L’ARNt reste? • Influence de l’ARNt au site E • Influence la phase d’accommodation au site A ? • Déstabilise l’ARNt au site P ?
Le décalage de phase de lecture en -1 Affiner le modèle : mécanisme • Influence de la modification Y39 de l’ARNt au site E • Impact sur la fidélité de la traduction
Le décalage de phase de lecture en -1 Affiner le modèle : bioinformatique • Identifier de nouveaux attributs • Composition de l’espaceur • Dissymétrie entre un appariement C-G et G-C • Site E / Dinucléotide en amont de l’hepamère
Le décalage de phase de lecture en -1 Approches sans a priori sur le mécanisme • Regarder le décalage de phase sous un angle différent • sans a priori sur le site de décalage lui-même • définition génomique • Fonctionnel • Linguistique/statistique • Identifier de nouveaux sites
Découpage du génome Stockage des séquences HMM Motifs Classement RT-PCR Evaluation in vivo Le décalage de phase de lecture en -1 Implémentation
Le décalage de phase de lecture en -1 Quelques outils (Bekaert et al., Bioinformatics, soumis)
22 445 régions chez S. cerevisiae Genbank – rel. 27/10/2002 10 régions chez le virus L-A Genbank – rel. 03/08/2002 Le décalage de phase de lecture en -1 Découpage START STOP1 STOP2 STOP3 phase 0 ORF0 ORF-1 phase -1 > 99 nt > 99 nt > 150 nt
Le décalage de phase de lecture en -1 Motifs START STOP1 STOP2 STOP3 ORF0 ORF-1 Motif protéique ? Motif protéique ? 84 régions chez S. cerevisiae 1 région chez le virus L-A Banques de motifs: Interpro 7.0 Application: GenRecode
Le décalage de phase de lecture en -1 Modèle de Markov 0 -1 0 -1
Le décalage de phase de lecture en -1 Modèle de Markov 0 -1 0 -1
21000 400 300 Nombre de régions 200 ≥0.95 100 0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 probabilité Le décalage de phase de lecture en -1 Classement 110 régions chez S. cerevisiae 1 région chez le virus L-A Probabilité de déphasage > 95%
105 5 79 Le décalage de phase de lecture en -1 Vers de nouveaux sites eucaryotes : synthèse HMM • Le site du virus L-A est retrouvé • Identification de 189 régions chez S. cerevisiae • Classement des candidats Motifs