100 likes | 382 Views
Grande quantité de séquences brutes. Bioinformatique. Identification des gènes procaryotes. Séquençage massif des génomes. Identifier et prédire les gènes. Séquence ADN transcrite en ARN (ARNm, ARNr, ARNt…) et traduite éventuellement en protéine. Le gène : définition.
E N D
Grande quantité de séquences brutes Bioinformatique Identification des gènes procaryotes Séquençage massif des génomes Identifier et prédire les gènes
Séquence ADN transcrite en ARN (ARNm, ARNr, ARNt…) et traduite éventuellement en protéine Le gène : définition Qu’est ce qu’un gène ?
Organisation des gènes procaryotes Comment est organisé un gène procaryote ? ORF STOP STOP CDS START -35 -10 --TTGACA-- --TATAAT-- Terminaison de la transcription Régions complémentaires --AAAGGAGG--
Méthodes et outils de détection Comment détecter les gènes ? GATCTCGTTTTGACAAGCCGTCGTGATCAAAGTATAAAGGAGGCAAAATGGCACTGCTCTCGACTTTCTAACAATGGCTTTAGGATTGTTTAGAAAGTAAGAGTGAAATAAACTCTTCAATCCTTCAGCTAGTTTAACCAACATTAAACTATTAAAGGAGAATTATAATGAAAGAGTTTATCGAGCCATACCAATATAATTTTATCAAAAATCAATTAGCCAATGTTTCACGCGCATACCGGTCCGCCAATGATACTTCGACTTTGAAGGCGTTAAAATCGCTAACAGAGGAGAAAATCAATGAATTATTCCCGGAAAGTGTACTAGAGGAGCATAAGGAACTGTTTAGCGAGCTCCATGCGATTACTTCAACCAAAGAAGCAGAGCCGTTTTTAGAGGTTAAAAGCCTATGTGGATCTCGTTCCAATAGCCGAGAGCCGTCGTGATCAAAGAGATGCAAACAAAATTGCACTGCTCTCGACTTTCTAACAATGGCTTTAGATTGTTTAGAAAGTAAGAGTGAAATAAACTCTTCAATCCTTCAGCTAGTTTAGATCTCGTTCCAATAGCCGAGAGCCGTCGTGATCAAAGAGATGCAAACAAAATTGCACTGCTCTCGACTTTCTAACAATGGCTTTAGGATTGTTTAGAAAGTAAGAGTGAAATAAACTCTTCAATCCTTCAGCTAGTTTAACCAACATTAAACTATTAAGGAGAATTATAATGAAAGAGTTTATCGAGCCATACCAATATAATTTTATCAAAAATCAATTAGCCAATGTTTCACGCGCATACCGGTCCGCCAATGATACTTCGACTTTGAAGGCGTTAAAATCGCATAATTCATTGAAAAATCAATGAATTATTCCCGGA Séquences brutes : difficile à décrypter
Méthodes et outils de détection Rechercher les ORF Portion d’ADN contenant une séquence codant potentiellement pour une protéine 5’- GATCTCGTTCCAATAGCC -3’ Phase + 1: 5’- GAT CTC GTT CCA ATA GCC -3’ Phase + 2: 5’- G ATC TCG TTC CAA TAG CC -3’ Phase + 3: 5’- GA TCT CGT TCC AAT AGC C -3’ 3’- CTAGAGCAAGGTTATCGG -5’ 3’-CTA GAG CAA GGT TAT CGG -5’ : Phase - 1 3’-CT AGA GCA AGG TTA TCG G -5’ : Phase - 2 3’-C TAG AGC AAG GTT ATC GG -5’ : Phase - 3
BLASTP Méthodes et outils de détection Comparer (aligner) les séquences Recherche de similarité entre l’ORF trouvé et les séquences protéiques connues
Logiciels de rechreche de motifs Méthodes et outils de détection Rechercher le signaux et les séquences consensus placées en amont et en aval des gènes Start : ATG, CTG, TTG Stop : TAA, TGA, TAG Promoteurs RBS (Ribosome Binding Site) Signaux de terminaison de la transcription
GenMark, GenScan Méthodes et outils de détection Logiciels dédiés à la prédiction des gènes Ces logiciels utilisent des propriétés statistiques de l’usage des codons dans un génome donné. Ils permettent de valider ou de trouver une région codante
START STOP --TTGACA-- --TATAA-- --AAAGGAGG-- Identification des gènes procaryotes Au final GATCTCGTTTTGACAAGCCGTCGTGATCAAAGTATAAAGGAGGCAAAATGGCACTGCTCTCGACTTTCTAACAATGGCTTTAGGATTGTTTAGAAAGTAAGAGTGAAATAAACTCTTCAATCCTTCAGCTAGTTTAACCAACATTAAACTATTAAAGGAGAATTATAATGAAAGAGTTTATCGAGCCATACCAATATAATTTTATCAAAAATCAATTAGCCAATGTTTCACGCGCATACCGGTCCGCCAATGATACTTCGACTTTGAAGGCGTTAAAATCGCTAACAGAGGAGAAAATCAATGAATTATTCCCGGAAAGTGTACTAGAGGAGCATAAGGAACTGTTTAGCGAGCTCCATGCGATTACTTCAACCAAAGAAGCAGAGCCGTTTTTAGAGGTTAAAAGCCTATGTGGATCTCGTTCCAATAGCCGAGAGCCGTCGTGATCAAAGAGATGCAAACAAAATTGCACTGCTCTCGACTTTCTAACAATGGCTTTAGATTGTTTAGAAAGTAAGAGTGAAATAAACTCTTCAATCCTTCAGCTAGTTTAGATCTCGTTCCAATAGCCGAGAGCCGTCGTGATCAAAGAGATGCAAACAAAATTGCACTGCTCTCGACTTTCTAACAATGGCTTTAGGATTGTTTAGAAAGTAAGAGTGAAATAAACTCTTCAATCCTTCAGCTAGTTTAACCAACATTAAACTATTAAGGAGAATTATAATGAAAGAGTTTATCGAGCCATACCAATATAATTTTATCAAAAATCAATTAGCCAATGTTTCACGCGCATACCGGTCCGCCAATGATACTTCGACTTTGAAGGCGTTAAAATCGCATAATTCATTGAAAAATCAATGAATTATTCCCGGA