1 / 26

Génopôle Rhône-Alpes - Plate-forme de protéomique

Génopôle Rhône-Alpes - Plate-forme de protéomique. Estelle Nugues HELIX – INRIA Christophe Bruley CP – CEA 22 octobre 2003. Plate-forme de protéomique. Composition CP (CEA): Emmanuelle Mouton (01/2002  07/2003) Romain Cahuzac (10/2002  06/2004) Gilles André (03/2003  02/2004)

gage-bauer
Download Presentation

Génopôle Rhône-Alpes - Plate-forme de protéomique

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Génopôle Rhône-Alpes-Plate-forme de protéomique Estelle Nugues HELIX – INRIA Christophe Bruley CP – CEA 22 octobre 2003

  2. Plate-forme de protéomique • Composition • CP (CEA): • Emmanuelle Mouton (01/2002  07/2003) • Romain Cahuzac (10/2002  06/2004) • Gilles André (03/2003  02/2004) • Christophe Bruley (05/2003) • Marianne Tardif (10/2002) • HELIX (INRIA) : • Erwan Reguer (11/2001  11/2003) • Estelle Nugues (04/2002  11/2003) • Walid Dib (12/2002  09/2003)

  3. échantillon échantillon préparé spectre brut spectre interprété résultat brut Identification de protéines Plate-forme de protéomique • Activité : acquisition et traitement des données de protéomique électrophorèse interprétation identification préparation analyse MS validation

  4. Identification • Mise en place d’un serveur MASCOT au sein du laboratoire • E. Mouton • Janvier 2002 électrophorèse identification interprétation préparation analyse MS validation échantillon échantillon préparé spectre brut spectre interprété résultat brut Identification de protéines

  5. Stockage et Archivage • Volumétrie des données générées : • De 50 à 100 Go par semaine • E. Mouton • Mai 2002 : rédaction cahier des charges Jan. 2004 : installation du SAN électrophorèse interprétation identification préparation analyse MS validation échantillon échantillon préparé spectre brut spectre interprété résultat brut Identification de protéines Réseau de stockage (SAN) ~ 3 To

  6. Aide à la validation de résultats • Filtrage des feuilles de résultats MASCOT • Validation automatique de certains résultats • Génération feuilles de résumé d’analyse • G. André • Mai 2003 électrophorèse interprétation identification préparation validation analyse MS échantillon échantillon préparé spectre brut spectre interprété résultat brut Identification de protéines

  7. Qualification des spectres • Outil de qualification des spectres MS/MS en amont de l’identification • G. André • Juin 2003 électrophorèse interprétation identification préparation analyse MS validation échantillon échantillon préparé spectre brut spectre interprété résultat brut Identification de protéines

  8. Gestion des données • Gestion de l’ensemble des données relatives aux analyses réalisées sur la plate-forme : • Conception d’un modèle des données relationnel • Évaluation de LIMS commerciaux • Évaluation de technologies pour le développement d’un système d’information adapté • E. Mouton, W. Dib, G. André, C. Bruley • Déc. 2002 interprétation électrophorèse identification préparation analyse MS validation échantillon échantillon préparé spectre brut spectre interprété résultat brut Identification de protéines

  9. Taggor - PepMap • Outils pour l’annotation de génome par l’analyse protéomique • Collaboration INRIA – CEA - Génome express E. Reguer, E. Nugues, R. Cahuzac • Juin 2000 électrophorèse identification interprétation préparation analyse MS validation échantillon échantillon préparé spectre brut spectre interprété résultat brut Identification de protéines

  10. Identification des protéines Fragments trypsiques Echantillon à analyser Spectres de masse Préparation + Digestion des protéines par une enzyme (trypsine) Analyse spectrométrique Spectrométrie de masse MS/MS électrophorèse identification interprétation préparation analyse MS validation échantillon échantillon préparé spectre brut spectre interprété résultat brut Identification de protéines

  11. HN HN CH CH C C 200.17 Sens de lecture R R R 100 HN CH C OH O O O [SG] L L G P G A L % 228.17 [M+H]+ 970.71 285.19 800.56 687.46 301.23 485.39 86.11 372.29 398.30 913.65 0 m/z 100 200 300 400 500 600 700 800 900 1000 Spectre MS/MS Fragmentation au niveau des liaisons peptidiques

  12. ? P M W ? 554.33 100 685.37 % 871.46 1000.49 0 129.1 Da 438.2 Da 100 200 300 400 500 600 700 800 900 1000 W M P Un court fragment peptidique PEPTIDE SEQUENCE TAG Deux masses flanquantes de séquence inconnue « Peptide Sequence Tag »ou étiquette peptidique

  13. T A G G O R Interprétation partielle Mascot PST Recherche génomique Identification de protéines Comparaison de spectres Spectres théoriques Séquences génomiques Séquences protéiques MS/MS in silico in silico Problématique

  14. T A G G O R ESV 675 916 Identification de protéines • « Mapping » d’un PST sur une séquence protéique ...LSEAKISVTSTAESVTASLTDAEKTVNQTAR... • Identification de protéines Protéine 1 Séquences protéiques Protéine 2 Protéine 3 … Protéine N

  15. T A G G O R Localisation de gènes • « Mapping » de PSTs sur une séquence génomique traduite Chromosometraduit EXON EXON Intron EXON Match complet Match partiel (Eucaryotes) • Localisation de gène (« Clustering ») Cluster Chromosometraduit EXON Intron EXON Gene

  16. Validation • Trouver un jeu de données • Trouver les banques de données • Définir les paramètres optimaux des logiciels utilisés • Prouver l’efficacité de Taggor-PepMap en le comparant à un logiciel de référence • Tester la localisation génomique

  17. Jeu de données expérimentales Protéines membranaires plante cellule chloroplaste Enveloppe de chloroplaste d’ Arabidopsis thaliana (Laboratoire de Chimie des Protéines du CEA Grenoble)

  18. Données MS/MS:1300 spectres Qualité A Qualité B Expertise humaine Qualité C Qualité D

  19. Banques de données Séquences génomiques Séquences protéiques ?

  20. T A G G O R PST MS/MS in silico Evaluation des performances de l’identification de protéinesProtocole Interprétation partielle Mascot Comparaison de spectres Identification protéique Spectres théoriques Séquences protéiques

  21. T A G G O R Qualité A Qualité B Evaluation des performances de l’identification de protéines Résultats Mascot 32 protéines 8 33

  22. Mise en évidence d’une limite intron/exon

  23. Mise en évidence d’une limite intron/exon

  24. Chromosome I of A.thaliana subsequence from nt 2133100 to nt 21328001 (reverse strand) ACTGGAGTTTAACAACCTGCTAGTTTCCTTGAAAAGTCATTCAGAGGCAG ATCAATTTGCACGCGGGGTTGGCCCTATTTCTTTGATAGGTGAAGATGCT TTTGACCTTCTCTTTTCTGAAGAAAAATTATTGGCTCTCAACCTTGGATC TATGTGGCTTAGGTGATGAGTCTGATTTTGAGAGGAGAATGGATGATTTA AAGCTCCTTTATAGAGCATATGTTACAGATGCTTTATCTGGTGGGCGCTT AGAAGAAAATAAGGTATACTCAGTTTTGTATAAGATATTATGTACTAAAG intron Mise en évidence d’une limite intron/exon

  25. Conclusions et Perspectives de Taggor-PepMap • Le logiciel est disponible pour les académiques • La validation a permis de montrer que le logiciel est opérationnel • Le logiciel est en cours d’installation à la plate-forme du centre de protéomique de la génopôle Rhônes-Alpes (Grenoble) • La création d’un module de qualification automatique de spectres • Le développement d’interfaces graphiques et l’intégration à GenoStar

  26. Conclusion et Perspective de la plate-forme • Une unité « thématique » dans l’ensemble des projets • L’ensemble des projets devra fonctionner de façon intégrée dans la plate-forme

More Related