270 likes | 482 Views
Génopôle Rhône-Alpes - Plate-forme de protéomique. Estelle Nugues HELIX – INRIA Christophe Bruley CP – CEA 22 octobre 2003. Plate-forme de protéomique. Composition CP (CEA): Emmanuelle Mouton (01/2002 07/2003) Romain Cahuzac (10/2002 06/2004) Gilles André (03/2003 02/2004)
E N D
Génopôle Rhône-Alpes-Plate-forme de protéomique Estelle Nugues HELIX – INRIA Christophe Bruley CP – CEA 22 octobre 2003
Plate-forme de protéomique • Composition • CP (CEA): • Emmanuelle Mouton (01/2002 07/2003) • Romain Cahuzac (10/2002 06/2004) • Gilles André (03/2003 02/2004) • Christophe Bruley (05/2003) • Marianne Tardif (10/2002) • HELIX (INRIA) : • Erwan Reguer (11/2001 11/2003) • Estelle Nugues (04/2002 11/2003) • Walid Dib (12/2002 09/2003)
échantillon échantillon préparé spectre brut spectre interprété résultat brut Identification de protéines Plate-forme de protéomique • Activité : acquisition et traitement des données de protéomique électrophorèse interprétation identification préparation analyse MS validation
Identification • Mise en place d’un serveur MASCOT au sein du laboratoire • E. Mouton • Janvier 2002 électrophorèse identification interprétation préparation analyse MS validation échantillon échantillon préparé spectre brut spectre interprété résultat brut Identification de protéines
Stockage et Archivage • Volumétrie des données générées : • De 50 à 100 Go par semaine • E. Mouton • Mai 2002 : rédaction cahier des charges Jan. 2004 : installation du SAN électrophorèse interprétation identification préparation analyse MS validation échantillon échantillon préparé spectre brut spectre interprété résultat brut Identification de protéines Réseau de stockage (SAN) ~ 3 To
Aide à la validation de résultats • Filtrage des feuilles de résultats MASCOT • Validation automatique de certains résultats • Génération feuilles de résumé d’analyse • G. André • Mai 2003 électrophorèse interprétation identification préparation validation analyse MS échantillon échantillon préparé spectre brut spectre interprété résultat brut Identification de protéines
Qualification des spectres • Outil de qualification des spectres MS/MS en amont de l’identification • G. André • Juin 2003 électrophorèse interprétation identification préparation analyse MS validation échantillon échantillon préparé spectre brut spectre interprété résultat brut Identification de protéines
Gestion des données • Gestion de l’ensemble des données relatives aux analyses réalisées sur la plate-forme : • Conception d’un modèle des données relationnel • Évaluation de LIMS commerciaux • Évaluation de technologies pour le développement d’un système d’information adapté • E. Mouton, W. Dib, G. André, C. Bruley • Déc. 2002 interprétation électrophorèse identification préparation analyse MS validation échantillon échantillon préparé spectre brut spectre interprété résultat brut Identification de protéines
Taggor - PepMap • Outils pour l’annotation de génome par l’analyse protéomique • Collaboration INRIA – CEA - Génome express E. Reguer, E. Nugues, R. Cahuzac • Juin 2000 électrophorèse identification interprétation préparation analyse MS validation échantillon échantillon préparé spectre brut spectre interprété résultat brut Identification de protéines
Identification des protéines Fragments trypsiques Echantillon à analyser Spectres de masse Préparation + Digestion des protéines par une enzyme (trypsine) Analyse spectrométrique Spectrométrie de masse MS/MS électrophorèse identification interprétation préparation analyse MS validation échantillon échantillon préparé spectre brut spectre interprété résultat brut Identification de protéines
HN HN CH CH C C 200.17 Sens de lecture R R R 100 HN CH C OH O O O [SG] L L G P G A L % 228.17 [M+H]+ 970.71 285.19 800.56 687.46 301.23 485.39 86.11 372.29 398.30 913.65 0 m/z 100 200 300 400 500 600 700 800 900 1000 Spectre MS/MS Fragmentation au niveau des liaisons peptidiques
? P M W ? 554.33 100 685.37 % 871.46 1000.49 0 129.1 Da 438.2 Da 100 200 300 400 500 600 700 800 900 1000 W M P Un court fragment peptidique PEPTIDE SEQUENCE TAG Deux masses flanquantes de séquence inconnue « Peptide Sequence Tag »ou étiquette peptidique
T A G G O R Interprétation partielle Mascot PST Recherche génomique Identification de protéines Comparaison de spectres Spectres théoriques Séquences génomiques Séquences protéiques MS/MS in silico in silico Problématique
T A G G O R ESV 675 916 Identification de protéines • « Mapping » d’un PST sur une séquence protéique ...LSEAKISVTSTAESVTASLTDAEKTVNQTAR... • Identification de protéines Protéine 1 Séquences protéiques Protéine 2 Protéine 3 … Protéine N
T A G G O R Localisation de gènes • « Mapping » de PSTs sur une séquence génomique traduite Chromosometraduit EXON EXON Intron EXON Match complet Match partiel (Eucaryotes) • Localisation de gène (« Clustering ») Cluster Chromosometraduit EXON Intron EXON Gene
Validation • Trouver un jeu de données • Trouver les banques de données • Définir les paramètres optimaux des logiciels utilisés • Prouver l’efficacité de Taggor-PepMap en le comparant à un logiciel de référence • Tester la localisation génomique
Jeu de données expérimentales Protéines membranaires plante cellule chloroplaste Enveloppe de chloroplaste d’ Arabidopsis thaliana (Laboratoire de Chimie des Protéines du CEA Grenoble)
Données MS/MS:1300 spectres Qualité A Qualité B Expertise humaine Qualité C Qualité D
Banques de données Séquences génomiques Séquences protéiques ?
T A G G O R PST MS/MS in silico Evaluation des performances de l’identification de protéinesProtocole Interprétation partielle Mascot Comparaison de spectres Identification protéique Spectres théoriques Séquences protéiques
T A G G O R Qualité A Qualité B Evaluation des performances de l’identification de protéines Résultats Mascot 32 protéines 8 33
Chromosome I of A.thaliana subsequence from nt 2133100 to nt 21328001 (reverse strand) ACTGGAGTTTAACAACCTGCTAGTTTCCTTGAAAAGTCATTCAGAGGCAG ATCAATTTGCACGCGGGGTTGGCCCTATTTCTTTGATAGGTGAAGATGCT TTTGACCTTCTCTTTTCTGAAGAAAAATTATTGGCTCTCAACCTTGGATC TATGTGGCTTAGGTGATGAGTCTGATTTTGAGAGGAGAATGGATGATTTA AAGCTCCTTTATAGAGCATATGTTACAGATGCTTTATCTGGTGGGCGCTT AGAAGAAAATAAGGTATACTCAGTTTTGTATAAGATATTATGTACTAAAG intron Mise en évidence d’une limite intron/exon
Conclusions et Perspectives de Taggor-PepMap • Le logiciel est disponible pour les académiques • La validation a permis de montrer que le logiciel est opérationnel • Le logiciel est en cours d’installation à la plate-forme du centre de protéomique de la génopôle Rhônes-Alpes (Grenoble) • La création d’un module de qualification automatique de spectres • Le développement d’interfaces graphiques et l’intégration à GenoStar
Conclusion et Perspective de la plate-forme • Une unité « thématique » dans l’ensemble des projets • L’ensemble des projets devra fonctionner de façon intégrée dans la plate-forme