340 likes | 424 Views
Réunion du GDR2909-Métabolisme de l'arsenic chez les procaryotes 30 mars 2005, Paris. Etudes protéomiques sur Cenibacter arsenoxidans. Christine Carapito.
E N D
Réunion du GDR2909-Métabolisme de l'arsenic chez les procaryotes 30 mars 2005, Paris Etudes protéomiques sur Cenibacter arsenoxidans Christine Carapito Laboratoire de Spectrométrie de Masse Bio-Organique ECPM - Université Louis Pasteur - UMR CNRS 7509 25 rue Becquerel 67087 Strasbourg Cedex 2
Etudes protéomiques sur Cenibacter arsenoxidans Deux études : 1_ Etude protéomique différentielle : Identification des protéines impliquées dans le mécanisme de résistance à l’arsenic 2_ Réalisation d’une carte protéomique complète de Cenibacter arsenoxidans
1_Etude différentielle avec/sans arsenic par gel 2D puis analyse par nanoLC-MS/MS Comparaison des gels 2D des extraits cytoplasmiques de cultures réalisées en présence/absence d’arsenic : Sélection de 22 spots différentiellement exprimés
Séparation isoélectrique 3 7 Séparation par masse 150 Excision des spots d’intérêts • Traitement: • Lavage • Réduction/Alkylation des ponts disulfures • Digestion trypsique • Extraction des peptides 15 Electrophorèse bi-dimensionnelle MALDI-TOF-MS (empreinte peptidique massique PMF) Identification par homologie de masses MS et MS/MS Identification par homologie de masses MS Recherche dans les banques de données Pas d’identification ou ambiguïté nanoLC-MS-MS Séquençage de novo, identification par homologie de séquences Stratégie protéomique
Stratégie protéomique Stratégie utilisée lorsque le génome n’est pas séquencé Séparation isoélectrique 3 7 Séparation par masse 150 Excision des spots d’intérêts • Traitement: • Lavage • Réduction/Alkylation des ponts disulfures • Digestion trypsique • Extraction des peptides 15 Electrophorèse bi-dimensionnelle MALDI-TOF-MS (empreinte peptidique massique PMF) Identification par homologie de masses MS et MS/MS Identification par homologie de masses MS Recherche dans les banques de données Pas d’identification ou ambiguïté nanoLC-MS-MS Séquençage de novo, identification par homologie de séquences
Nano HPLC (colonne C18 de 75 µm) Fragmentation dans la cellule de collision Spectre MS Spectre MS/MS Spectre de masse Spectre MS/MS Mesure des masses des peptides au fur et à mesure de leur élution de la colonne Sélection des peptides les plus intenses isolation fragmentation La nanoLC-MS/MS Le couplage avec la chromatographie liquide
Banque protéique Spectres MS/MS Digestion trypsique et fragmentation in silico Protéine A Protéine B Protéine C 756.24 756.24 854.25 854.25 789,67 876,43 987,49 999,12 1018,98 1342,34 1597,09 1678,97 1987,65 2202,22 Liste de masses expérimentale 956.36 956.36 756.24 756.24 998.65 998.65 756.24 756.24 854.25 854.25 1002.13 1002.13 854.25 854.25 956.36 956.36 1103.26 1103.26 956.36 956.36 785.69 712,43 750,09 812,34 933,66 978,55 1207,45 1327,87 1387,23 1505,72 1678,06 1835,79 1944,55 785.69 MS MS/MS 998.65 998.65 1230.65 1230.65 998.65 998.65 859.65 859.65 1002.13 1002.13 1523.58 1523.58 1002.13 1002.13 546,45 576,32 678,09 897,98 1002,56 589,36 589,36 569,36 569,36 899.29 899.29 1103.26 1103.26 1856.26 1856.26 1103.26 1103.26 958.63 785.69 785.69 785.69 785.69 958.63 1956.24 1230.65 1230.65 1230.65 1230.65 1956.24 989.65 859.65 859.65 859.65 859.65 989.65 789,67 876,43 987,49 999,12 1018,98 1342,34 1597,09 1678,97 1987,65 2202,22 1523.58 1523.58 1523.58 1523.58 1025.26 899.29 899.29 899.29 899.29 1025.26 1856.26 1856.26 1856.26 1856.26 895.36 1066.29 958.63 958.63 895.36 958.63 958.63 1066.29 1956.24 1956.24 1956.24 1956.24 958.29 1250.59 989.65 989.65 958.29 989.65 989.65 1250.59 651,48 651,48 651,48 651,48 999.36 516,90 634,79 612,75 752,93 879,89 999,78 1134,48 1368,84 1596,28 1675,89 1888,44 1563.25 1025.26 1025.26 999.36 1025.26 1025.26 1563.25 Comparaison des listes de masses MS et MS/MS 712,43 750,09 812,34 933,66 978,55 1207,45 1327,87 1387,23 1505,72 1678,06 1835,79 1944,55 1002.35 895.36 895.36 1965.35 1066.29 1066.29 895.36 895.36 1002.35 1066.29 1066.29 1965.35 546,45 576,32 678,09 897,98 1002,56 1125.25 958.29 958.29 1250.59 1250.59 958.29 958.29 1125.25 1250.59 1250.59 1254.36 999.36 999.36 1563.25 1563.25 999.36 999.36 1254.36 1563.25 1563.25 1633.25 1002.35 1002.35 1965.35 1965.35 1002.35 1002.35 1633.25 1965.35 1965.35 859.35 955,69 955,69 859.35 1785.36 1125.25 1125.25 785,69 785,69 1125.25 1125.25 1785.36 958.36 958.36 1985.59 1254.36 1254.36 1254.36 1254.36 1985.59 989.36 989.36 2015.69 1633.25 1633.25 1633.25 1633.25 2015.69 1025.36 859.35 859.35 859.35 859.35 1025.36 1785.36 1785.36 809,89 878,78 956,56 994,83 1059,01 1166,99 1234,56 1345,78 1423,67 1624,97 1777,22 1878,38 1785.36 1785.36 516,90 634,79 612,75 752,93 879,89 999,78 1134,48 1368,84 1596,28 1675,89 1888,44 1123.02 958.36 958.36 958.36 958.36 1123.02 1985.59 1985.59 1985.59 1985.59 996,58 996,58 1256.36 989.36 989.36 898,58 898,58 989.36 989.36 1256.36 2015.69 2015.69 2015.69 2015.69 759.26 1523.16 1025.36 1025.36 759.26 1025.36 1025.36 1523.16 895.32 1952.36 1123.02 1123.02 895.32 1123.02 1123.02 1952.36 985.36 1999.35 1256.36 1256.36 985.36 1256.36 1256.36 1999.35 999.25 759.26 759.26 2015.25 1523.16 1523.16 759.26 759.26 999.25 1523.16 1523.16 2015.25 712,43 750,09 812,34 933,66 978,55 1207,45 1327,87 1387,23 1505,72 1678,06 1835,79 1944,55 1012.26 895.32 895.32 1952.36 1952.36 895.32 895.32 1012.26 1952.36 1952.36 1203.25 985.36 985.36 1999.35 1999.35 985.36 985.36 1203.25 1999.35 1999.35 1259.36 999.25 999.25 2015.25 2015.25 809,89 878,78 956,56 994,83 1059,01 1166,99 1234,56 1345,78 1423,67 1624,97 1777,22 1878,38 999.25 999.25 1259.36 2015.25 2015.25 1526.35 1012.26 1012.26 1561,56 1561,56 1012.26 1012.26 1526.35 1001,56 1001,56 1965.25 1203.25 1203.25 1203.25 1203.25 1965.25 2015.26 1259.36 1259.36 1259.36 1259.36 2015.26 1526.35 1526.35 1526.35 1526.35 1965.25 1965.25 1965.25 1965.25 2015.26 2015.26 712,43 750,09 812,34 933,66 978,55 1207,45 1327,87 1387,23 1505,72 1678,06 1835,79 1944,55 2015.26 2015.26 Listes de masses théoriques Stratégie d’identification des protéines par listes de masses
Banque protéique Spectres MS/MS Digestion trypsique et fragmentation in silico Protéine A Protéine B Protéine C 756.24 756.24 854.25 854.25 789,67 876,43 987,49 999,12 1018,98 1342,34 1597,09 1678,97 1987,65 2202,22 Liste de masses expérimentale 956.36 956.36 756.24 756.24 998.65 998.65 756.24 756.24 854.25 854.25 1002.13 1002.13 854.25 854.25 956.36 956.36 1103.26 1103.26 956.36 956.36 785.69 712,43 750,09 812,34 933,66 978,55 1207,45 1327,87 1387,23 1505,72 1678,06 1835,79 1944,55 785.69 MS MS/MS 998.65 998.65 1230.65 1230.65 998.65 998.65 859.65 859.65 1002.13 1002.13 1523.58 1523.58 1002.13 1002.13 546,45 576,32 678,09 897,98 1002,56 589,36 589,36 569,36 569,36 899.29 899.29 1103.26 1103.26 1856.26 1856.26 1103.26 1103.26 958.63 785.69 785.69 785.69 785.69 958.63 1956.24 1230.65 1230.65 1230.65 1230.65 1956.24 989.65 859.65 859.65 859.65 859.65 989.65 789,67 876,43 987,49 999,12 1018,98 1342,34 1597,09 1678,97 1987,65 2202,22 1523.58 1523.58 1523.58 1523.58 1025.26 899.29 899.29 899.29 899.29 1025.26 1856.26 1856.26 1856.26 1856.26 895.36 1066.29 958.63 958.63 895.36 958.63 958.63 1066.29 1956.24 1956.24 1956.24 1956.24 958.29 1250.59 989.65 989.65 958.29 989.65 989.65 1250.59 651,48 651,48 651,48 651,48 999.36 516,90 634,79 612,75 752,93 879,89 999,78 1134,48 1368,84 1596,28 1675,89 1888,44 1563.25 1025.26 1025.26 999.36 1025.26 1025.26 1563.25 Comparaison des listes de masses MS et MS/MS 712,43 750,09 812,34 933,66 978,55 1207,45 1327,87 1387,23 1505,72 1678,06 1835,79 1944,55 1002.35 895.36 895.36 1965.35 1066.29 1066.29 895.36 895.36 1002.35 1066.29 1066.29 1965.35 546,45 576,32 678,09 897,98 1002,56 1125.25 958.29 958.29 1250.59 1250.59 958.29 958.29 1125.25 1250.59 1250.59 1254.36 999.36 999.36 1563.25 1563.25 999.36 999.36 1254.36 1563.25 1563.25 1633.25 1002.35 1002.35 1965.35 1965.35 1002.35 1002.35 1633.25 1965.35 1965.35 859.35 955,69 955,69 859.35 1785.36 1125.25 1125.25 785,69 785,69 1125.25 1125.25 1785.36 958.36 958.36 1985.59 1254.36 1254.36 1254.36 1254.36 1985.59 989.36 989.36 2015.69 1633.25 1633.25 1633.25 1633.25 2015.69 1025.36 859.35 859.35 859.35 859.35 1025.36 1785.36 1785.36 809,89 878,78 956,56 994,83 1059,01 1166,99 1234,56 1345,78 1423,67 1624,97 1777,22 1878,38 1785.36 1785.36 516,90 634,79 612,75 752,93 879,89 999,78 1134,48 1368,84 1596,28 1675,89 1888,44 1123.02 958.36 958.36 958.36 958.36 1123.02 1985.59 1985.59 1985.59 1985.59 996,58 996,58 1256.36 989.36 989.36 898,58 898,58 989.36 989.36 1256.36 2015.69 2015.69 2015.69 2015.69 759.26 1523.16 1025.36 1025.36 759.26 1025.36 1025.36 1523.16 895.32 1952.36 1123.02 1123.02 895.32 1123.02 1123.02 1952.36 985.36 1999.35 1256.36 1256.36 985.36 1256.36 1256.36 1999.35 999.25 759.26 759.26 2015.25 1523.16 1523.16 759.26 759.26 999.25 1523.16 1523.16 2015.25 712,43 750,09 812,34 933,66 978,55 1207,45 1327,87 1387,23 1505,72 1678,06 1835,79 1944,55 1012.26 895.32 895.32 1952.36 1952.36 895.32 895.32 1012.26 1952.36 1952.36 1203.25 985.36 985.36 1999.35 1999.35 985.36 985.36 1203.25 1999.35 1999.35 1259.36 999.25 999.25 2015.25 2015.25 809,89 878,78 956,56 994,83 1059,01 1166,99 1234,56 1345,78 1423,67 1624,97 1777,22 1878,38 999.25 999.25 1259.36 2015.25 2015.25 1526.35 1012.26 1012.26 1561,56 1561,56 1012.26 1012.26 1526.35 1001,56 1001,56 1965.25 1203.25 1203.25 1203.25 1203.25 1965.25 2015.26 1259.36 1259.36 1259.36 1259.36 2015.26 1526.35 1526.35 1526.35 1526.35 1965.25 1965.25 1965.25 1965.25 2015.26 2015.26 712,43 750,09 812,34 933,66 978,55 1207,45 1327,87 1387,23 1505,72 1678,06 1835,79 1944,55 2015.26 2015.26 Listes de masses théoriques Identification de la protéine B Stratégie d’identification des protéines par listes de masses
Elongation factor de Ralstonia solanacearum MSASETPSASASRGLSYRDAGVDIEAGDALVDRIKPFAKRTLREGVLG GIGGFGALFEISKKYQEPVLVSGTDGVGTKLKLAFALNRHDTVGQDLV AMSVNDILVQGAEPLFFLDYFACGKLDVDTAATVIKGIAQGCELAGCAL IGGETAEMPSMYPAGEYDLAGFAVGAVEKRKIIDGTTIACGDVVLGLAS SGAHSNGYSLVRKIIEVSRPDLNADFHGQRLQDAIMAPTRIYVKPLLALI DKLPVKGMAHITGGGLVENVPRVLPEGVTAVLHQDAWTLPPLFQWLQ KAGNVADDEMHRVFNCGIGMIVIVSAADAPAAIAHLKDAGETVYQIGEIRI Protéine étudiéeabsentedes banques de données 90% d'homologie Elongation factor de Cenibacter arsenoxidans MSASETTSASASRGLSYRDFDVDIEAGDALVDVIKPFAKRTLRENHKM GIGGFGALFEISKKYQEPVLVSMTDGVGTKLKPAFALNRHDTVGQDLV ATSVNDILVQGAEPLFFEDYFACGKLDVETAATVIKGIAQGCEAAGCAL IGGETAEMPSSYPAGEYDQDFFAVGAVEKRKIIDGTTIACGDVVLGCVS SGAHSNGYSLVRKIIEVSRPDLNADFHGQRLQDAIMAPTRIYVKPLLALI WKLPVKGMAHITGGGLVENVPRVDRAYVTAVLHQDAWTLPPLFQWLQ KAGNVADDEYHRVFNCGIGMFDIVSAADAPAAIAHLKDAGETVYCVGEI Protéine présentedans les banques protéiques Particularité de cette étude : Le génome de Cenibacter arsenoxidans n’était pas séquencé les protéines absentes des banques de données Identification de la protéine impossible avec les recherches classiques par comparaison de listes de masses dans les banques de protéines
ELMVIYDSER Cenibacter arsenoxidans Modification du peptide 1254.6034 Da ELPVIYDSER 1220.6157 Da Ralstonia solanacearum Nano-LC-MS-MS MALDI-MS 933,66 978,55 1254,60 1327,87 1387,23 1505,72 1678,06 1835,79 1944,55 Modification de la masse du parent et de la masse des fragments Modification de la masse du peptide trypsique 1220.6157 Da 516,90 634,79 612,75 752,93 879,89 999,78 1134,48 1368,84 1596,28 1675,89 1888,44 678,09 897,98 1254.60 809,89 878,78 956,56 994,83 1059,01 1166,99 1234,56 1345,78 1423,67 1624,97 1777,22 1878,38 712,43 750,09 812,34 933,66 978,55 1207,45 1327,87 1387,23 1505,72 1678,06 1835,79 1944,55 Ne participe plus à l’identification Ne participe plus à l’identification
ELMVIYDSER 1254.6034 Da Cenibacter arsenoxidans Modification du peptide ELPVIYDSER 1220.6157 Da Ralstonia solanacearum Nano-LC-MS-MS MALDI-MS Modification de la masse du parent et de la masse des fragments 516,90 634,79 612,75 752,93 879,89 999,78 1134,48 1368,84 1596,28 1675,89 1888,44 678,09 897,98 1254.60 933,66 978,55 1254,60 1327,87 1387,23 1505,72 1678,06 1835,79 1944,55 809,89 878,78 956,56 994,83 1059,01 1166,99 1234,56 1345,78 1423,67 1624,97 1777,22 1878,38 Identification impossible 712,43 750,09 812,34 933,66 978,55 1207,45 1327,87 1387,23 1505,72 1678,06 1835,79 1944,55 Ne participe plus à l’identification Ne participe plus à l’identification Modification de la masse du peptide trypsique 1220.6157 Da Les protéines étudiées doivent être présentes dans les banques de données ou au moins présenter de très fortes homologies avec celles présentes
Recours à une stratégie de séquençage de novo des spectres MS/MS Déduction d’un tag de séquence en acides aminés : QGMEAWDGPALLLFSDGR
MS/MS spectrum of the parent ion m/z = 698.78 (retention time=28.1min) + Détermination de plusieurs tags de séquence: TYNVLFLCTGNSAR-FVAYSAGSHPGGTVNPFAIEQIK-STGYALENLR-AVFSKIAK-VNLLNSLPLAMLEKTALK-EMDAIGSSK Détermination d’un tag de séquence: SIMAEAMINTMGK Soumission au MS-BLAST Résultat Identification par homologie de séquence : tolérance aux variations dans les séquences Séquençage de novo
Résultats obtenus grâce à l’utilisation de cette stratégie par séquençage de novo
2_ Réalisation d’une carte protéomique complète de Cenibacter arsenoxidans Gel coloré à l’argent (Evelyne Turlin) Carrotage systématique Analyse de 437 spots en nanoLC-MS/MS Possible grâce au séquençage du génome!
Utilisation du génome brut • 3.424.326 paires de bases • 1370 pages • 1 seule séquence Traduction dans les 6 cadres de lecture
Fragmentation de ce génome et création d’une banque au format Fasta Fichier d’entrée : genome.txt Banque au format fasta comprenant des segments de 7500 bases avec des recouvrements de séquence de 2500 bases.
Analyse nanoLC-MS/MS Protéine identifiée sur le segment 113 Spécificité suffisante pour l’identification de la région codante
Identification de la fonction Extraction des peptides identifiés et soumission au MS-BLAST Identification de la fonction de la protéine Souvent par homologie chez Ralstonia solanacearum
Analyse MALDI-TOF-MS et recherche par « empreinte peptidique massique » Pas d’identification possible car beaucoup de faux positifs !
Traitement par PEAKS BLAST + = identification des protéines d’intérêt avec 3, 4 ou 5 peptides par protéine Stratégie par séquençage de novo Environ 60 minutes de traitement par analyse
Comparaison des résultats des 2 stratégies Recherche dans le génome complet Séquençage de novo Lors de la recherche dans le génome complet, on a le maximum d’informations
Méthode classique Stratégie de novo Recherche dans le génome Recherche dans les banques protéiques (SwissProt+TrEMBL+TrEMBLnew) 1/ Traitement avec PEAKS 1/ Recherche dans le génome 2 / BLAST 2 / BLAST Identification avec 3, 4 ou 5 peptides par protéine Pas de résultats dans la plupart des cas ou des résultats sans grande confiance Identification avec 5 à 15 peptides par protéine 3/ Vérification des séquences 4/ BLAST de vérification Durée : 60 minutes Durée : 5 minutes Comparaison des méthodes de recherche
Résultats obtenus • 384 sur les 437 spots ont été analysés en nanoLC-MS/MS sur deux systèmes : • un systéme CapLC/Q-TOF II de Waters • un système nanoLC Agilent (1100 series)/trappe ionique HCTPlus (Bruker Daltonics) • 250 analyses sont déjà interprétées • Projet DESS de Michael Heymann Automatisation de ces travaux d’interprétation, lancement des BLASTs en batch, … Annotation du génome, confrontation des résultats de l’annotation automatique/résultats protéomiques : PROTEOGENOMIQUE
Remerciements : Emmanuelle LEIZE Alain VAN DORSSELAER Philippe BERTIN Daniel MULLER Marie-Claire LETT Michael HEYMANN Evelyne TURLIN
Banque protéique CCFDSDFRGTHTTYIPLMRKMDEASCVNFJRPQSDGHLKITYPMNVCDSDFRAQSDFERTGGHPLMNVFFRDSQACVSDEFRHKITPLFMDLMFPRTEQASSCVFHDNRTIPLYMTIFKGSREFDYAGSRHEYD DFFSDFFIRLFPFMLDKFNVCGDFSREFDGEDGGDFGFHEHSDGDTSGQFARSFERDFCVVNFKFLDIKDLFLFMPRLGFHHTFLFIKDKGHRDGFTEGDHSGDFHCDPMDLCNCDSREFDDSGGGQFASRAQFSRSDQDIPMDLIRKFMPLCCFD DFHEGRILPMKYITRFNCHDSFAQRSFEDGEHDIRLFPMTGFKNVDFCGERSFDGCVAQDHFIRLPFMFYRHGTTDGNVHCFSQDAEQDSFEGDTHFFKGFLFMGPITLFGKITRYFHGNVDFSQREAS FDSFIRLFPFMLDKFNVCGDFSREFDGEDGGDFGFHEHSDGDTSGQFARSFERDFCVVNFKFLDIKDLFLFMPRLGFHHTFLFIKDKGHRDGFTEGDHSGDFHCDPMDLCNCDSREFDDSGGGQFASRAQFSRSDQDIPMDLIRKFMPLCCFD Spectre MALDI-TOF VFGNDFHEGRILPMKYITRFNCHDSFAQRSFEDGEHDIRLFPMTGFKNVDFCGERSFDGCVAQDHFIRLPFMFYRHGTTDGNVHCFSQDAEQDSFEGDTHFFKGFLFMGPITLFGKITRYFHGNVDFSQREAS IRLFPFMLDKFNVCGDFSREFDGEDGGDFGFHEHSDGDTSGQFARSFERDFCVVNFKFLDIKDLFLFMPRLGFHHTFLFIKDKGHRDGFTEGDHSGDFHCDPMDLCNCDSREFDDSGGGQFASRAQFSRSDQDIPMDLIRKFMPLCCFD RFEDDFHEGRILPMKYITRFNCHDSFAQRSFEDGEHDIRLFPMTGFKNVDFCGERSFDGCVAQDHFIRLPFMFYRHGTTDGNVHCFSQDAEQDSFEGDTHFFKGFLFMGPITLFGKITRYFHGNVDFSQREAS IRMLKLFPFMLDKFNVCGDFSREFDGEDGGDFGFHEHSDGDTSGQFARSFERDFCVVNFKFLDIKDLFLFMPRLGFHHTFLFIKDKGHRDGFTEGDHSGDFHCDPMDLCNCDSREFDDSGGGQFASRAQFSRSDQDIPMDLIRKFMPLCCFD FGEGRILPMKYITRFNCHDSFAQRSFEDGEHDIRLFPMTGFKNVDFCGERSFDGCVAQDHFIRLPFMFYRHGTTDGNVHCFSQDAEQDSFEGDTHFFKGFLFMGPITLFGKITRYFHGNVDFSQREAS Digestion trypsique in silico Liste de masses expérimentale A B C E F G 546,45 576,32 678,09 897,98 1002,56 1152.30 1198.65 1211.32 1234,78 1564,90 1678,09 1876,86 2009,76 -- 546,45 676,32 678,09 897,98 1002,56 1152.30 1198.65 1201.32 1230,78 1564,90 1678,09 1876,86 2009,76 789,67 876,43 987,49 999,12 1018,98 1342,34 1597,09 1678,97 1987,65 2202,22 712,43 750,09 812,34 933,66 978,55 1207,45 1327,87 1387,23 1505,72 1678,06 1835,79 1944,55 516,90 634,79 612,75 752,93 879,89 999,78 1134,48 1368,84 1596,28 1675,89 1888,44 543,89 691,86 699,88 746,92 777,49 855,38 867,32 900,99 933,73 1116,94 1269,57 1424,54 1532,73 809,89 878,78 956,56 994,83 1059,01 1166,99 1234,56 1345,78 1423,67 1624,97 1777,22 1878,38 --- --- --- --- --- --- --- --- Comparaison par un moteur de recherche type Mascot Listes de masses théoriques Stratégie d'identification des protéines par « empreinte peptidique massique » (PMF)
Banque protéique CCFDSDFRGTHTTYIPLMRKMDEASCVNFJRPQSDGHLKITYPMNVCDSDFRAQSDFERTGGHPLMNVFFRDSQACVSDEFRHKITPLFMDLMFPRTEQASSCVFHDNRTIPLYMTIFKGSREFDYAGSRHEYD DFFSDFFIRLFPFMLDKFNVCGDFSREFDGEDGGDFGFHEHSDGDTSGQFARSFERDFCVVNFKFLDIKDLFLFMPRLGFHHTFLFIKDKGHRDGFTEGDHSGDFHCDPMDLCNCDSREFDDSGGGQFASRAQFSRSDQDIPMDLIRKFMPLCCFD DFHEGRILPMKYITRFNCHDSFAQRSFEDGEHDIRLFPMTGFKNVDFCGERSFDGCVAQDHFIRLPFMFYRHGTTDGNVHCFSQDAEQDSFEGDTHFFKGFLFMGPITLFGKITRYFHGNVDFSQREAS FDSFIRLFPFMLDKFNVCGDFSREFDGEDGGDFGFHEHSDGDTSGQFARSFERDFCVVNFKFLDIKDLFLFMPRLGFHHTFLFIKDKGHRDGFTEGDHSGDFHCDPMDLCNCDSREFDDSGGGQFASRAQFSRSDQDIPMDLIRKFMPLCCFD VFGNDFHEGRILPMKYITRFNCHDSFAQRSFEDGEHDIRLFPMTGFKNVDFCGERSFDGCVAQDHFIRLPFMFYRHGTTDGNVHCFSQDAEQDSFEGDTHFFKGFLFMGPITLFGKITRYFHGNVDFSQREAS IRLFPFMLDKFNVCGDFSREFDGEDGGDFGFHEHSDGDTSGQFARSFERDFCVVNFKFLDIKDLFLFMPRLGFHHTFLFIKDKGHRDGFTEGDHSGDFHCDPMDLCNCDSREFDDSGGGQFASRAQFSRSDQDIPMDLIRKFMPLCCFD RFEDDFHEGRILPMKYITRFNCHDSFAQRSFEDGEHDIRLFPMTGFKNVDFCGERSFDGCVAQDHFIRLPFMFYRHGTTDGNVHCFSQDAEQDSFEGDTHFFKGFLFMGPITLFGKITRYFHGNVDFSQREAS IRMLKLFPFMLDKFNVCGDFSREFDGEDGGDFGFHEHSDGDTSGQFARSFERDFCVVNFKFLDIKDLFLFMPRLGFHHTFLFIKDKGHRDGFTEGDHSGDFHCDPMDLCNCDSREFDDSGGGQFASRAQFSRSDQDIPMDLIRKFMPLCCFD FGEGRILPMKYITRFNCHDSFAQRSFEDGEHDIRLFPMTGFKNVDFCGERSFDGCVAQDHFIRLPFMFYRHGTTDGNVHCFSQDAEQDSFEGDTHFFKGFLFMGPITLFGKITRYFHGNVDFSQREAS Identification de la protéine F Stratégie d'identification des protéines par « empreinte peptidique massique » (PMF) Spectre MALDI-TOF Digestion trypsique in silico Liste de masses expérimentales A B C E F G 546,45 576,32 678,09 897,98 1002,56 1152.30 1198.65 1211.32 1234,78 1564,90 1678,09 1876,86 2009,76 -- 546,45 676,32 678,09 897,98 1002,56 1152.30 1198.65 1201.32 1230,78 1564,90 1678,09 1876,86 2009,76 789,67 876,43 987,49 999,12 1018,98 1342,34 1597,09 1678,97 1987,65 2202,22 712,43 750,09 812,34 933,66 978,55 1207,45 1327,87 1387,23 1505,72 1678,06 1835,79 1944,55 516,90 634,79 612,75 752,93 879,89 999,78 1134,48 1368,84 1596,28 1675,89 1888,44 543,89 691,86 699,88 746,92 777,49 855,38 867,32 900,99 933,73 1116,94 1269,57 1424,54 1532,73 809,89 878,78 956,56 994,83 1059,01 1166,99 1234,56 1345,78 1423,67 1624,97 1777,22 1878,38 --- --- --- --- --- --- --- --- Comparaison par un moteur de recherche type Mascot Listes de masses théoriques
Le peptide trypsique Se termine par une Lysine ou une Arginine donc 2 sites basiques protonables par peptide : le NH2 terminal et le NH2 de la chaîne latérale de la Lys ou de l’Arg R1 R3 O O C C C NH C NH C C OH NH3+ NH C C O O CH2 R2 (CH2)3 NH3+ Lysine
R R 3 1 Règles de fragmentation des peptidesBiemann, 1990 R 2 c d b a CH 2 COOH CH NH NH CO NH CH CH CO 2 v w z y x Ions de sériea, betc: charge positive portée par la partie N-terminal Ions de sériex, yet z: charge positive portée par la partie C-terminal Ions de séried, vetw: fragmentation des chaînes latérales Fragmentations basse énergie Fragmentations haute énergie Biemann K., Appendix 5, Nomenclature for peptide fragment ions (positive ions), Methods Enzymol, 1990, 193, 886-7
Fragmentation des peptides : La loi du proton mobile Dongré et al., Journal of Mass Spectrometry, Vol. 31, 339-350 (1996) Les peptides ne cassent qu'une seule fois pour générer préférentiellement les fragments y et b Fragments b Fragments y +ALLLFSDGR+ +A LLLFSDGR+ +ALLLFSDGR+ Fragmentation dans la cellule de collision +AL LLFSDGR+ +ALLLFSDGR+ +ALL LFSDGR+ FSDGR+ +ALLL +ALLLFSDGR+ SDGR+ +ALLLF +ALLLFSDGR+ DGR+ +ALLLFS +ALLLFSDGR+ GR+ +ALLLFSD R+ +ALLLFSDG +ALLLFSDGR+