650 likes | 1.21k Views
Emmanuelle Bouveret Laboratoire d'Ingénierie des Systèmes Macromoléculaires bouveret@ibsm.cnrs-mrs.fr. Les réseaux d’interactions protéine-protéine INTERACTOMES. M2, 2007. Introduction : notions Génomique Protéomique Organisation supramoléculaire Identification de la fonction des gènes
E N D
Emmanuelle Bouveret Laboratoire d'Ingénierie des Systèmes Macromoléculaires bouveret@ibsm.cnrs-mrs.fr Les réseaux d’interactions protéine-protéineINTERACTOMES M2, 2007
Introduction : notions • Génomique • Protéomique • Organisation supramoléculaire • Identification de la fonction des gènes • Construction systématique de cartes d’interactions protéine-protéine à grande échelle • Par double-hybride • Par purification de complexes • Principe d’identification des protéines par spectrométrie de masse • Description de la méthode TAP • Autres méthodes et comparaisons Techniques de détection des interactions protéine-protéine Double-hybride chez la levure Double-hybride bactérien Co-purifications par affinité Purification de complexes
La génomique (1) • 370 génomes procaryotes entièrement séquencés (2007) http://cmr.tigr.org • Les eucaryotes aussi: • Saccharomyces cerevisiae (1996) • Caenorabditis elegans (1998) • Drosophila melanogaster (2000) • Arabidopsis, Zebrafish, Souris, Rat, Humain … (2002) Escherichia coli
Comment déterminer la fonction de ces gènes à grande échelle? La génomique (2) nombre de gènes: 2000-6000 6000 19000 13500 30000
Comment trouver la fonction des gènes? Evolution, liens entre les gènes Homologies de séquences Expression Régulation Co-purifications Activité enzymatique ... Phénotype knockout, RNAi Expression Localisation Homologies de structure Biologie moléculaire: Purification de partenaires dont la fonction est connue
Un seul génome… … plusieurs protéomes
Le protéome PM • Années 70, définition classique: catalogue de gels 2D, expression différentielle • Années 80: révolution de la biologie moléculaire • Années 90: avancées dans les techniques de spectrométrie de masse • La spectrométrie de masse associée à la génomique permet d’identifier la composition protéique d’une cellule à un instant donné. pI
Organisation supramoléculaireInteractome • Les protéines n’agissent pas seules et isolées. • De la description des composants (génome et protéome), il est nécessaire de comprendre l’organisation et la dynamique des réseaux d’interactions. David S. Goodsell
La protéomique « fonctionnelle » • Description exhaustive de la composition en ARN, ou en protéines d’une cellule. • Mais qu’en est-il de la fonction et de l’organisation de ces protéines? On aboutit à une nouvelle définition de la protéomique. = Identification systématique des partenaires protéiques Description de l’ « interactome »d’une cellule Notion de « coupable par association »
Techniques d’obtention de cartes d’interactions à grande échelle • Interactions physiques entre protéines • Double hybride dans la levure • Purification de complexes et spectrométrie de masse • Associations fonctionnelles entre gènes • Co-expression ARNm • Association génétique: synthétiques létaux • Interaction in silico • Fusion de gènes, association de gènes, profile phylogénétique
ARN messager ARN messager Facteur de transcription Facteur de transcription ARN messager ARN messager ARN messager DA DA ARN messager ARN messager ARN messager DF DF La modularité des facteurs de transcription principe élémentaire du double hybride dans la levure Gène Site de fixation pour le facteur de transcription DF: Domaine de fixation à l'ADN + DA: Domaine d'activation de la transcription
DA Proie Y Gène rapporteur AppâtX DF Le double hybride dans la levure le test La protéine APPÂT est fusionnée au domaine de fixation à l'ADN DF. Les protéines PROIES sont fusionnées au domaine d'activation de la machinerie basale de transcription DA. Les protéines fusions sont exprimées dans des cellules de levure contenant un gène rapporteur dont l'expression est placée sous le contrôle du site de fixation pour le domaine de fixation à l'ADN DF.
ARN rapporteur ARN rapporteur DA DA ARN rapporteur Proie Y Proie Y ARN rapporteur ARN rapporteur ARN rapporteur ARN rapporteur ARN rapporteur Gène rapporteur AppâtX DF Le double hybride dans la levure le test Lorsque la protéine proie Y est capable d'interagir avec la protéine appât X, le domaine d'activation se retrouve à proximité du promoteur du gène rapporteur et la transcription a lieu.
GAL4AD Y1 GAL4AD Yn Appât GAL4AD Ma protéine Y2 GAL4AD GAL4DB Yn GAL4AD Yn Proies Principe du double-hybride dans la levure (2) Criblage d’une banque But: identifier les partenaires protéiques d’une protéine appât choisie 1- Construction d’une banque d’expression 2- Sélection Identification des partenaires de ma protéine NB: protéines de n’importe quel organisme, mais système hétérologue.
Le double-hybride systématique Idée: prendre tous les gènes d’un organisme comme appâts. cribler tous ces appâts contre une banque de proies. identifier toutes les interactions protéine-protéine possibles. Nécessité du haut débit, automatisation Plusieurs études systématiques 2 sur la levure 1 sur Helicobacter pylori 1 sur Caenorabditis elegans 1 sur l’homme
Génétique dans la levure Auxotrophie (HIS, TRP, LEU, ADE, URA …) Haploidie/diploidie Mating type Vecteurs/selection
Le double-hybride systématique sur le génome de la levure(1) Ito et al. (2001) PNAS * GAL4 DNA binding domain * Souche avec gènes rapporteurs ADE2 et HIS * GAL4 activation domain * Souche avec gène rapporteur URA - tous les ORFs de la levure fusion GAL4-DB fusion GAL4-AD - jeter les appâts faux positifs - 62 pools de 96 (c.a.d.?) - 62x62 réactions de mating - sélection - PCR des inserts - paires de séquences=ISTs Appâts Proies 841 interactions avec 3 ISTs
Le double-hybride systématique sur le génome de la levure(2) Uetz et al. (2000) Nature Tous les ORFs de la levure (6000), fusion DNA binding domain GAL4 et activating domain GAL4. 6000x6000, Idem étude précédente Array des 6000 souches haploides de levure Exprimant une fusion GAL4 activation domain Mating avec 192 clones exprimant une fusion GAL4-DNA binding domain Haut débit Lsm5 Clp1 Exemple: DBGAL4-Pcf11 Ada2 817 ORFs avec partenaires. 692 interactions Rna15 Faible débit 87 reproductibles, 281 interactions
Interactome de la levure red, lethal green, non-lethal orange, slow growth yellow, unknown
Principe différent: Construction dune banque de fragments génomiques aléatoires Définition de domaines d’interaction Calcul d’un score possible Data accessibles= Carte d’interaction Le double-hybride systématique sur le génome d’Helicobacter pylori, Rain et al. (2001) Nature
“PIM viewer” • pim.hybrigenics.com/pimrider/pimriderlobby/PimRiderLobby.jsp
Avantages/Inconvénients de l’approche double-hybride • Protéines chimères • Protéines hétérologues • 2 protéines à la fois • Compartiment cellulaire=noyau de la levure • Les faux positifs (auto-activateurs, protéines ‘collantes’) • Les faux négatifs • Conditions fixes • 90% d’interactions déjà connues non retrouvées! les moins • In vivo • Interactions transitoires ou instables • Indépendant du niveau d’expression naturel des protéines • Haut-débit • Avec une banque, définition de domaines d’interaction • (SID dans l’étude sur Helicobacter) les plus
bacterial adenylate cyclase two hybrid Karimova et al.J Bacteriol (2005) Y X X Y Basé sur la reconstitution de l’activité adénylate cyclase de la toxine CyaA de Bordetella pertussis T25 T25 T18 T18 Pas d’AMPc synthétisé AMPc+PPi ATP CAP Expression des gènes soumis à la répression catabolique (lactose, maltose)
ori p15A X Y ori pUC pKNT25 + Y pUT18 + X T25 T18 KmR AmpR Cotransformation dans une souche cya- Etude des interactions entre protéines membranaires impliquées dans la division cellulaire Recherche d’une activité AC Ex : détection activité b-galactosidase Pas d’interaction T18 + T25 Beta-Gal activity (U/mg) Interaction entre X et Y T18-X + T25-Y T18-fused proteins Karimova, G. et al., J Bact (2005) Milieu Amp+Km+Xgal (+IPTG)
La protéomique « fonctionnelle » • Identification systématique des partenaires protéiques: Description de l’interactome” À partir des séquences Par identification de protéines Double-hybride Co-purifications par affinité
Purification systématique des complexes protéiques d’un organisme Idée: * choisir une technique de co-purification par affinité. * construire une protéine recombinante étiquetée pour chaque gène de l’organisme choisi. * purifier tous les complexes. * identifier les composants par spectrométrie de masse. Atouts évidents: * Interactions stabilisées par plus d’un partenaire. * Caractérisation biochimique authentique. * Dans l’organisme d'intérêt.
Purification systématique de complexes Idée: * choisir une technique de co-purification par affinité. * construire une protéine recombinante étiquetée pour chaque gène de l’organisme choisi. * purifier tous les complexes. * identifier les composants par spectrométrie de masse. Exemples: * méthodes - TAP ou SPA * études systématiques - 2 chez la levure - chez E. coli
Tandem Affinity PurificationRigaut et al. (1999) Nat. Biotech. • Méthode • 2 étapes de purification par affinité • Conditions d’élution douces • Pas de surproduction de la protéine étiquetée. • Etiquette TAP • Calmodulin Binding Peptide (5kDa) • Site de coupure par la protéase TEV • 2 domaines de fixation aux IgG de la protéine A (20 kDa) • Variante: étiquette SPA (Zeghouf et al., 2004) • Calmodulin Binding Peptide (5kDa) • Site de coupure par la protéase TEV • 3 répétitions de l’épitope Flag
Tandem Affinity PurificationRigaut et al. (1999) Nat. Biotech. Identification par spectrométrie de masse
Identification des protéines par spectrométrie de masse(1) l’échantillon • Une protéine en solution, une protéine sur gel SDS-PAGE (mono ou bi-dimensionnel), ou un mélange de protéines • Exemple de purification d’un complexe: Protéines associées à l’Acyl Carrier Protein chez Escherichia coli EB47 ? EB48 EB49 ACP-TAP TEV ACP-CBP Gel SDS-PAGE 12% Coloré au Bleu de Coomassie
pic d’autolyse de la trypsine Étalonnage interne avec les ions d ’autolyse de la trypsine Obtention d’une liste de masses Identification des protéines par spectrométrie de masse(1) la mesure • Découpe et lavage des bandes (H20, NH4HCO3, CH3CN) • Réduction (DTT) et alkylation (Iodoacétamide) • Digestion à la trypsine (clive après Lysine et Arginine) et élution des peptides • Dessalage et mesure de masse des peptides
Interactome de la levureSaccharomyces cerevisiae Yeast genome 6,466 ORFs TAP cassette integration 5,474 (85%) TAP fusion expression 3,206 (59%) Overall purifications 3,206 Successful purifications 1,993 (62%) MS protein identifications 2,760 (58%) Complexes491 CELLZOME Gavin et al. (2002) Nature - Gavin et al. (2006) Nature - Krogan et al. (2006) Nature
Validation des nouvelles interactions • Purification “inverse” • Autre technique • Spécificité • Mutations annulant l’interaction • … D’après Bret and Finley (1997) Annu. Rev. Genet. pour le double hybride de levure
Interactome de Escherichia coli (1) Butland et al. (2005) Science Etiquette SPA (Sequential Peptide Affinity) CBP-Tev-3xFlag Méthode d’insertion chromosomique chez E. coli
Avantages/Inconvénientsde l’approche par purification • Protéines recombinantes • Expression faible ou artificielle • Haut-débit possible mais lourd • Contaminants (30% douteux!) • Interactions faibles perdues • Conditions fixes Les moins • Complexes en conditions natives • Complexes avec plus de 2 composants • Définition d’un réseau d’ordre supérieur entre les complexes Les plus
Interactomes publiés Bactériophage T7 (1996) 2-hybrid Vaccinia virus (2000) 2-hybrid Hepatitis C virus (2000) 2-hybrid Helicobacter pylori (2001) 2-hybrid S. cerevisiae (2000-2006) 2-hybrid et TAP et Flag C. elegans (2000-2005) 2-hybrid Escherichia coli (2005) TAP et SPA Homme (2004) 2-hybrid (partiel)
Interactomes publiés coli 2005 levure 2000 homme 2005 caenorhabditis 2005
Que peut nous dire cette masse de données? • Organisation et caractéristiques du réseau • Statistique • Description • Règles de prédiction • Identifier la fonction des gènes inconnus
Description des réseaux Réseaux de type « scale free » Petits mondes Levure Téléchargements peer to peer Réseau aléatoire
Description des réseaux -> protéines structurantes -> protéines létales
Description des réseaux • modules fonctionnels • Complexes (simultanées) • Signalisation (consécutives)
Réseau de complexes et Modules Gavin et al. (2006) Nature; Krogan et al. (2006) Nature Organisation de l’interactome de la levure Réseau de protéines Jeong et al. (2001) Nature
Prédiction de la fonction des gènes • Nécessité de méthodes bioinformatiques pour l’inférence à grande échelle. • Point de départ pour des études particulières. Exemple: machinerie de polyadenylation dans la levure
La protéomique « fonctionnelle » • Interaction physique • Double hybride dans la levure • Purification de complexes • Association fonctionnelle • Co-expression des ARNm (régulation commune) • Association génétique (synthétiques létaux) • Interactions prédites in silico • Fusion de gènes ou proximité • Conservation phylogénétique
Exemple du serveur STRINGhttp://www.bork.embl-heidelberg.de/STRING
Aperçu des autres approches de détection des interactions protéine-protéine à haut débit