420 likes | 602 Views
o.a. Primrose & Twyman, 7 e editie, pp.81-93 Primrose, Twyman & Old, 6 e editie, pp.70-83. Expressievectoren en proteïneproductiesystemen Expressie verwijst het gen , productie verwijst naar het proteïne , hoewel in het
E N D
o.a. Primrose & Twyman, 7e editie, pp.81-93 Primrose, Twyman & Old, 6e editie, pp.70-83 Expressievectoren en proteïneproductiesystemen Expressie verwijst het gen, productie verwijst naar het proteïne, hoewel in het jargon 'expressie' ook vaak verkeerdelijk voor proteïnen wordt misbruikt. Aangezien productie van een gekloneerd proteïne in hoge hoeveelheden gebeurt, is detectie en analyse van het rendement meestal relatief eenvoudig, en kan dit makkelijk door visualisering (kleuring) op SDS-PAGE. Hierbij kan expressie "voor" en "na" inductie vergeleken worden, evenals het celcompartiment of de toestand waarin het eiwitproduct zich bevindt : cytoplasmatisch versus periplasmatisch versus extracellulair, en oplosbaar of onoplosbaar. (Dit laatste aspect is niet in het voorbeeld van volgende figuur opgenomen.)
IPTG-geïnduceerde productie van RP4 proteïnen : (A) DNA primase (118 en 80 kDa proteinen) ; (B) 16.5 en 8.6 kDA proteinen. Waardcelstam : E. coli HB101. Analyse door SDS-polyacrylamidegel electroforese. (A) insert in directe (c, d) of omgekeerde (e,f) orientatie ; geïnduceerd (c, e) of niet-geïnduceerd (d,f) met IPTG. (a) referentie proteïnen ; (b) gezuiverd RP4 DNA primase (118 en 80 kDa). (B) insert in directe (b, c) or of omgekeerde (d,e) orientatie ; geïnduceerd (b, d) of niet-geïnduceerd (c,e) met IPTG. (f) referentie proteïnen ; (a) gezuiverd 16.5 kDa proteïne.
uit : J. Sambrook & D.W. Russell : Molecular cloning, a laboratory manual. 3rd edition, 2001
1. Basisaspecten - regulatie - hoge expressiewaarden kunnen - toxisch zijn (door het eiwitproduct) voor de cel - "metabolic drain" veroorzaken: dus verstoring van het metabolisme => iedere verandering die het expressieniveau verlaagt (bvb. door mutaties, verlies van plasmide, ...) zal de betrokken cel een selectiefgroeivoordeel geven - vermijden van toxiciteit : groei de celpopulatie tot een geschikt aantal vooraleer de synthes van het gekloneerde eiwit aanvangt, m.a.w. induceer de expressie (en tot dan, hou het gen onder repressie) - induceer expressie in de laat-logaritmische fase (terwijl de cellen nog voldoende metabolisch actief zijn) - regulatie is in hoofdzaak een zaak van transcriptiecontrole - andere factoren: translatie, stabiliteit (van vector, transcript en product)
- transcriptie : - E.coli RNA polymerase : a2, b, b' algemene promotorstructuur (‘consensus’ sequenties) s70 promotor : TTGACA (16-19 nt) TATAAT (5-8 nt) start (+1) (zones / optimale afstanden)-35(17) -10 (7) UP-elementen kunnen een extra invloed op efficientie hebben - initiatie : efficiente promotoren en hun regulatie - lacUV5 : IPTG, LacI, LacIq, titration, 'leakiness' - trp : tryptofaan + aporepressor (TrpR), IAA inductie - Ptac : upstream -20 Plac + downstream -20 Ptrp (cfr. PtacI, PtacII, Ptrc, en andere varianten) inductie door IPTG - PL, PR : repressor CIts857 : inductie door temperatuurshift of : CIwt + inductie by mitomycine C (nb. CIts857 is minder efficient als regulator (repressor) dan wild type CI) vervolgt
E. coli Pribnow box (-10) T89 A99 T50 A65 A65 T100 s70 binding site (-35) T85 T83 G81 A61 C69 A52 E. coli promoters, en hybride promoters tacI en II E. coli transcriptieterminatie (r-onafhankelijk)
vervolg - T7 : toelevering van T7 RNA polymerase is vereist - gekodeerd op een ander (compatibel) plasmide - gekodeerd door een l profaag (cIts) (in een E.coli lysogen) - door infectie met een M13mp-recombinant kloon van het polymerasegen (het T7 gen1) - araBAD : arabinose + AraC : positieve en negatieve regulatie => PL en PBAD worden zeer efficient geblokkeerd, Plac (en zijn derivaten) zijn ‘leaky’; met de faag T7 promotor (en andere specifieke faagpromotoren), wordt alle interferentie met het E.coli polymerase vermeden. - terminatie kan zijn : - factor-afhankelijk (Rho (r), Tau (t), NusA (van faag l)) - factor-onafhankelijk (GC-rijke stam-lusstructuur + oligoT-reeks) => meest gebruikt in expressievectoren zijn : - de fd terminator (in Ff fagen tussen gIII en gVIII, zie figuur in deel 6) - de rrnB operon terminatoren T1 en T2 - faag T7 terminator Tf
- translatie - initiatie: RBS (ribosome binding site), AUG (of GUG, 91 vs 8% in E.coli) - sequentie motief : Shine-Dalgarno sequentie RBS > < Shine-Dalgarno (SD) motief RBS = ongeveer 55 nt tussen posities –35 en + 22 (versus AUG) SD : 16S rRNA 5'….GUACACCUCCUAOH3' (E.coli) basispatroon : 5'….AGGA… +/- 7nt … AUG(start)… 3' efficientie is vrij onvoorspelbaar variaties : GAGG, GGAG, GGAGG - secundaire structuur - het AUG (GUG) initiatietriplet moet goed toegankelijk zijn, bvb. gelegen op detop van een stam-lusstructuur (en dus niet in baseparing betrokken) - triplets die volgen achter AUG beïnvloeden de efficientie (zoals ook de nucleotiden die het AUG voorafgaan, en uiteraard ook de secondaire structuur van dit gebied) vervolgt
vervolg - codon gebruik - het effect van codongebruik is zeer complex - zelfde aminozuur => multipele codons - zelfde codons => multipele tRNA's - verschillende codons => zelfde tRNA - codon-anticodon bindingsterkte - vergelijking van frequentie (in E. coli) van codongebruik tussen genen met hoog expressieniveau en deze met laag expressieniveau, toont het effect van sommige triplets (ongeacht of deze vaak gebruikt worden of niet) (zie Tabel) - met synthetische genen : kan men bewust systematisch kiezen voor telkens het 'optimale' triplet : dit garandeert een goed productierendement (hetgeen echter daarom niet het hoogst mogelijke is) - gendosiseffect - toename van aantal kopijen van de vector heeft - geen effect - een positive effect - een negative effect (vb. expressie van het trypsinegen ) => niet voorspelbaar, geen algemene regel, kan alleen empirisch bepaald worden
Kodewoordgebruik in E. coli van sterk en zwak tot expressie komende genen "sterk" : 24 genen (5253 triplets), o.a. 12 voor ribosomale proteïnen, 7 voor "outer membrane" proteïnen, en voor sommige RNA polymerase subeenheden en translatie-initiatie- en terminatiefactoren. "weak" : 18 genen (5231 triplets), o.a. voor verschillende repressorproteïnen, lac-permease, enz. kleine kadertjes : een enkel tRNA voor synonieme codons ; dus voor deze is interactiesterkte anticodon-codon bepalend
- stabiliteit - een transcriptieterminatiesignaal achter het doelwitgen is nodig voor stabiliteit van het plasmide - par locus (of loci) helpt voor plasmidestabiliteit (belangrijk op moment van inductie) - transcript stabiliteit : mRNA degradatie is een complex proces - zowel 5' als 3' UTR spelen een rol (bvb. een stam-lusstructuur in het 5' UTR geeft stabilisatie) - er is geen omgekeerde correlatie tussen grootte en halfwaardetijd van een mRNA bijgevolg: degradatie is niet afhankelijk van a-specifieke endonucleolytische splitsing - proteïne stabiliteit : degradatie is sterk gereguleerd in E.coli : er is een groot aantal proteasen in het cytoplasma, periplasma en aan de binnenste en buitenste membranen. vervolgt
vervolg N-regel van Varshavsky : (maakte een recombinant proteïne met als N-terminaal aminozuur telkens een ander) - varianten met R, K, L, F, Y, W : halfwaardetijd (T1/2) van 2 min - varianten van de andere aminozuren (behalve P) : T1/2 = 10 uur Wat met het initiërende methionine ? : - meestal wordt het Metformyl(als eerste aminozuur van een celeigen eiwit) afgesplitst - hoe makkelijk kan dit met 'cel-vreemde' eiwitten? => niet meteen voorspelbaar - gebeurt blijkbaar makkelijkst als 2de aminozuur een korte zijketen heeft (vergemakkelijkt de splitsing door het methionine aminopeptidase) Stressconditiesveroorzaken inductie van genen voor bepaalde proteasen, o.a. het protease La (lon gen) deze staan onder controle van s32 promotoren : - het gen voor deze RNA polymerase s32 subeenheid is rpoH - mutanten in rpoH kunnen een dramatische toename van expressierendement geven (en van productstabiliteit) Nog heel wat meer specifieke observaties werden gemaakt waarmee rekening kan gehoudenworden.
2. Voornaamste expressiesystemen(inductie en regulatorische circuits) enkele voorbeelden - het pET systeem - met T7 RNA polymerase - extra regulatie (repressie) door LacI (inductie door IPTG) - toelevering van T7 RNA polymerase vanuit een aparte expressieëenheid op een l (DE3) profaag met PlacUV5 als promoter (ook onder LacI controle : lacO) - additionele controle door lysozyme van T7 LysE (or S) (gekodeerd op een(pACYC-afgeleid) compatibel plasmide) => het lysozyme bindt aan en inhibeert (residueel) T7 RNA polymerase - het binaire trp-cI systeem - dubbel systeem met compatibele plasmiden - doelwitgen stroomafwaarts van de PL promotor - synthese van CI (gekodeerd door cI repressorgen) wordt gereguleerd door Ptrp - toevoeging van tryptofaan activateert expressie van het doelwitgen door afsluiten van de CI synthese : vroeger reeds gezien : regulatie door CIts857 kan ook op basis vantemperatuur, maar : die regulatie is minder strict (wt-CI bindt efficienter) én toevoeging van een inductor in grote fermentoren is eenvoudiger dan het verhogen van de temperatuur ;bovendien kan een temperatuurshift stressmechanismen (heat-shock) induceren
Expressiecontrole op de Ptrp promoter door de l CI repressor
- pBAD systeem - dimeer AraC bindt aan I1 en O2 operatorplaatsen (de DNA lus blokkeert transcriptie) - dimeer AraC + arabinose : bindt aan de I1 en I2 plaatsen dit is cataboliet repressie gevoelig : CAP + cAMP (cAMP = is laag als glucose concentratie hoog is) => samenspel van arabinose en glucose concentraties kan gebruikt wordenals fijnregeling van het expressieniveau (nb. CAP-regulatie is ook aanwezig in het Lac operon, maar tac promotoren zijn niet CAP-afhankelijk)
Regulatie van de PBAD promoter en expressie in pBAD vectoren
3. Productiestrategieën E. coli : is het majeure "eerstelijns" organisme voor expressie => nadelen (beperkingen) - geen (of zeer weinig) post-translationele modificaties - nagenoeg geen efficiënte secretiewegen naar het medium (secretie brengt het proteïne in de periplasmatische ruimte) - extensieve S-S bruggen zijn meilijk te vormen Waarom recombinante expressie/productie ? => opdrijven van het productierendement => zuivering vergemakkelijken => nieuwe eiwitvarianten creëren (mutaties, inserties, fusies, enz.) Het expressieproduct is : - oplosbaar of onoplosbaar - als matuur proteïne of als fusieproduct - accumuleert in cytoplasma of wordt gesecreteerd naar periplasma (type II secretie) (met E. coli is mogelijke extracellulaire secretie zeer beperkt, één voorbeeld : type I secretie van haemolysine) vervolgt
vervolg Expressieproduct : - als matuur proteïne - kan aggregeren en precipiteren als 'inclusion bodies' - maakt zuivering gemakkelijk - beschermt tegen afbraak - vereist achteraf solubilisatie en hervouwing => denatureer (in bvb. guanidinium hydrochloride) en (tracht te) renatureren - vertraging van synthesesnelheid kan het aggregatieproces (deels) inperken (bvb. door verlaging van de incubatietemperatuur) - het expressieconstruct vereist kritische manipulatie van het RBS gebied om efficiente (op hoog niveau) translatie-initiatie te verzekeren - het MET-probleem : wordt de initiator (formyl-)methionine verwijderd ? vervolgt
"Inclusion bodies" in E. coli (Scanning electronmicrograph) (Thin section through the cells)
Hoe de vorming van inclusion bodies vermijden(of verminderen) ? (verbetering van de kans op eiwitvouwing) - cellen groeien bij lagere temperatuur (vertraagt het expressieproces) (of gebruik andere groeivertragende condities, bvb. samenstelling van media & pH waarden) - co-expressie van chaperonen : DnaK, GroES, GroEL - verwijdering van kritische aminozuurposities (bvb. in interferon-b) - fusie aan thioredoxine, of sommige andere eiwitten (zoals MalE)
vervolg - als fusieproteïne(bvb. random inserties in ScaI van cat : AGT'ACT) - N-terminale en C-terminale fusies zijn mogelijk (of multipele partners) - voordeel van C-terminale fusies : translatie-initiatieëfficiëntie wordt grotendeels behouden - fusiepartner kan doelwit zijn voor zuivering (etiket) - fusiepartner kan een activiteit hebben waarmee het productieniveau gevolgd kan worden - fusie aan een signaalpeptidesequentie kan secretie geven => secretie laat vorming van (minstens sommige) S-S bruggen toe - fusiepartner kan verankering in de membraan bewerkstellingen - een epitoop herkend door aan specifiek antilichaam kan voorzien worden (voor detectie of kwantificering of zuivering) - keuze tussen cytoplasmatische of periplasmische productie (secretie) vervolgt
Constitutieve expressie van het cat gen, en fusies door random klonering in de ScaI plaats (baan 2) (banen 1, 6, 7, 9-15) Banen 4 en 5 zijn plasmide-vrije cellen ; banen 3 en 8 zijn proteïne-lengtemerkers.
Verschillende mogelijkheden van translatiefusieconstructen S : signaalsequentie ; I : membraanintegratiedomein ; A, B : fusiepeptiden, o.a. affiniteitsetiketten Het gebruik van membraanintegratiedomeinen laat toe het proteïne te verankeren in één van de membraansystemen of in de celwand.
vervolg Secretie : is een bijzondere vorm van fusie - de fusiepartner (signaalpeptide) wordt verwijderd tijdens secretie - er is dus geen (extra) methionine aan de N-terminus - (de voorspelde) positie van splitsing is niet altijd gegarandeerd => meestal moet men verschillende secretiesignalen testen : van OmpA, OmpT, PelB, b-lactamase, alkalische fosfatase, enz. Sommige hiervan geven bij voldoende overexpressie ook lekkage naar het groeimedium. - !!! maar : niet alle proteinen zijn ‘secreteerbaar’ (zelfs al is er een signaalpeptide) In het algemeen : 1) kleine peptiden : vaak stabiliteitsprobleem (afbraak van het peptide) => fusiebenadering te verkiezen : bvb. LacZ fusies 2) intermediaire grootte: weinig S-S : intracellulaire aanmaak meer S-S : periplasmische aanmaak (secretie) 3) grote proteïnen : problematischer
4. Zuivering en verwerking Fusies die makkelijke zuivering mogelijk maken: o.a. aan glutathion-S-transferase, MalE (MBP : maltose bindingsproteïne), oligo-His (hexa-His), enz. : partners of etiketten. Zuivering door affiniteitschromatografie of door immobilisatie gevolgd door elutie. Vrijzetting van het etiket/de partner door splitsing met specifieke proteasen zoals factor Xa, enterokinase, enz., of gebruik van ‘intein processing’. Voorbeelden van affiniteitsetiketten ("tags")
Voorbeelden van expressie-fusie systemen : 1. C-terminale fusie in pBAD/His vectoren - zes Histidine triplets - insertie in het juiste leesraam : BglII knipplaats - binding aan een kolom met geïmmobilizeerd Ni2+ - splitsingsplaats voor enterokinase (D-D-D-D-K* ) (* = splitsingsplaats) (n.b. enkele resterende aminozuren blijven aan de N-terminus na verwerking) 2. C-terminale fusie aan biotine carboxylase - biotine covalent aangehecht aan een lysine door biotine ligase (BirA) (E. coli heeft één gebiotinyleerd eiwit maar dit bindt niet aan streptavidine in zijn natieve vorm) doelwit is N-terminaal als tag voorzien - immobilisatie aan streptavidine (batchgewijs of door affiniteitschromatografie) - factor Xa splitsingsplaats : I-E-G-R* of I-D-G-R* (niet gevolgd door P of R) (* = splitsingsplaats) (secundaire plaatsen meestal op G-R*)
Proteïneproductie en verwerking met pBAD/His vectoren C-terminale fusie 6 His-resten voor affiniteits- zuivering splitsing door enterokinase (D-D-D-D-K-*) na verwerking blijven nog een paar extra aminozuren aan de N-terminus
C-terminale fusie aan biotine carboxylase Binding op streptavidinekolommen voor zuivering. Verwerking met factor Xa protease (I-E-G-R-* of I-D-G-R-*(niet gevolgd door P of R))
~100 aminozuren ~50 aminozuren 3. N-terminalefusie aan en verwerking door inteïne - N-terminale fusie aan inteïne + chitine bindingsdomein (CBD) => zelf-splitsing aan de N-terminus van het inteïne door een thiol - expressie vanaf de T7 promotor, in fusie met lacO => inductie door IPTG - bind het fusieproduct aan de chitinekolom - was de kolom, en equilibreer de kolom met een DTT-oplossing => in situ splitsing bij 4°C gedurende een nacht - elueer het doelwitproteïne - verwijder de fusiepartner (inteïne-CBD) van de kolom met SDS Splicing van een inteïne
Verwerking van een N-terminale fusies aan inteïne, met immobilisatie op een chitinekolom
4. MalE-fusies : vectoren pMAL-c2 en pMAL-p2 (met (c) of zonder (p) de signaalpeptidesequentie van het malE gen : cytoplasmische of periplasmatische expressie) - expressie-eenheid tussen de Ptac promotor en rrnB terminatoren, metlacIq op de vector om voldoende lac-repressor te voorzien. - fusie tussen de malE partner en lacZa, gescheiden door10xD en een MCS voor insertie van het doelwitgen. De in-frame constructie produceert blauwe kolonies op BCIG-media. Het polaire 10xD peptide scheidt de twee proteïnedelen (eigen vouwing). Klonering in de MCS geeft witte (kleurloze) kolonies. - affiniteitszuivering op een amylosekolom : na elutie met maltose en splitsing door factor Xa, wordt fusiepartner MalE verwijderd door een 2e chromatografie op amylose. - MCS bevat (aan de linkerzijde) een XmnI, die overlapt met de factor Xa knipplaats en een exacte fusie aan het doelwitgen mogelijk maakt : andere insertieplaatsen laten enkele extra aminozuren aan het N-terminale uiteinde na factor Xa splitsing. - de EcoRI kloneerplaats ligt in hetzelfde leesraam als de EcoRI plaats in lacZ : dit vergemakkelijkt de uitwisseling van een gen dat als een expressiefusie gekloneerd is in (ondermeer) de vektor lgt11.
pMAL expressievectoren malE : kodeert voor maltosebindend proteïne (MBP)
Karakteristieken van pMAL vectoren : • ColE1 ori ; M13 ori ; Ptac ; rrnB terminators ; lacIq ; bla • Fusieconstruct : malE - DDDDDDDDDD - IEGR - MCS(polylinker) - lacZa • (bij doorlezing in het leesraam : blauwkleuring met IPTG + BCIG) • pMAL-c2 : malE signaalpeptidesequentie is gedeleteerd • pMAL-p2 : met malE signaalpeptidesequentie : secretie naar het periplasma • fusie in XmnI : exacte koppeling van het doelwitproteïne aan de factor Xa sequentie • 10 Asp eenheden (D) scheiden de twee fusiegedeelten • insertie in EcoRI is identisch (qua leesraam) als in lgt11 (lacZ) Splitsingsplaats van factor Xa I - E - G - R * XmnI nnn nnn nGA Ann nnT TCn nnn ATC-GAG-GGA-AGG-ATT-TCA-GAA-TTC- EcoRI
"Multiple cloning site" in (één van) de pMAL vectoren Andere mogelijkheid (in sommige vectoren) Pro-Gly-Ala-Ala-His-Tyr : splitsing door Genenase I (een geëngineerde vorm van subtilisine) splitst achter His-Tyr (afhankelijke van het volgende aminozuur) (splitst His-Tyr-Glu en His-Tyr-Asp traag, en His-Tyr-Pro en His-Tyr-Ile niet)
Verwerking van expressieproducten uit fusieconstructen in pMAL vectoren
5. Pinpoint vectoren - gelijkaardige elementen als in vorige voorbeelden : tac (en T7) promoter, insertieplaatsen, etiket, factor Xa doelwit, enz. hier tevens SP6 (naast T7 vanop andere streng) promoter voor synthese van RNA - N-teminaal is een etiket waarin een lysine gebiotinyleerd wordt door het E. coli biotinligase holoenzyme Het lysine is toegankelijk voor (strept)avidine : => etiket voor detectie en zuivering E. coli produceert slechts één enkel endogeen gebiotinyleerd proteïne dat, in zijn natieve conformatie, niet bindt aan avidine : => zeer specifiek zuiveringssysteem voor het recombinante fusieproteïne. Detectie mogelijk met streptavidine-alkalische fosfatase. - het fusieproteïne bindt aan (strept)avidine, en kan geëlueerd worden door toevoeging van 5mM biotin : => geen denaturaterende condities vereist.
(Commerciële) Pinpoint vectoren twee promoters : T7 en tac factor Xa knipplaats N-terminale biotinylering (tag) polylinker (MCS) in vitro RNA sondes met de SP6 (of T7) promoter secretiesignaal (sommige vectoren) Detectie door streptavidine-alkalische fosfatase Elutie van fusieproteïne met 5 mM biotine (dus : geen denaturatie vereist)
5. Optimalisatiestrategieën bvb. C-terminale fusie aan een reportergen om expressierendement te testen in functie van (kleine) wijzigingen. Ondermeer door regio-specifieke willekeurige mutaties (o.a. in het gebied van ribosoombinding en initiatie) kan de beste producer geïdentificeerd worden. Op analoge wijze kan een N-terminale fusie aan een reportergen voorzien worden, en dusdanig dat na optimalisatie (regio-mutagenese) kan het reportergen geëxciseerd kan worden. Er wordt dan op gespeculeerd dat het C-terminale deel van de fusie geen invloed heeft op de expressieëfficientie.
Addendum : Genoomstrategie : lokaliseren van coderende gebieden (ORFs) in een genoomsequentie