430 likes | 1.23k Views
La trascrizione negli eucarioti. Le sequenze codificanti costituiscono <2% del genoma umano. Il gene eucariotico consiste in un certo numero di elementi distinti che ne regolano la trascrizione, posti sul lato 5 ’ del sito di inizio della trascrizione. Promotore di un gene eucariotico.
E N D
Le sequenze codificanti costituiscono <2% del genoma umano. Il gene eucariotico consiste in un certo numero di elementi distinti che ne regolano la trascrizione, posti sul lato 5’ del sito di inizio della trascrizione.
Promotore di un gene eucariotico • TATA box: è il sito di legame per la proteina che lega TATA (TBP), importante subunità del complesso trascrizionale TFIID. E’ presente in circa il 30% dei promotori • BRE (TFIIB Recognition Element (Elemento di riconoscimento di TFIIB) • Inr: è l’elemento iniziatore della trascrizione; funzionalmente simile al TATA box, viene riconosciuto da altre due subunità di TFIIB: TAF1 (fattore 1 associato a TBP) e TAF2 (fattore 2 legato a TBP) • MTE (Motif Ten Element, Elemento del motivo dieci): elemento del nucleo del promotore che promuove la trascrizione da parte dell’RNA pol II quando è localizzato in posizione +18 a + 27 da Inr • DPE (Downstream Core Promoter Element, Elemento a valle del promotore): è costituito da 7 nt (da +28 a +32 rispetto ad Inr), è conservato da Drosophila all’uomo, e funziona nei promotori TATA-less. A differenza del TATA box, DPE richiede la presenza di un Inr. E’ legato dalle subunità TAF9 e TAF6 di TFIID.
Elementi regolatori a lungo raggio • Sono delle sequenze regolatrici presenti nei geni di eucarioti multicellulari che possono funzionare a distanze di 100 kb o più dal promotore del gene. • Sono fondamentali per mediare i complessi schemi di espressione genica durante lo sviluppo. • Enhancer • Silenziatori • Isolatori • Regioni di controllo del locus (LCR) • Regioni di attacco alla matrice (MAR)
Enhancer Un enhancer è tipicamente lungo circa 500 bp e contiene in media 10 siti di legame per fattori di trascrizione. Si trova a 700-1000 bp dal sito di inizio della trascrizione e potenzia l’attività del promotore. Quest’azione può essere indipendente dall’orientamento e dalla distanza dell’enhancer dal sito del promotore. In alcuni casi l’enhancer può essere posizionato all’interno dell’unità di trascrizione
Isolatori • L’isolatore è una sequenza di DNA, di solito lunga da 300 a 2000 bp, che possiede due funzioni: • Marcatore di confine fra regioni di eterocromatina (ricca di geni) ed eucromatina (povera di geni ed altamente condensata). • Attività di blocco di un enhancer/silenziatore (impedisce un’attivazione o una repressione inappropriata di geni circostanti)
LCR (Locus Control Region) • Le LCR sono sequenze di DNA che organizzano e mantengono un dominio funzionale di cromatina attiva e potenziano la trascrizione dei geni a valle. • Locus della famiglia dei geni della b-globina: questo locus codifica l’e-globina embrionale, le due g-globine fetali (Gg e Ag) e le d- e b-globine adulte. La regione LCR, che si trova a monte del gene dell’e-globina, è costituita da 5 siti ipersensibili alla Dnasi I (HS1-HS5). • Modello del reclutamento del complesso di trascrizione: il macchinario della trascrizione (RNA pol II e complesso del preinizio) ed altre proteine regolatrici vengono reclutati dalla LCR per formare un “olocomplesso”. La cromatina, sotto l’effetto dell’azione di alcuni TF (NF-E2, GATA-1 ed il suo cofattore FOG-1), assume una conformazione “ad ansa”, la quale fa si che l’olocomplesso si avvicini ai siti di inizio della trascrizione, facendone aumentare la velocità
S/MAR (Scaffold/Matrix Attachment Region) Le S/MAR sono sequenze di DNA, localizzate di solito vicino ad enhancer, che conferiscono specificità tissutale e controllo durante lo sviluppo dell’espressione genica reclutando TF e fornendo una “piattaforma di atterraggio” per numerosi enzimi del rimodellamento della cromatina. Esistono due tipi di MAR: MAR strutturali (che servono da ancore) e MAR funzionali (più dinamiche, che aiutano a portare i geni sulla matrice nucleare). • Un gene (freccia grigia) è localizzato all’interno di un dominio ad ansa della cromatina con MAR strutturali (blu) alle estremità ed una MAR funzionale (arancio) posta vicino al promotore. • Quando il gene deve associarsi alla matrice nucleare, la MAR funzionale sposta il gene e dà inizio alla trascrizione in presenza di TF. • Terminata la trascrizione, la MAR funzionale viene rilasciata dalla matrice nucleare allontanando il gene dal macchinario della trascrizione stessa. • La dissociazione della MAR funzionale rispristina lo “stato silente” del gene, pronto ad una nuova trascrizione.
Regolazione della trascrizione genica • Nel genoma umano esistono probabilmente 3000 proteine coinvolte nella regolazione dell’espressione genica (circa 300 nel lievito, 1000 in Drosophila), divise in tre classi principali: • Il macchinario generale (basale) della trascrizione, costituito dai diversi componenti delle complesse macchine multiproteiche delle RNA pol, necessari per il riconoscimento del promotore e la catalisi della sintesi di RNA • I fattori di trascrizione (TF), proteine che legano specifiche sequenze di DNA mediando l’attivazione o la repressione della loro trascrizione • I coattivatori ed i corepressori trascrizionali, proteine che fanno aumentare o diminuire l’attività trascrizionale attraverso interazioni proteina-proteina, senza legarsi direttamente al DNA
Macchinario generale della trascrizione • E’ costituito da tre componenti principali: • RNA pol II: polimerasi composta da 12 subunità, capace di sintetizzare RNA ed eseguire correzione di bozze del trascritto nascente • Fattori generali di trascrizione: sono 5 TF (TFIIB, TFIID, TFIIE, TFIIF e TFIIH), responsabili del riconoscimento del promotore e dello svolgimento del DNA del promotore. • Mediatore: complesso di 20 subunità che trasduce informazioni regolatrici da attivatori e repressori all’RNA pol II.
Formazione del complesso di preinizio ed inizio della trascrizione Assemblaggio del complesso di preinizio della trascrizione Questa fase ha inizio quando il fattore di trascrizione TFIID si lega al promotore. Questo legame fornisce una “piattaforma” per reclutare TFIIB e TFIIF e l’RNA Pol II (in complesso con il Mediatore), e infine TFIIE e TFIIH. CTD: C-Terminal Domain dell’RNA Pol II. Consiste di ripetizioni esapeptidiche della sequenza Tyr-Ser-Pro-Thr-Ser-Pro-Ser (che possono arrivare fino a 52) ed è necessario per la modificazione dell’mRNA in vivo. Durante la trascrizione, CTD viene fosforilato in Ser2 e Ser5: questa fosforilazione è catalizzata da TFIIH e da altre chinasi, mentre la defosforilazione è catalizzata da una fosfatasi (Fcp1). Quando è fosforilato, il CTD può legare i fattori di modificazione dell’mRNA.
Formazione del complesso di preinizio ed inizio della trascrizione A sinistra: struttura “a sella” della TBP, legata ad una sequenza di DNA che contiene il TATA-box. A destra: complesso di inizio “minimo” della trascrizione, composto da RNA Pol II e da fattori generali della trascrizione
Inizio: La trascrizione ha inizio quando l’attività elicasica del TFIIH svolge il DNA la sua attività chinasica fosforila il CTD dell’RNA pol II. Clearance del promotore ed allungamento: Quando l’RNA pol II lascia il promotore per trascrivere il gene, TFIID rimane legato al TATA-box, permettendo la formazione di un nuovo complesso stabile. Reinizio: Il reinizio richiede la defosforilazione del CTD, affinchè l’RNA pol II possa nuovamente posizionarsi sul promotore.
Mediatore Il mediatore è uno dei tre componenti principali del macchinario della trascrizione. Esso è costituito da una testa, un modulo centrale ed una coda e viene espresso esclusivamente negli eucarioti, dove serve da “ponte molecolare” che connette gli attivatori trascrizionali legati ad un enhancer oppure altri elementi regolatori all’RNA pol II. Non è necessario per la trascrizione basale da parte dell’RNA pol II.
Fattori di Trascrizione • I fattori di trascrizione (TF) sono delle proteine capaci di influenzare la velocità di trascrizione di geni specifici positivamente o negativamente (rispettivamente attivatori o repressori) tramite interazioni specifiche con elementi regolatori del DNA e/o mediante interazioni con altre proteine. • I TF che potenziano la trascrizione agiscono attraverso vari meccanismi: • Stimolazione del reclutamento del legame dei fattori generali di trascrizione e dell’RNA pol II al nucleo del promotore per formare il complesso del preinizio • Induzione di un cambiamento conformazionale o di una modificazione post-traduzionale (come la fosforilazione) che stimola l’attività enzimatica del macchinario generale di trascrizione • Interazione con i complessi di rimodellamento e di modificazione della cromatina per permettere una migliore accessibilità del DNA stampo ai fattori generali di trascrizione o ad attivatori specifici. • Molti TF sono membri di famiglie multiproteiche (es. alcuni recettori nucleari, NF-kB, Sp1) all’interno delle quali spesso presentano proprietà di legame al DNA correlate, ma caratteristiche di attivazione/repressione distinte.
I TF sono proteine modulari, costituite da più domini. I principali sono tre: • Dominio di transattivazione • Dominio di legame al DNA • Dominio di dimerizzazione • Possono essere presenti, inoltre, ulteriori domini: • Dominio di localizzazione nucleare (NLS) • Dominio di esportazione nucleare (NES) • Dominio di legame a ligandi (es. i domini che legano gli ormoni)
Domini di legame al DNA Lo schema di riconoscimento più comune fra TF e DNA è un’interazione fra domini ad a-elica della proteina e circa 5 bp nel solco maggiore o minore del DNA. Ciò perché l’a-elica ha una forma complementare alla superficie del DNA formata da basi e fosfati. Per il legame ad alta affinità, entrambe le superfici devono corrispondere esattamente in termini di legami idrogeno e contatti idrofobici. Prima del legame TF/DNA, i rispettivi gruppi polari (N-H, O-H, N o O) formano legami idrogeno con molecola di acqua circostanti. La maggior parte di questi legami viene quindi sostituita nel complesso TF/DNA da legami idrogeno formati direttamente fra proteina ed ac. nucleico; questo fenomeno conferisce stabilità al complesso. Sulla base dei domini che legano il DNA, molto TF si dividono in gruppi, definiti da “motivi”. Motivo: gruppo di residui di amminoacidi che ha uno schema caratteristico di ripiegamento tridimensionale, in virtù del quale svolge una specifica funzione.
Motivo elica-giro-elica (helix-turn-helix, HTH) • Il motivo HTH è stato il primo dominio ad essere caratterizzato. Identificato nel 1982 confrontando le strutture di CAP (catabolite activator protein, E. Coli) e di Cro (repressore proteico del fago l). E’ un semplice ripiegamento di AA composto da 3 a-eliche centrali che formano un fascio elicoidale destrogiro. Le 3 a-eliche sono mostrate in verde (H1, H2, H3), mentre i giri sono in blu. • L’a-elica 3 (centrale), o “elica di riconoscimento”, forma l’interfaccia principale fra la proteina ed il DNA inserendosi nella sua scanalatura principale.
Omeodominio E’ una variante del motivo HTH ed è costituito da un dominio conservato di 60 AA, codificato da una sequenza “homeobox” di 180 bp di DNA. I geni homeobox, così chiamati perché mutazioni a carico di alcuni di essi portano ad una trasformazione “omeotica” (in cui una parte del corpo o della pianta è sostituita da un’altra o viene duplicata), codificano per TF coinvolti nella regolazione di molti programmi di sviluppo embrionale, fra cui la formazione degli assi corporei, lo sviluppo degli arti e l’organogenesi. Alcuni geni Hox sono espressi anche in tessuti adulti, ad es. fegato, rene, intestino, in cui si ritiene abbiano un ruolo nel differenziamento rigenerativo delle cellule.
Dominio a dita di zinco (zinc finger domain, Zif) E’ uno dei motivi più diffusi; descritto nel 1985 per il TFIIIA di Xenopus (fattore essenziale per la trascrizione del gene dell’rRNA 5S). Il “dito” è formato da cisteine e/o istidine non contigue che legano covalentemente uno ione zinco (Zn2+) centrale, facendo ripiegare un breve tratto della catena di AA in un dominio ad ansa. Il dito inserisce la porzione dell’a-elica nella scanalatura principale del DNA. Generalmente, fra i moduli a dita di zinco si trova una regione linker di 7-8 AA. Il numero degli Zif varia nei diversi TF che li contengono.
Motivo a cerniera lampo di leucina basica (basic leucine zipper, bZIP) Non è così comune come i motivi HTH e Zif; descritto nel 1987 per la proteina che lega CAAT/enhancer (C/EBP), che riconosce il CAAT-box presente in molti promotori. bZIP non è il dominio di un TF che lega il DNA e non ha contatto diretto con esso, ma possiede un ruolo strutturale, facilitando la dimerizzazione di due TF simili. Nell’immagine è illustrato il complesso AP-1/DNA. AP-1 è un dimero, formato da due TF, Jun e Fos. Due eliche formano una cerniera lampo con i residui di leucina (riquadro)
Motivo elica-ansa-elica basico (basic helix-loop-helix, bHLH) Si differenzia dal motivo HTH perché forma due eliche anfipatiche, che contengono tutti gli AA carichi su un lato dell’elica, separate da un’ansa non elicoidale. Come bZIP, non è il dominio di un TF che lega il DNA e non ha contatto diretto con esso, ma possiede un ruolo strutturale, facilitando la dimerizzazione di due TF simili. L’unione di due bHLH porta al corretto posizionamento dei due domini che legano il DNA: questi domini sono ricchi in AA basici e possono direttamente interagire con il DNA acido.
Coattivatori e corepressori trascrizionali • Sono proteine che fanno aumentare o diminuire l’attività trascrizionale, senza legarsi direttamente al DNA. Si legano, invece, a TF e servono da impalcatura per il reclutamento di altre proteine. • I coattivatori possono essere suddivisi in due classi principali: • Complessi di modificazione della cromatina: sono complessi multiproteici che modificano gli istoni dopo la traduzione, in modo permettere ad altre proteine di accedere più facilmente al DNA • Complessi di rimodellamento della cromatina: ne fanno parte i complessi multiproteici della famiglia di SWI/SNF di lievito (o dei loro omologhi BRG1 e BRM dei mammiferi) e di famiglie correlate che contengono attività di svolgimento del DNA dipendenti da ATP. • I corepressori hanno un effetto opposto sulla struttura della cromatina, rendendola inaccessibile al legame da parte dei TF o resistente alla loro azione.
Complessi di modificazione della cromatina Svolgono un ruolo centrale sia nell’attivazione che nella repressione dei geni. Fino ad una decina d’anni fa, gli istoni erano considerati unità inerti che compattavano il DNA in nucleosomi; i nucleosomi, a loro volta, erano ritenuti repressori generali della trascrizione che rendevano le sequenze di DNA inaccessibili ai TF. Le code terminali degli istoni H2A, H2B, H3 e H4 sporgono dal nucleo dell’ottamero e sono soggette ad una vasta gamma di modificazioni post-traduzionali. Poiché queste modificazioni alterano l’accessibilità della cromatina al macchinario generale della trascrizione, è stato proposto che funzionino come interruttori principali on/off, determinando se un gene è attivo o inattivo. Sono noti diversi tipi di modificazioni delle code istoniche che hanno un ruolo nella regolazione dell’espressione genica: acetilazione di lisine, metilazione di lisine e arginine, ubiquitinazione di lisine, fosforilazione di serine e treonine, ADP-ribosilazione, sumoilazione.
Istone acetiltrasferasi L’enzima istone acetiltrasferasi (HAT) dirige l’acetilazione (aggiunta del gruppo acetile CH3CO) al gruppo e-amminico di uno o più residui di lisina degli istoni. Questa reazione riduce la carica positiva totale degli istoni e porta ad una minore affinità delle code istoniche per il DNA carico negativamente. L’istone deacetilasi (HDAC) catalizza la rimozione dei gruppi acetile da lisine in prossimità della regione N-terminale degli istoni, bilanciando l’azione di HAT. Il modello attuale di controllo prevede che lo stato di acetilazione dei residui di lisina fornisca una superficie specifica di legame che può servire a reclutare repressori o attivatori della trascrizione genica, a seconda dello specifico contesto.
Istone metiltrasferasi L’enzima istone metiltrasferasi (HMT) dirige la metilazione degli istoni. A differenza dell’acetilazione (che avviene solo su lisine), la metilazione avviene sia su residui i lisina (K) che di arginina (R). Alla lisina possono essere aggiunti fino a tre CH3, che aumentano la massa ma non ne alterano la carica. La metilazione istonica è collegata sia all’attivazione che alla repressione genica. La specificità del sito di metilazione (K o R), oltre al numero di gruppi metilici attaccati, può avere effetti distinti sulla trascrizione. Ad es. la dimetilazione dell’istone H3 su K9(H3-K9) e la trimetilazione dell’istone H3 su K27 (H3-K27) sono entrambe associate a silenziamento genico e formazione di eterocromatina. La metilazione di H3-K4, H3-K36 o H3-K79 è invece associata a cromatina attiva. L’enzima istone demetilasi 1 (LSD1) reprime gemi specifici mantenendo gli istoni non metilati. La demetilazione di H3-K9 facilita la fosforilazione della Ser10 e l’acetilazione della Lys9, impedendo così l’introduzione del segnale repressivo della metilazione della Lys9.
Enzimi che coniugano ubiquitina Generalmente, l’aggiunta di catene di poliubiquitina indirizza una proteina alla degradazione da parte del proteasoma. Tuttavia, la monoubiquitinazione può alterare la funzione di una proteina senza distruggerla. La monoubiquitinazione dell’istone H2B (catalizzata da enzimi di coniugazione che catalizzano la formazione di un legame peptidico fra ubiquitina ed NH2 di una catena laterale di un residuo di Lys dell’istone) può essere, a seconda del gene, associata ad attivazione o silenziamento della trascrizione. La monoubiquitinazione dell’istone linker H1 porta al suo rilascio dal DNA: in assenza di H1, la cromatina diviene meno condensata, determinando l’attivazione del gene. L’enzima isopeptidasi bilancia l’azione di ubiquitinazione dell’enzima coniugante.
Chinasi degli istoni La fosforilazione di un istone da parte di una chinasi specifica su residui di Ser o Thr, determina l’aggiunta di una carica negativa (conferita dal gruppo fosfato) La fosforilazione dell’istone linker H1 può rimuovere questo istone dal DNA oppure renderne meno stabile il legame: in entrambi i casi il processo è associato ad attivazione genica Anche la fosforilazione dell’istone H3 si associa ad attivazione di geni specifici L’azione delle chinasi viene controbilanciata da specifiche fosfatasi istoniche.
ADP-ribosiltrasferasi La mono-ADP-ribosilazione è il trasferimento enzimatico di un residuo di ADP-ribosio dal NAD+ ad un AA specifico della proteina ricevente. Il processo è catalizzato dall’ADP-ribosil-trasferasi. Gli istoni sono modificati a livello di residui di Glu, mentre in altre proteine possono essere modificati in Cys, Asn, Arg. La rimozione dell’ADP-ribosio viene catalizzata dall’ADP-ribosilidrolasi.
Enzimi che coniugano SUMO SUMO (Small Ubiquitin-like Modifier) è una proteina di 97 AA che viene aggiunta tramite la sua estremità carbossilica al gruppo amminico di una Lys della proteina bersaglio. La coniugazione di SUMO comporta la stessa serie di passaggi descritta nella coniugazione con ubiquitina. Originariamente considerata una modificazione post-traduzionale relativamente rara, la SUMOilazione è ritenuta importante nella regolazione del trasporto delle proteine, nella segregazione dei cromosomi durante mitosi e nella riparazione del DNA. Nel caso degli istoni, la SUMOilazione si associa a repressione trascrizionale. La deconiugazione viene mediata da proteasi SUMO-specifiche.
Complessi di rimodellamento della cromatina • Sono una classe di motori molecolari che usa l’energia derivata dall’idrolisi dell’ATP per cambiare i contatti fra istoni e DNA, permettendo così ai TF di legarsi agli elementi regolatori del DNA. • Essi possono mediare almeno quattro cambiamenti diversi della struttura della cromatina: • Scivolamento dei nucleosomi: cambiamento della posizione di un nucleosoma sul DNA • Rimodellamento dei nucleosomi: il DNA diventa più accessibile ma gli istoni restano attaccati • Spostamento dei nucleosomi: dissociazione completa di DNA ed istoni • Sostituzione dei nucleosomi: sostituzione di un istone del nucleo con una variante istonica
La famiglia dei complessi di rimodellamento della cromatina SWI/SNF Il complesso SWI/SNF (switch/sniff) nel lievito S. Cerevisiae è stato il primo modello ad essere caratterizzato. E’ un enorme complesso formato da almeno 11 polipeptidi diversi. L’omologo nell’uomo si chiama BAF (BRF-1 Associated Factor) e contiene due subunità ATPasiche [Brahma umano (hBRM) e Brahma-related gene 1 (BRG-1)]. Il complesso RSC (Remodel the Structure of Chromatin) è un altro complesso di rimodellamento, strettamente correlato a SWI/SNF: contiene 15 subunità, di cui 2 identiche ed almeno 4 omologhe alle subunità di SWI/SNF. Entrambi i complessi provocano lo scivolamento dei nucleosomi ed una significativa perturbazione della loro struttura. L’attività ATPasica di SWI/SNF genera energia utilizzata per modificare il percorso del DNA intorno all’ottamero istonico: circa 50 bp sono svolte dal nucleosoma, con conseguente esposizione del DNA sulla superficie nucleosomale e scivolamento dei nucleosomi verso nuove posizioni. A seguito di questo riposizionamento, i TF possono accedere al DNA.
Il complesso ISWI (Imitation of Swi2), a differenza dei complessi SWI/SNF ed RSC, riposiziona i nucleosomi facendo scivolare gli ottameri istonici lungo il DNA senza apparente perturbazione della loro struttura. Questo processo porta i nucleosomi in posizioni diverse sul DNA senza disassemblarli. Infatti i complessi ISWI non alterano la sensibilità alle nucleasi delle particelle centrali dei nucleosomi
La famiglia dei complessi di rimodellamento della cromatina SWR1 Il complesso SWR1 prende il nome dalla subunità ATPasica Swr1 (per Swi2/SNF related). Esso catalizza la sostituzione degli istoni con una variante istonica nell’ottamero del nucleo. I dimeri H2A-H2B (blu) sono sostituiti con dimeri H2A.Z-H2B (marrone). La variante istonica H2A.Z, fortemente aumentata in geni adiacenti a regioni trascrizionalmente represse (come nelle vicinanze dei telomeri) impedisce la diffusione delle proteine Sir (blu scuro) dell’eterocromatina silente nell’eucromatina circostante.