340 likes | 649 Views
Università degli studi di Roma “Tor Vergata ” Facoltà di Scienze Matematiche, Fisiche e Naturali. Tesi di Laurea Triennale in Fisica. “ Frequenza di occorrenza del tetrapeptide HGGG e sue possibili implicazioni biologiche”. Candidato Stefania Alleva. Relatore Prof.ssa Silvia Morante.
E N D
Università degli studi di Roma “Tor Vergata”Facoltà di Scienze Matematiche, Fisiche e Naturali Tesi di Laurea Triennale in Fisica “Frequenza di occorrenza del tetrapeptide HGGG e sue possibili implicazioni biologiche” Candidato Stefania Alleva Relatore Prof.ssa Silvia Morante Anno Accademico 2005/2006
SOMMARIO • Introduzione: le malattie neurodegenerative; • La Proteina Prionica: i motivi ripetuti e il legame con il Cu+2; • Tecniche utilizzate per studiare il sito di legame PrP- Cu+2: Diffrazione a raggi X; Spettroscopia XAS; Spettroscopia EPR; Simulazioni numeriche; • Analisi statistica sulla frequenza di occorrenza del tetrapeptide HGGG: verifica della rarità; • Ricerca di omologie, affinità, relazioni tra le proteine umane dotate del peptide studiando: struttura primaria, struttura secondaria, struttura terziaria, idropaticità, sito di legame per i metalli; • Conclusioni e sviluppi futuri.
MALATTIE NEURODEGENERATIVE • Morbo di Parkinson • Morbo di Alzheimer • Encefalopatie Spongiformi Trasmissibili (TSE) • CJD • nvCJD MALATTIE NEURODEGENERATIVE AGGREGAZIONE Agente infettivo: PROTEINA MISFOLDING
LA PROTEINA PRIONICA (PrPc) • Glicoproteina di membrana (cellule presinaptiche) • Numero di a.a. variabile da specie a specie • Dominio globulare (strutturato e intramembrana) e dominio non strutturato extramembrana nella regione N-terminale • Presenza nel dominio N-terminale di vari octarepeats (PHGGGWGQ), potenziali siti di legame per il Cu+2 • Funzione esatta ignota • IPOTESI PIU’ ACCREDITATE • Traduzione di segnali cellulari • Adesione molecolare • Trasporto e chelazione del rame • Antiossidante LA PROTEINA PRIONICA SCRAPIE (PrPsc) • L’agente patogeno della TSE è la PrPsc, forma anomala della PrPc, in cui tratti di α elica sono sostituiti da β-sheet all’estremità C-terminale • Misfolding probabilmente legato all’interazione con Cu+2 • La PrPsc si accumula nel CNS portando, dopo anni, alla rottura della barriera ematoencefalica • Modello diffusione intracellulare cerebrale “domino-stone” • Contagio avviene in genere per progressivo misfolding e aggregazione di PrP adiacenti ma la malattia può essere trasmessa per iniezione di PrPsc intraoculare, intravenosa e intracerebrale. La PrPsc raggiunge, trasportata dalle cellule B, le terminazioni nervose senza danneggiare organi e tessuti attraversati • DETERMINARE LA COORDINAZIONE OCTAREPEAT-Cu+2 • Diffrazione a raggi X • Spettroscopia XAS • Spettroscopia EPR • Simulazioni numeriche
DIFFRAZIONE A RAGGI X Permette di determinare la disposizione degli atomi in strutture ordinate (cristalli) Un fascio di fotoni (raggi X) è inviato sul campione Le nubi elettroniche degli atomi diffrangono tali onde che interferiscono Dai pattern di diffrazione si elaborano modelli strutturali del sistema analizzato Confronto pattern di diffrazione simulati e sperimentali
STRUTTURA CRISTALLOGRAFICA AI RAGGI X DEL COMPLESSO HGGGW-Cu+2 Burns C.S., Aronoff-Spencer E., Dunham C.M., Lario P., Avdievich N.I., Antholine W.E., Olmsteam M.M., Vrielink A., Gerfen G.J., Peisach J., Scott W.G., Millhauser G.L.. Biochemistry La catena laterale del W è parallela al piano equatoriale O di una molecola H2O Probabilmente tiene in sito l’H2O Nε dell’H1 Legame peculiare HGGGW/Cu+2 O di G3 Il metallo è legato alla catena principale N deprotonati di G2 e G3
SPETTROSCOPIA XAS (X-ray Absorption Spectroscopy) Legge di Lambert-Beer • Campione in qualsiasi stato di aggregazione; • Non esistono regole di selezione; • Acquisizione rapida dello spettro. Vantaggi
SPETTRO XAS K-edge =>1s • Energia di ionizzazione elettrone interno Energia di soglia • Molteplici per ogni specie atomica • Distinguibili per atomi con Z diversi ed elevati ATOMO ISOLATO SISTEMA MULTIATOMICO
Spettro XAS analizzato in termini della quantità χ(k) k è il vettore d’onda del fotoelettrone emesso Per energie sufficientemente elevate è adottabile l’approssimazione di singolo scattering (regione EXAFS)
Fase e ampiezza onde di back scattering sono caratteristiche per ogni specie atomica. Ma per atomi leggeri (C, O, N) NON sono DISTINGUIBLI È necessario introdurre i termini di scattering multiplo per distinguere i vari a.a. (regione XANES) χ(k) è approssimato da una sommatorie di un numero finito di termini irriducibili
DATI XAS IN COMPOSTI OCTAREPEATS-Cu+2Morante S., González-IglesiasR., Potrich C., Meneghini C., Meyer-KlauckeW., Minestrina G., Gasset M. (2004).J. Biol. Chem.. REGIONE XANES Dati XAS alla soglia K del Cu+2 in composti con numero vario di octarepeats e diversi rapporti di concentrazione peptide /Cu+2 (R) REGIONE EXAFS Si osservano delle differenze Stesso stato di ossidazione GEOMETRIA INTER-REPEAT(4 o 6 octarepeats) GEOMETRIA INTRA-REPEAT (1 o 2 octarepeats)
GEOMETRIA DI COORDINAZIONE INTRA-REPEAT Il fit è compatibile con una struttura identica a quella cristallografica in cui il legame è completamente nel singolo octarepeat Ciascun atomo di rame è legato a tre atomi di azoto e uno di ossigeno posti su un piano Il fit è compatibile con la presenza di un atomo di ossigeno a distanza maggiore e su un piano ortogonale GEOMETRIA DI COORDINAZIONE INTER-REPEAT Il Cu+2 è legato agli anelli imidazolici di due His di octarepeats diversi Se appartengono a diverse PrP potrebbe favorire l’aggregazione Il legame avviene tra diversi octarepeats NB: Se la concentrazione di Cu+2 non satura tutti gli octarepeats
SPETTROSCOPIA EPR (Electron Paramagnetic Resonance) • Basata sull’assorbimento di energia da parte di un sistema dotato di un elettrone spaiato immerso in un campo magnetico statico (H) Sono permesse (per l’idrogeno S=1/2 e I=1/2) solo le transizioni • L’Hamiltoniana del sistema • H=He+Hiperfine= βS·g·H + S·A·I ATOMO DI IDROGENO Energia di contatto di Fermi Campo magnetico efficace Interazione iperfine Interazione col campo magnetico Rapporto giromagnetico considera lo splitting Zeeman Termine dipolare
SIMULAZIONI EPR IN COMPOSTO OCTAREPEAT-Cu+2 Chattopadhyay, M.; Walter, E. D.; Newell, D. J.; Jackson, P. J.; Aronoff-Spencer, E.; Peisach, J.; Gerfen, G. J.; Bennett, B.; Antholine, W. E.; Millhauser, G. L. (2005). J. Am. Chem. Soc. Sono stati simulati spettri EPR implementando la precedente Hamiltoniana in sistemi contenenti uno o due ioni Cu+2 , in approssimazione di geometria rigida e usando sequenze peptidiche diverse per numero di octarepeats e composizione in a.a. Cu+2 lega preferibilmente l’octarepeat Risultati La geometria di coordinazione dipende dalla concentrazione relativa peptide/Cu+2 Diverso ruolo delle His e delle Gly nel legare il metallo
Componenti dello spettro EPR COMPONENTE 2 COMPONENTE 3 COMPONENTE 1 • Concentrazione intermedia Cu+2 • Riduzione distanza tra atomi • Cu+2 si lega a Nεe N dell’His e agli O di due H2O • Stabilizzato da più octarepeats • Bassa concentrazione Cu+2 • Un singolo Cu+2 è legato a tre Nε delle His • Peptidi con 3 o 4 octarepeats • Cu+2 satura tutti gli octarepeats • Stessa struttura della cristallografia Lo spettro mostra tutte le componenti ma la forma varia con la concentrazione
SEQUENZE UTILIZZATE E COMPONENTI DELLO SPETTRO EPR La sostituzione di una G con X comporta una modifica del sito di legame Sostituendo l’His con Tyr cambia il sito di legame
SIMULAZIONI NUMERICHE Furlan S., Guerrieri F., La Penna G., Morante S., Rossi G.C. Journal of Biological Inorganic Chemistry; European Biophysics Journal Simulazioni di dinamica molecolare del tipo Car-Parrinello per studiare la coordinazione del Cu+2 RISULTATI Usando dipeptidi [Cu(HGGG)]2 è stata messa in evidenza una struttura “entangled” Il legame tra il Cu+2 e gli azoti deprotonati delle G2 e G3 è estremamente stabile La presenza del triptofano W5 sembra non avere influenza sulla stabilità del legame I due ioni nei diversi peptidi si scambiano dinamicamente i leganti
FREQUENZA DEL TETRAPEPTIDE TRA LE SEQUENZE UMANE IPOTESI: HGGG nocivo in tutte le proteine TESI: La selezione naturale ha eliminato il motivo dalle sequenze proteiche HGGG frequenza significativamente minore dell’aspettato Analisi statistica usando “l’algoritmo delle parole rare” Colosimo A., Morante S, Parisi V. and Rossi G. C. J. theor. Biol. • Una sequenza oligopeptidica (r) in una sequenza proteica è detta parola (b1b2…br) • BIAS: parole rare in parole più lunghe: si ipotizza un processo Markoviano di ordine (r-2) • Sfruttando iterativamente il teorema della probabilità condizionata • Identificando la probabilità con la frequenza di occorrenza
Frequenza sperimentale Frequenza teorica attesa Questi valori vanno confrontati D>>1; D<<1 parola significativamente abbondante o rara a opera della selezione naturale si introduce la variabile D ≈ 1 parola compare con frequenza non significativamente diversa dal valore teorico aspettato
MISURA DI T4(HGXY) e E4(HGXY) Algoritmo delle parole rare utilizzato per determinare la frequenza delle quadruplette HGXY Programma “cicle.pl” legge tutte le sequenze proteiche umane depositate e misura, restituendoli in output, il numero di volte e in quante proteine compaiono i peptidi HGX, GXY, GX e HGXY Programma “ratio.pl”, dopo aver calcolato i valori delle variabili Er(b1b2…br) per ogni parola scelta e quello di T4(HGXY) , calcola D4(HGXY) e lo restituisce in output Risultati 157 proteine su oltre 29760 analizzate hanno HGGG D4(HGGG)≈0,75 63 peptidi hanno D4(HGXY)<D4(HGGG) HGGG risulta raro
CORREZIONI SUL CAMPIONE Campione iniziale costituito da 157 proteine umane contenenti il peptide HGGG e identificate con codici diversi CORREZIONI • eliminare dal campione le sequenze ipotetiche • controllare gli aggiornamenti delle informazioni depositate in banca dati • eliminare le ripetizioni • controllare i siti di taglio ALLINEAMENTO MULTIPLO(ClustalW) Raggruppato proteine con definizione simile Allineate con “gap open penality” massima, “gap extension penality” minima e matrice di identità Se le sequenze erano allineate e le funzioni molecolari identiche una sola proteina è stata considerata Campione finale costituito da 99 proteine umane diverse e contenenti il peptide HGGG
RICERCA DI OMOLOGIE Se HGGG ha un ruolo simile in tutte le proteine in cui si trova Potrebbe trovarsi in una regione scarsamente interagente con l’ambiente circostante Esiste il PDB SOLO di un’altra proteina oltre la PrP Proteine che legano metalli PrP oltre a legare Cu+2 è una proteina di membrana Classificato le proteine Proteine di membrana Ricercato funzione molecolare svolta e processo biologico in cui interviene per ogni proteina Funzione esatta PrP ignota Lunghezza proteine Analisi struttura primaria Informazioni sugli altri livelli strutturali Localizzazione peptide Profili idropaticità Struttura secondaria Il peptide è in una regione di random-coil nella PrP
PROTEINE CHE LEGANO METALLI In due “zinc-finger protein” l’HGGG è parte dello “zinc-finger domain” (C2H2) 15 Zn 3 Cu 1 Fe 1 Zn-Fe-Co-Mn Solo di 10 proteine che legano Zn 20 proteine legano metalli Ricerca del sito di legame ClustalW con opportuni punteggi di penalità e varie matrici di simiglianza Dominio costituito da 25-30 a.a. che lega Zn • Allineamento multiplo • PrP con altre leganti Cu+2 • PrP con le tre zinc-finger protein dell’elenco (lett.) • PrP con le due zinc-finger protein precedenti • PrP con ognuna delle due zinc-finger protein precedenti “Zinc-finger domain” Presente in molte proteine Nessun risultato soddisfacente Esistono vari classi Sono dotate dello zinc-finger domain “Zinc-finger protein” BUON ALLINEAMENTO Proprietà specifiche (legano DNA con il dominio) Più comune (C2H2)
ALLINEAMENTO PrP-Zinc Finger Protein HGGG compare due volte nella zinc finger protein
PROTEINE DI MEMBRANA 27 proteine di membrana 4 legano metalli Stimato le regioni transmembrana 3 Cu 1 Fe TMHMM2 PrP ha il dominio N-terminale (comprende HGGG)nella regione non citosolica, il dominio C-terminale all’interno della cellula e due regioni transmembrana Verifica validità del programma con dati noti della PrP RISULTATI • HGGG non è mai in una regione transmembrana • In 3 casi l’HGGG è nella regione citosolica • In 24 casi l’HGGG è nella regione non citosolica • In 13 casi le proteine non hanno regioni transmembrana
PROCESSO BIOLOGICO La maggior parte delle proteine prende parte a processi metabolici (13 C) FUNZIONE MOLECOLARE L’allineamento non ha mostrato risultati interessanti Recenti studi sostengono che la PrP potrebbe essere un fattore di trascrizione
LUNGHEZZA PROTEINE Confrontare il nostro campione con tutte le sequenze proteiche depositate in banca dati Lunghezza di una proteina Struttura e funzioni svolte Sequenze banca dati Sequenze nostro campione Numero diverso di proteine con cui è stata realizzata la distribuzione; Banca dati non solo sequenze proteiche umane Picco della distribuzione è a lunghezza maggiore nel nostro campione
SEQUENZE SEGNALE & LOCALIZZAZIONE DEL PEPTIDE Regione Iniziale (N-terminale) primi 60 a.a. SIGNAL PEPTIDE = breve sequenza (3-60 a.a.) utilizzata per il trasporto della proteina Regione Finale (C-terminale) ultimi 60 a.a. HGGG tende preferibilmente a trovarsi in una regione centrale della sequenza (69/99) Nella PrP i primi due octarepeats sono nella regione iniziale
PROFILI DI IDROPATICITA’ Misura del ΔG di trasferimento di un soluto da un solvente apolare a uno polare ΔG =ΔH-T ΔS IDROPATICITA’ Misura la propensità di un a.a. a collocarsi in una regione polare (ΔG < 0 a.a.idrofilico) o apolare(ΔG >0 a.a. idrofobico) Si realizzano delle scale di idropaticità in base ai valori di ΔG Sequenza => stringa di numeri Profili di idropaticità Profilo della PrP Realizzato con ProtScale L’HP del singolo a.a. è mediata sui primi vicini Valore di riferimento -0,4 (HP Gly)
RISULTATI • Tutte le proteine sono caratterizzate da zone anfifiliche • La maggior parte delle proteine che legano metalli sono anfifiliche • Proteine sono di membrana sono prevalentemente anfifiliche ANALISI DELLA REGIONE ATTORNO IL TETRAPEPTIDE • Nella metà dei casi il peptide è in una regione anfifilica • Nel 40% dei casi è in una regione idrofilica • In 7 peptidi è localizzato in una regione idrofobica • Nella PrP e nelle due “zinc-finger protein” in cui l’H partecipa al sito di legame il peptide è in una regione idrofilica compresa tra due regione idrofobiche
STRUTTURA SECONDARIA 70 58 60 50 40 30 20 20 8 9 10 4 0 >50%random coil >random coil > elica >50% elica elica=random coil STRUTTURA SECONDARIA α ELICA β sheet Random-coil Predire la struttura secondaria Ciascun a.a. ha una propensità a trovarsi in una struttura HNN (corrispondenza con la realtà superiore al 60%) • Abbiamo rilevato che: • Il peptide HGGG si colloca preferibilmente in una regione di random coil • Solo in 6 proteine l’His è in una regione strutturata ; • La maggior parte delle proteine ha una struttura prevalentemente random-coil
CONCLUSIONI & FUTURI SVILUPPI • Il motivo HGGG è risultato significativamente raro nelle sequenze proteiche umane depositate • Non è stata individuata una caratteristica comune alle proteine che lo contengono che possa chiaramente indicare le ragioni della rarità • Ripetizione dell’intera procedura di analisi sul peptide GGGH • Utilizzare simulazioni numeriche ed esperimenti in vitro per misurare l’affinità per il Cu+2 delle proteine del campione simili alla PrP • Raffinamento delle tecniche di allineamento con l’uso di altre matrici di proprietà • Raffinamento dell’analisi dei profili di idropaticità • Verifica del dato relativo alla quasi totale assenza nel campione (2/100 contro un valore medio di 40/100) di proteine di cui è nota la struttura