370 likes | 657 Views
Come si può studiare la struttura di una proteina. i metodi sperimentali classici per la risoluzione della struttura tridimensionale di una proteina sono:. la cristallografia a raggi X. la spettroscopia a risonanza magnetica e nucleare ( Nuclear Magnetic Resonance , NMR). diffrazione
E N D
Come si può studiare la struttura di una proteina i metodi sperimentali classici per la risoluzione della struttura tridimensionale di una proteina sono: • la cristallografia a raggi X • la spettroscopia a risonanza magnetica e nucleare (NuclearMagneticResonance, NMR)
diffrazione ai raggi X cellula batterica DNA esogeno NMR plasmide formazione di cristalli moltiplicazione del clone purificazione della proteina
Cristallografia a raggi X La proteina, cristallizzata, vienebombardata con un raggiodifotonicollimati ad altaenergia. I fotonivengonodiffratti in mododifferente a seconda del tipodiatomochecolpiscono. I raggidiffrattivengonoraccoltiformando un quadro(pattern) didiffrazione Il pattern didiffrazionevieneusato per ricostruirele coordinate deisingoliatomichecompongono la macromolecola e quindi la suastruttura 3D. I raggi X interagiscono quasi esclusivamente con glielettronipresentinellamateria e non con i nuclei. Unastrutturaairaggi X è quindiun’immaginedelladensitàelettronicadell’oggetto in analisi
Cristallografia a raggi X Risoluzioneottenibilesupiccolemolecoleorganiche 1Å. In generaleproteinecristallizatehannogradodiorganizzazionepiùbasso chelimitano la risoluzione (2-3.5Å). Questo è dovutoancheall’altaidratazionedeicristalli (40-60% diacqua). Una tale risoluzione non è sufficiente per rivelare la posizionedeisingoliatomi, ma è sufficienteper tracciarel’andamento e la disposizionedelloscheletrocovalentedellaproteina. Occorrequindiconoscere la sequenzaprimaria in mododaadattare la mappadelladensitàelettronicaallasequanzaaminoacidica. • Limiti del metodo: • Cristallizzareproteine e` difficile • Ricavare la strutturadal pattern didiffrazione e` computazionalmentecomplesso • L’informazionechesiottiene e` statica, mentre la conforomazionediunaproteina in soluzionevarianeltempo • B factor (fattoreditemperatura): indice “indiretto” diflessibilita’ strutturale
In un cristallo di proteine, in ogni cella (sito reticolare) si trova una proteina = somma di densità elettroniche dovute ai singoli atomi
Il risultato sperimentale diretto di un’ analisi cristallografica è una mappa di densità elettronica e non il modello atomico che voi state osservando!!! Se vi sono errori nelle strutture cristallografiche questi sono dovuti all’interpretazione (soggettiva) delle mappe elettroniche da parte del cristallografo!!
PARAMETRI X VALUTAZIONE DELL’INFORMAZIONE CONTENUTA NELLA STRUTTURA X-RAY: Risoluzione (R) della mappa di densità elettronica (tra 3 e 1.5 Å). Strutture con R > 2.5 Å dettagli solo sul backbone, R < 2 Å dettagli su atomi catene laterali R-value e R-free: parametri associati al livello di “discordanza” tra modello atomico e mappa di densita’ elettronica (devono essere R-value < 20% e R-free < 30%). Forniscono, in ultima istanza, indicazioni su quanto differiscono tra loro mappa di densita’ elettronica osservata (sperimentale) e mappa di densita’ elettronica calcolata dal modello della struttura finale.
Spettroscopia a risonanza magnetica nucleare(NMR) Permette di ottenere informazioni sulla struttura di una molecola attraverso l’interazione con una radiazione elettromagnetica.Si basasullostesso principio dellarisonanzamagneticausata in medicina, usaonde radio. I nuclei atomici (elettricamentecarichi) ruotano, con unavelocitàangolarequantizzata, creando un momentomagnetico Immersi in un campo magneticoomogeneoesternoimomentimagneticisiallineano (“traballando” a causa del rumoretermico). I nucelivengonoirradiatidaonde radio (RF), l’effetto è di “disallineare” (tantodafarli “ribaltare”). Èpossibilerilevare quando i momenti magnetici dei vari nuclei (che continuano a ruotare) si inclinano completamente sul piano perpendicolarerispetto al campo magnetico applicatograzie ad un'antenna che capta le onde radio che questi generano ed è collocata perpendicolarmente al campo magnetico applicato.
Spettroscopia a risonanza magnetica nucleare(NMR) Ogni nucleo mostra le sue caratteristiche perchè ruota a velocità differente a seconda della sua posizione nella molecola e all'ambiente che gli atomi vicini gli fanno sentire e quindirisuona a frequenze radio diverse. Nuclei diversi risuonano a frequenze diverse. Ciò significa innanzitutto che un atomo di carbonio deve essere colpito da un'onda radio con frequenza diversa da quella necessaria ad un atomo di idrogeno per “ribaltarsi” di 90°, ma anche che atomi simili in ambienti diversi, come un atomo di idrogeno legato ad un atomo di ossigeno ed un atomo di idrogeno legato ad un atomo di carbonio si ribaltano a frequenze diverse.Questo è dovutoalla “schermatura” deglielettronivicini • Caratteristiche: • studio delleproteinein soluzione(non occorrecristallizzarle) • altarisoluzionetemporale(millisecondi) • informazionisulledistanzeinterprotoniche non precise • la “proton signature” limitailmetodoallanalsidimolecole “piccole” (<30 KD <250 residui) • informazionisustrutturedicomplessiproteicideducibili solo con ilricorso a metodidimodellisticaguidatidaidatisperimentali
PDB: banca dati di strutture (Protein Data Bank) – ridondante – strutture ottenute sperimentalmente via X-ray o NMR Il file PDB http://www.pdb.org Esempio: Deossiemoglobina umana (1a3n) HEADER OXYGEN TRANSPORT 22-JAN-98 1A3N TITLE DEOXY HUMAN HEMOGLOBIN COMPND MOL_ID: 1; COMPND 2 MOLECULE: HEMOGLOBIN; COMPND 3 CHAIN: A, B, C, D; COMPND 4 BIOLOGICAL_UNIT: ALPHA-BETA-ALPHA-BETA TETRAMER SOURCE MOL_ID: 1; SOURCE 2 ORGANISM_SCIENTIFIC: HOMO SAPIENS; SOURCE 3 ORGANISM_COMMON: HUMAN; SOURCE 4 TISSUE: BLOOD; SOURCE 5 CELL: RED CELL KEYWDS OXYGEN TRANSPORT, HEME, RESPIRATORY PROTEIN, ERYTHROCYTE EXPDTA X-RAY DIFFRACTION AUTHOR J.TAME,B.VALLONEREVDAT 1 29-APR-98 1A3N 0 REMARK 1 REMARK 2 REMARK 2 RESOLUTION. 1.8 ANGSTROMS. REMARK 3 […]
tipo di atomo tipo di amminoacido coordinate X Y Z ATOM 1 N VAL A 1 10.720 19.523 6.163 1.00 21.36 N ATOM 2 CA VAL A 1 10.228 20.761 6.807 1.00 24.26 C ATOM 3 C VAL A 1 8.705 20.714 6.878 1.00 18.62 C ATOM 4 O VAL A 1 8.164 20.005 6.015 1.00 19.87 O ATOM 5 CB VAL A 1 10.602 22.000 5.966 1.00 27.19 C ATOM 6 CG1 VAL A 1 10.307 23.296 6.700 1.00 31.86 C ATOM 7 CG2 VAL A 1 12.065 21.951 5.544 1.00 31.74 C ATOM 8 N LEU A 2 8.091 21.453 7.775 1.00 16.19 N ATOM 9 CA LEU A 2 6.624 21.451 7.763 1.00 17.31 C ATOM 10 C LEU A 2 6.176 22.578 6.821 1.00 18.55 C ATOM 11 O LEU A 2 6.567 23.730 7.022 1.00 18.72 O ATOM 12 CB LEU A 2 6.020 21.707 9.129 1.00 18.34 C ATOM 13 CG LEU A 2 6.386 20.649 10.198 1.00 17.39 C ATOM 14 CD1 LEU A 2 5.998 21.119 11.577 1.00 17.99 C ATOM 15 CD2 LEU A 2 5.730 19.337 9.795 1.00 16.96 C ATOM 16 N SER A 3 5.380 22.237 5.852 1.00 15.02 N ATOM 17 CA SER A 3 4.831 23.237 4.928 1.00 16.59 C ATOM 18 C SER A 3 3.725 24.027 5.568 1.00 14.84 C ATOM 19 O SER A 3 3.095 23.717 6.591 1.00 14.40 O ATOM 20 CB SER A 3 4.308 22.429 3.727 1.00 16.47 C ATOM 21 OG SER A 3 3.076 21.786 3.991 1.00 14.91 O …
CONFRONTO STRUTTURE 3D DI PROTEINE – ALLINEAMENTO STRUTTURALE Come nel confronto di sequenze e’ necessario allinearle, nel confronto di strutture 3D e’ necessario sovrapporle come corpi rigidi scegliendo una regola di corrispondenza tra coppie di atomi o di residui nelle due strutture. La prima difficoltà consiste nel fatto che le due proteine molto spesso non hanno lo stesso numero di residui. Per la sovrapposizione si possono utilizzare le catene dei carboni alfa appartenenti agli elementi di struttura secondaria perche’ in genere le inserzioni e delezioni si accumulano nei loopche possono semplicemente venire esclusi dalla sovrapposizione. I metodi di confronto 3D utilizzano l’ allineamento delle sequenze per decidere la regola di corrispondenza alla base della sovrapposizione strutturale
Un allineamento strutturale può essere valutato in base alla deviazione quadratica media (rootmeansquaredeviationo r.m.s.d.), al numero di atomi che sono stati accoppiati nella sovrapposizione e alla valutazione della similarità dei residui sovrapposti. D = distanza tra coppie di atomi appaiati N = numero di coppie considerate L’r.m.s.d. o r.m.s. di una sovrapposizione tridimensionale è la distanza media tra gli atomi di tutte le coppie che hanno partecipato all’allineamento strutturale, per cui tanto più bassa è l’r.m.s. tanto migliore sarà l’allineamento strutturale calcolato
Root-mean-square deviation Deviazione quadratica media Serve per paragonare strutture identiche, eccetto rotazioni e traslazioni rai e rbisono le posizioni dell´ atomoinellestrutturea e b, n è ilnumero di atominellestrutture. RMSD r.m.s.d. di una sovrapposizione 3D è la distanza media tra gli atomi di tutte le coppie che hanno partecipato all’allineamento strutturale, per cui tanto più bassa è l’r.m.s. tanto migliore sarà l’allineamento strutturale calcolato
EVOLUZIONE DELLE PROTEINE RELAZIONE ESISTENTE TRA SIMILARITA’ di sequenza e struttura in omologhi Studio di un campione di strutture note di proteine omologhe (Chothia, Lesk, 1982) Similarità strutturale misurata in termini di RMSD CALCOLO RMS • Confronto di due strutture mediante SOVRAPPOSIZIONE • Determinazione di aa che si corrispondono nelle due strutture • Identificazione degli atomi che si vogliono confrontare (Cα o backbone) • RMSD= n = numero residui d = distanza tra atomi corrispondenti
valutazione dell’allineamento strutturale un altro criterio di valutazione di un allineamento strutturale è rappresentato dal numero di atomi o di residui che sono stati accoppiati si cerca di massimizzare il numero di atomi accoppiati e di minimizzare la corrispondente r.m.s. a parità di numero di residui accoppiati, il migliore allineamento strutturale sarà quello con minore r.m.s. a parità di r.m.s. verrà considerato migliore l’allineamento strutturale operato con un maggior numero di atomi accoppiati oltre a questi due valori tipici delle sovrapposizioni tridimensionali, si può anche considerare il punteggio di similarità dei residui accoppiati
DIVERGENZA DI SEQUENZA E STRUTTURA 30% id.seq RMSD (A) Se si valuta la relazione esistente tra divergenza strutturale (misurata in termini di RMSD) e divergenza di sequenza si osserva che esse si corrispondono in MODO ESPONENZIALE (valutato dal confronto di strutture note) %identity • (RMSD< 2 Å) possonoavereseq molto differenti • (degenerazione del codicestrutturale-strutturapiùconservatadellaseq)
SOGLIA di significatività per la SIMILARITA’ STRUTTURALE 100 Sec str identity < 70% %id seq Sec str identity > 70% 30 .confronto a coppie di struttura e seq di proteine 3D note, quantificato usando come parametri: lunghezza allineamento, % idseq, sim.struttura a confronto in un grafico: lunghezza allin vs idseq (e in terza dimensione sim.strutturale) Sim. Strut.parametrizzata come uguale/diverso (pallino/quadrato): 2 str. Uguali se > 70% della struttura sec è in comune (rmsd bassa). al di sotto della soglia rumore di fondo elevato 25% (x allin 80 aa) al di sopra del quale chiara similarità strutturale – soglia lunghezza dipendente possibile che proteine con identità < 25% abbiano strutture simili ma anche che non siano correlate strutturalmente (twilight zone) 0 0 Lengthalignment 150
Raw model Loop modeling Side chain placement Refinement Dalla sequenza al modello
RICERCA DEL TEMPLATO • Blast-FastA • CRITERI IDENTITA’/SIMILARITA’ • CONOSCENZA FUNZ.-STR.-BIOCHIM. • OMOLOGO 3D (PDB) • ALLINEAMENTO HOMOLOGY MODELLING
GUIDA LA COSTRUZIONE DEL MODELLO • CORRISPONDENZA aa target aa templato • ricerca ALLINEAMENTO OTTIMALE • CORRISPONDENZA DI aa FUNZ. IMPORTANTI • CORRISPONDENZA DELLA STRUTTURA SECONDARIA TRA TEMPLATO E QUERY • VALUTAZIONE DEI GAP loop • USO TEMPLATI MULTIPLI loc.similarità ALLINEAMENTO
1. Generazione di allineamenti a coppie diversi con diversi programmi (nel caso di un solo templato) 2. Allineamenti multipli di omologhi per avere informazioni maggiori 3. Ricerca di informazioni biologico-biochimiche sugli aa conservati 4. Predizione di struttura secondaria per il target 5. Correzione dell’allineamento sulla base delle informazioni ai punti 2. 3. e 4. ALLINEAMENTO
Raw model Loop modeling Side chain placement Refinement • identificazione SCR (structural conserved regions) • SCR scaffold del modello CREAZIONE DEL MODELLO ______________ ______________ x-ray SCRs No SCRs (loops ?)
flexible conserved Costruzione del pre-modello • La struttura del templato viene utilizzata come “stampo“ per costruire il modello seguendo l‘allineamento. • Le coordinate 3D dei residui strutturalmente conservati si possono copiare direttamente. • Le regioni variabili della struttura (generalmente loop) non si possono copiare.
Raw model Loop modeling Side chain placement Refinement Catenelaterali • Problema: Applicando le coordinate del templatosullasequenza del targetcambianotipo, dimensione e posizione delle catenelaterali. • L‘RMSD cambiarelativamente poco, peròpossonocambiare le conformazioni di residuiimportanti (p.es. del sitoattivo) • Dove possibile è megliomantenere le conformazioni delle catenelaterali del templato. • Esistonometodistandard per risolverequestoproblema.
AUSILIO DI LIBRERIE DI ROTAMERI Contengono i possibili conformeri delle catene laterali a fronte di specifiche conformazioni del backbone • OTTIMIZZAZIONE ENERGETICA DELLE STRUTTURA rimozione di clash PREDIZIONE DELLE CATENE LATERALI
Raw model Loop modeling Side chain placement Refinement Loop modeling • Al pre-modello possono mancare interi frammenti di catena principale • non conservati nella famiglia proteica • Inserzioni • Delezioni • Descrizione del problema: • Si cerca un fold che colleghi il frammento N-terminale (pre-loop) con quello C-terminale (post-loop) tramite k residui • (f,y) sono gli unici parametri liberi loop post-loop pre-loop
REGIONI VARIABILI – pressione selettiva • DUE STRATEGIE PREDITTIVE: • criterio geometrico testando diverse conformazioni • ricerca in PDB di frammenti simili nelle proteine a struttura nota INFLUENZA DELL’INTORNO REFINEMENT CRITICO OTTIMIZZAZIONE MEC. E DIN. MOL. • CRITICITA’ nella predizione quando i LOOP rivestono ruolo funzionale o di interazione. PREDIZIONE DEI LOOP
5. Ottimizzazione del modello Regolarizzazione di legami, angoli e torsioni Eliminazioni di clash strutturali Minimizzazione energetica