1.1k likes | 1.83k Views
Proteomica. “ La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza . ” ( A. Einstein ). Sommario. Dal genoma al proteoma Classificazione delle proteine Tecniche sperimentali Progettazione di inibitori e di farmaci
E N D
Proteomica “La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza.” (A. Einstein)
Sommario • Dal genoma al proteoma • Classificazione delle proteine • Tecniche sperimentali • Progettazione di inibitori e di farmaci • Screening di ligandi • Strutture cristalline risolte ai raggi X • Strutture NMR • Metodi empirici e tecniche predittive • Predizione delle modificazioni posttraduzionali
Introduzione 1 • Mentre il genoma è la somma complessiva del mate-riale genetico di un organismo, il proteoma è l’insieme delle sue proteine • La natura dei geni la loro semplice composizione chimica e la loro capacità di essere utilizzati come stampo per fare copie esatte di sé stessi li ha resi relativamente facili da studiare ed analizzare con metodi automatici • La natura delle proteine con i loro venti componenti elementari, le complesse modificazioni chimiche e l’im-possibilità di duplicarsi è, invece, molto più difficile da analizzare
Introduzione 2 Le proteine sono gli agenti che, all’interno della cellula, “fanno ciò che c’è da fare” Una delle scoperte più eclatanti della nuova era post genomica, è che il vecchio paradigma secondo cui un gene codifica per una sola proteina risulta non essere più valido Infatti, a causa di modifiche posttraduzionali (glicosi-lazione, fosforilazione) delle proteine, ad un genoma possono corrispondere più di un proteoma Il genoma di un essere vivente, anche quando comple-tamente sequenziato, non permette di comprendere tutte le funzioni biologiche che caratterizzano un organismo e che dipendono da molteplici fattori, tra i quali le vie regolatorie e metaboliche delle proteine 4
Introduzione 4 La proteomica si rivela, pertanto, complementare alla genomica ed essenziale per la comprensione dei meccanismi biologici La proteomica consente lo studio delle proteine, sia nelle forme appena tradotte dai geni sia nelle isoforme (dovute a splicing alternativo) o nelle eventuali modi-fiche posttraduzionali,che possono verificarsi nella cellula dopo la traduzione Lo studio delle isoforme o delle modifiche post traduzionali consente la comprensione dei meccanismi di interazione tra le proteine: tali meccanismi ne condizionano l’attività e la funzione 6
Introduzione 5 La proteomica è la scienza che mira ad indagare e a stabilire l’identità, la quantità, la struttura e le funzioni biochimiche e cellulari di tutte le proteine presenti in un tessuto, in una cellula o in un comparto sub cellulare, descrivendo come queste proprietà siano variabili nello spazio, nel tempo o in un determinato stato fisiologico (M. Tyers & M. Mann, 2003) Obiettivi della proteomica Comparazione tra tessuti malati e normali Comparazione tra tessuti malati e trattati farmacologica-mente Identificazione di nuovi bersagli proteici per farmaci Studio delle modificazioni posttraduzionali Strategie integrate con la genomica Analisi dei tessuti nelle patologie tumorali 7
Introduzione 6 Gli attuali studi di proteomica sono prevalentemente focaliz-zati su due aree principali: Proteomica funzionale Proteomica di espressione La proteomica funzionale ha come obiettivo la definizione della funzione biologica di proteine, il cui ruolo è ancora sconosciuto, e l’identificazione delle interazioni proteina proteina in vivo, per la descrizione a livello molecolare dei meccanismi cellulari La proteomica di espressione è focalizzata sullo studio quali-tativo e quantitativo dei differenti profili di espressione delle proteine; l’espressione delle proteine può infatti modificarsi per variazioni delle condizioni cellulari (diverse condizioni di crescita, stress o presenza di patologie cellulari, etc.) Il diverso profilo delle proteine rilevate in un tessuto, assenza, presenza o livelli quantitativi differenti, sono potenziali bioin-dicatori di uno stato fisiologico e/o patologico 8
Introduzione 7 Pertanto… Le proteine sono necessarie per tutte le attività biologiche Il proteoma rappresenta l’insieme delle proteine di un organismo o di un sistema biologico, ossia l’insieme delle proteine prodotte dal genoma Lo studio del proteoma (studio della struttura e dell’at-tività proteica) è fondamentale per comprendere la fisio-logia e i processi biologici degli esseri viventi Proteomica Scienza che consente lo studio appro-fondito del proteoma, il completo corredo proteico espresso in una cellula o in un tessuto (Wilkins et al., 1996) 9
Dal genoma al proteoma 1 • Nonostante la capacità di generare sbalorditive quanti-tà di dati, le tecniche di analisi dell’espressione genica forniscono poche informazioni su quali proteine siano presenti all’interno della cellula e tanto meno su quale sia la loro funzione e come venga svolta • La correlazione tra l’abbondanza relativa di un mRNA e l’abbondanza relativa della sua corrispondente proteina all’interno di ogni cellula è abitualmente inferiore allo 0.5 • Molte proteine, dopo la traduzione, subiscono ampie modificazioni biochimiche, con modalità molto diverse • Tali modificazioni, quasi invariabilmente, alterano l’attività proteica e si manifestano in forme diverse a seconda del tipo di tessuto e delle circostanze
Dal genoma al proteoma 2 • Molte proteine non sono funzionalmente rilevanti finché non si assemblano tra loro in complessi più grandi o non vengono trasportate in collocazioni appropriate all’inter-no o all’esterno della cellula • La sequenza aminoacidica può solo offrire qualche indica-zione sullo scopo di tali interazioni e sulla destinazione finale della proteina • Difficoltà nel dedurre la popolazione proteica di una cellula ed il ruolo delle singole proteine, aggravata an-che dalla scarsa disponibilità di proteine analizzabili direttamente
Dal genoma al proteoma 3 • Le proteine richiedono manipolazioni molto più accura-te rispetto al DNA perché la struttura terziaria, funzio-nalmente importante, può venire facilmente alterata quando entrano in contatto con una superficie o un ambiente inappropriati • Inoltre: • La capacità degli acidi nucleici di ibridarsi in maniera specifica con altre sequenze nucleotidiche rendono l’iden-tificazione del DNA un compito relativamente semplice • L’identificazione delle proteine è molto più difficile e richiede analisi complicate di spettrometria di massa e strumenti software evoluti o la generazione di specifici anticorpi
Dal genoma al proteoma 4 • Infine, molte analisi effettuate sia sugli acidi nucleici sia sulle proteine si basano sulla capacità di manipo-lare miliardi di molecole identiche • La generazione di numerose copie di ogni gene è semplificata dalla capacità del gene di venire utilizzato come stampo per la propria amplificazione (PCR) • Le proteine devono essere isolate chimicamente, in modo inefficiente e laborioso, a partire da un gran numero di cellule viventi • Tuttavia… le potenzialità che derivano dalla cono-scenza del proteoma di un organismo sono enormi: • Comprensione delle basi molecolari di alcune malattie • Conversione di cellule in fabbriche molecolari • Efficienza degli organismi geneticamente ingegnerizzati • Progettazione di nuovi farmaci
Dal genoma al proteoma 5 • Genoma vs Proteoma • Il bruco e la farfalla sono organismi geneticamente identici, ma posseggono diverso proteoma e fenotipo, così come il girino e la rana!
Classificazione delle proteine • L’indicizzazione e la catalogazione dei dati proteomici sono compiti molto ardui, data la grande varietà di proteine differenti, utili alla cellula per svolgere i suoi compiti • Diversi metodi sistemici proposti: il più antico, dovuto alla International EnzymeCommission, si basa sulle funzioni delle proteine ed assegna ogni proteina ad una delle sei differenti categorie che derivano dalle diverse “macrofunzioni” • In alternativa, metodo di classificazione basato sulla storia evolutiva e le similarità strutturali, con circa mille famiglie di proteine omologhe
Nomenclatura degli enzimi 1 • La rapida crescita, durante gli anni ‘50, del numero di enzimi conosciuti rese necessario stabilire delle con-venzioni riguardo alla loro nomenclatura • Prima della fondazione della International Enzyme Commission (1955), non era infatti insolito che un singolo enzima fosse conosciuto con nomi diversi, né che lo stesso nome venisse assegnato ad enzimi dif-ferenti • Inoltre, alcuni nomi non davano nessuna indicazione sulla natura delle reazioni chimiche catalizzate dal relativo enzima • Nel 1965 fu suggerito un approccio sistematico per classificare gli enzimi in sei classi principali, sulla base delle tipologie generali delle reazioni catalizzate (http://www.chem.qmul.ac.uk/iubmb/enzyme/)
Nomenclatura degli enzimi 2 • Attraverso l’utilizzo di un sistema di numerazione, ad ogni enzima viene assegnato un codice numerico, dove il primo numero si riferisce alla classe principale, il secondo ed il terzo numero corrispondono a specifiche sottoclassi ed il numero finale rappresenta il numero seriale dell’enzima nella sua sottoclasse
Nomenclatura degli enzimi 3 • Esempi • L’alcooldeidrogenasi è identificato come 1.1.1.1 classe principale: ossidoreduttasi, classe: attività sul gruppo CHOH del donatore; sottoclasse: con NAD o NADP (molecole che permettono l’ossidoriduzione) come accettore; è il primo dei 269 enzimi presenti in questa categoria • L’RNApolimerasi DNAdipendente è identificato dal nu-mero 2.7.7.6 classe principale: transferasi; classe: trasferimento di gruppi contenti fosforo; sottoclasse: nucleotidiltransferasi; è il sesto dei 60 enzimi presenti in questa categoria
Famiglie e superfamiglie 1 • La similarità di sequenza aminoacidica, tra le molte migliaia di proteine per cui essa è disponibile, sugge-risce che tutte le proteine esistenti ai giorni nostri possano derivare da circa mille proteine originarie • Non è chiaro, tuttavia, se il ristretto numero di proteine esistenti sia dettato più da vincoli fisici sul ripiegamento della catena polipeptidica in una strut-tura tridimensionale o dalla sufficiente varietà di proprietà strutturali e chimiche che esse possiedono (che non ne ha rese necessarie altre nel corso del-l’evoluzione) o da una combinazione di entrambi i fattori
Famiglie e superfamiglie 2 • Una delle argomentazioni più forti a favore dell’ipotesi evolutiva viene dallo studio pubblicato nel 1991 da Dorit et al., nel quale si teorizzava che gli esoni stessi corrispondano strettamente ai domini funzionali delle proteine e che tutte le proteine derivino dai vari ar-rangiamenti dei circa 7000 esoni disponibili • Tuttavia, a prescindere dalle basi della similarità, i metodi di allineamento di sequenze e di ricerca di similarità in database sono spesso impiegati per sco-prire le possibili relazioni familiari fra proteine diverse • Utili per predire la struttura proteica, che sembra sotto-stare a vincoli evolutivi più forti della sequenza amino-acidica
Famiglie e superfamiglie 3 • Per definizione, le proteine che hanno un’identità di sequenza maggiore del 50% sono membri di un’unica famiglia • Allo stesso modo, le superfamiglie sono gruppi di famiglie proteiche correlate tramite livelli di similarità di sequenza bassi, ma ancora rilevabili (30%) hanno un’origine evolutiva comune, ma più antica • Tutte le proteine possono essere ulteriormente suddi-vise in categorie sulla base delle caratteristiche predo-minanti di struttura secondaria: proteine di membrana, proteine principalmente , proteine principalmente , strutture e e strutture
Famiglie e superfamiglie 4 • Sono stati realizzati diversi database gerarchici che raggruppano le proteine secondo queste caratteristiche • SCOP StructuralClassificationOfProtein • CATH Class, Architecture, Topology and Homologous superfamily • FSSP Foldclassificationbased on Structure-StructurealignmentofProteins
Ripiegamenti 1 • Mentre le famiglie di proteine hanno relazioni evolutive chiare e le superfamiglie proteiche hanno relazioni evolutive probabili, si dice che le proteine presentano un ripiegamento comune se hanno la stessa struttura secondaria con lo stesso tipo di arrangiamento e con la stessa connessione topologica • Proteine diverse con lo stesso ripiegamento spesso presentano elementi marginali di struttura secondaria e regioni a turn che differiscono in dimensione e con-formazione • Il termine ripiegamento è utilizzato come sinonimo di motivo strutturale, anche se generalmente si riferisce a combinazioni più ampie di strutture secondarie in qualche caso, un ripiegamento coinvolge metà della struttura totale della proteina
Ripiegamenti 2 • Proteine che si trovano nella stessa categoria di ripiegamento possono anche non avere un’origine evo-lutiva comune, ma essere il risultato di un rimesco-lamento degli esoni, in cui proteine con nuove funzioni vengono create attraverso il processo di ricombina-zione di esoni corrispondenti a domini funzionali di geni esistenti a livello del DNA • Alternativamente, le similarità strutturali possono nascere solamente da caratteristiche fisiche e chimiche delle proteine, che favoriscono certi arrangiamenti e certe topologie della catena
Tecniche sperimentali • Come nel caso dell’analisi genomica, molte analisi proteomiche sono limitate dalle tecniche sperimentali attualmente disponibili • Sfortunatamente, dalla prospettiva della proteomica, la natura stessa delle proteine rende le analisi di laboratorio particolarmente difficili e molto meno pre-cise rispetto a quelle disponibili per l’analisi genomica • Elettroforesi bidimensionale • Spettrometria di massa • Microarray proteici
Elettroforesi bidimensionale 1 • L’elettroforesi bidimensionale è una tecnica che per-mette di separare le proteine in base al peso moleco-lare e alla carica • Il procedimento utilizzato parte dall’estrazione delle proteine in un tessuto • Le proteine, poste su un striscia di supporto polimerico a cui è applicata una corrente elettrica e in presenza di un gradiente di acidità, migrano in maniera a diversa a seconda della loro carica elettrica intrinseca, rag-giungendo il proprio punto isoelettrico e formando delle “bande” • A questo punto il supporto viene posto sul margine di un gel per elettroforesi che consente la separazione delle proteine in base al peso molecolare in seguito all’applicazione della corrente elettrica
Elettroforesi bidimensionale 2 • Il risultato finale è un gel in cui virtualmente ciascuna proteina occupa un punto nello spazio bidimensionale, ed è evidenziabile attraverso opportune colorazioni • La tappa ultima consiste nell’isolamento dal gel di cia-scuna proteina per effettuare l’analisi che ne consenta l’identificazione • L’analisi può essere fatta in maniera manuale, rita-gliando dei tondini di gel contenenti una sola proteina e quindi procedendo con la spettrografia di massa, o attraverso tecniche automatiche (più o meno evolute) di lettura diretta da gel
Elettroforesi bidimensionale 3 • Con l’elettroforesi bidimensio-nale si ottengono fotografie in cui ogni puntino rappresenta una proteina • Confrontando fotografie otte-nute da campioni diversi si pos-sono individuare quali proteine differiscono per presenza e quantità in diverse condizioni sperimentali • In pratica, si considera una cellula o un tessuto e, usando le tecniche indicate, si ottengono, con una sola analisi, infor-mazioni su tutte le proteine che compongono il campione
Elettroforesi bidimensionale 4 • L’elettroforesi bidimensionale ha in realtà diverse gravi limitazioni che ne impediscono l’utilizzo estensivo • Il genoma umano codifica molte decine di migliaia di proteine • Inadeguatezza per l’analisi delle proteine molto piccole o con poca carica elettrica e delle proteine che attraver-sano la membrana plasmatica (e che rivestono impor-tanti ruoli in molte malattie) a causa della loro scarsa solubilità nelle preparazioni e nei gel • Sensibilità relativamente bassa dei metodi di rilevamento • Difficoltà nel determinare con precisione quale proteina è rappresentata da ciascuno spot
Spettrometria di massa 1 • Lo spettrometro è uno strumento che scompone lo spettro di una sorgente e ne misura le componenti • Esistono spettrometri che misurano lo spettro della radiazione elettromagnetica e spettrometri che misu-rano lo spettro di massa di una sostanza, ossia le masse dei suoi costituenti (atomi, molecole, composti) • In uno spettrometro di massa possono essere intro-dotti campioni allo stato solido, liquido o gassoso • Le sostanze solide o liquide devono essere rese volatili prima di iniziare la fase di ionizzazione in cui la molecola del composto viene ionizzata, nel caso più comune per interazione con un fascio di elettroni
Spettrometria di massa 2 • Lo ione molecolare carico positivamente si frammenta, con formazione di molecole e di ioni positivi (cationi) • Solo questi ultimi sono rivelati dallo spettrometro e sono separati in funzione del loro rapporto massa/carica • Infatti, i percorsi dei frammenti proteici (all’interno di un analizzatore) vengono fatti deviare da un campo magne-tico • La collisione degli ioni carichi positivamente con un collettore posto all’estremità dell’analizzatore genera una corrente elettrica che può essere amplificata e rilevata come una serie di picchi corrispondenti ad un’impronta digitale della massa dei peptidi (mass fingerprint) • In questo modo è possibile anche individuare l’esistenza di isotopi e determinarne la massa
Spettrometria di massa 3 • Nel grafico di uno spettro di massa, l’asse delle x riporta i valori di rapporto massa/carica e l’asse delle y i valori di abbondanza relativa degli ioni analizzati • Se la risoluzione dello strumento è sufficientemente elevata, è possibile determinare la massa esatta dei singoli ioni, da cui si può dedurre la composizione elementare dello ione stesso • Lo spettrometro di massa può essere direttamente interfacciato ad un gascromatografo; miscele com-plesse di prodotti possono quindi essere risolte nei singoli componenti ed i singoli spettri possono essere interpretati o confrontati con librerie standard di spettri di composti noti
Microarray proteici 1 • I microarray proteici si sono diffusi grazie alla possibilità di svolgere analisi di proteine su larga scala, nello stesso modo in cui i chip genetici hanno rivolu-zionato l’analisi del trascrittoma • Il concetto alla base dei chip proteici è molto simile a quello dei chip genetici: piccole quantità di sonde individuali sono legate covalentemente alla superficie di chip di silicio in array ad alta densità • Le proteine estratte dalle cellule vengono marcate con fluorofori e flussate sul chip • Proprio come avviene con i chip genetici, la quantità di materiale (in questo caso, proteina) legato alle sonde viene determinato mediante eccitazione del fluoroforo
Microarray proteici 2 • Per rilevare le interazioni proteinaproteina, protei-nacomposto, etc., si possono utilizzare anche array di sonde di cattura (per esempio anticorpi), che si legano alle proteine di un campione in modo tale da rilevarne i relativi livelli di espressione • I microarray proteici non hanno lo stesso impatto dei chip genetici • Diversamente dalle sequenze di DNA, con i loro legami unici dettati dall’accoppiamento fra basi, è ragionevole aspettarsi che una singola proteina possa interagire con più sonde differenti • La cinetica di legame di ogni sonda può variare e differenze nell’in-tensità del segnale potrebbero essere dovute a differenze nell’intensità di legame • Le proteine sono notoriamente sensibili alla chimica del loro ambiente ed alla superficie che esse incontrano, e sia gli estratti cellulari sia le sonde si possono comportare in modo inatteso quando vengono sottoposte alle procedure di controllo
Microarray proteici 3 • Per il momento (ed in attesa di tecniche di analisi automatica attendibili) è più semplice utilizzare i chip genetici come base, per puntare verso lo studio delle proteine di interesse • Una volta ristretto il campo, le analisi proteomiche su piccoli sottoinsiemi di proteine verranno effettuate su chip proteici realizzati appositamente
Progettazione di inibitori e di farmaci 1 • Una delle principali applicazioni della bioinformatica è la ricerca di agenti farmaceutici efficaci per prevenire e curare malattie dell’uomo • Lo sviluppo ed il test di un nuovo farmaco sono dispendiosi sia in termini di tempo spesso occorrono fino a 15 anni , sia di denaro con costi di centinaia di milioni di dollari • La genomica funzionale, la bioinformatica e la proteo-mica promettono di ridurre il lavoro associato a questo processo, accelerando i tempi ed abbassando i costi di sviluppo di nuovi farmaci
Progettazione di inibitori e di farmaci 2 • Mentre le fasi esatte dello sviluppo di un farmaco sono variabili, il procedimento complessivo si divide nei due passi fondamentali di scoperta e test • Il processo di test, che coinvolge prove precliniche e cliniche, non è generalmente soggetto a miglioramenti significativi per l’utilizzo di metodi automatici • Il processo di scoperta, che è invece laborioso e co-stoso ed offre un terreno fertile per la ricerca bioinfor-matica, può essere suddiviso in diverse fasi • Identificazione del bersaglio • Scoperta ed ottimizzazione di un composto “guida” • Tossicologia e farmacocinetica (che studia quantitativa-mente l’assorbimento, la distribuzione, il metabolismo e l’eliminazione dei farmaci)
Progettazione di inibitori e di farmaci 3 • L’obiettivo dell’identificazione del bersaglio consiste nell’isolare una molecola biologica che sia essenziale per la sopravvivenza o la proliferazione di un parti-colare agente causa di una malattia, detto patogeno • Identificato il bersaglio, l’obiettivo della progettazione di farmaci (drug design) consiste nello sviluppo di una molecola che si leghi al bersaglio e lo inibisca • Dato che la funzione del bersaglio è essenziale per il processo vitale del patogeno, l’inibizione del bersaglio ferma la proliferazione del patogeno o lo distrugge • Comprendere la struttura e la funzione delle proteine è una componente fondamentale nello sviluppo di far-maci, in quanto le proteine sono comuni bersagli dei farmaci stessi
Progettazione di inibitori e di farmaci 4 • Esempio • La HIV proteasiè una proteina prodotta dal virus umano dell’immunodeficienza (HIV) il patogeno che causa l’AIDS nel contesto di una cellula umana ospite • La HIV proteasi è essenziale per la proliferazione del virus: l’inibizione della proteina annienta l’efficacia del virus e la sua capacità di trasmissione
Progettazione di inibitori e di farmaci 5 • Come potrebbe una molecola inibire l’azione di un enzima, quale la HIV proteasi? • Le proteasi sono proteine che digeriscono altre proteine, come gli enzimi di restrizione utilizzati per tagliare in modo specifico la molecola di DNA • Molte delle proteine di cui l’HIV ha bisogno per soprav-vivere e proliferare in un ospite umano vengono prodotte come una singola, lunga, catena polipeptidica • Questo polipeptide deve poi essere tagliato nelle compo-nenti proteiche funzionali dalla HIV proteasi • Come molti enzimi, la HIV proteasi possiede un sito attivo a cui si legano e su cui operano altre molecole • Progettare una molecola che si leghi nel sito attivo della HIV proteasi, in modo da impedirne il normale funziona-mento
Screening di ligandi 1 • Il primo passo verso la scoperta di un inibitore per una particolare proteina è di solito l’identificazione di uno o più composti guida, che si leghino al sito attivo della proteina bersaglio • Tradizionalmente, la ricerca dei composti guida è sem-pre stata un processo trialanderror, durante il quale si testano diversi composti, fino a trovarne un numero sufficiente con effetti inibitori • Recentemente, metodologie di screening ad alta pro-duttività (HTS, HighThroughput Screening) hanno reso la procedura molto più efficiente, anche se il processo sotteso resta comunque una ricerca esau-stiva del maggior numero di composti guida
Screening di ligandi 2 • È noto da tempo che i siti attivi degli enzimi sono ospitati in tasche (cavità) ricavate nella struttura proteica, con specifiche caratteristiche chimicofisiche • L’interazione proteinaligando è dettata principalmente dalle caratteristiche di complementarietà dei due com-posti: ligandi idrofobici legheranno regioni idrofobiche, ligandi carichi saranno richiamati da regioni cariche di segno opposto, etc. • Gli algoritmi di docking di ligandi e quelli di screening tentano di rendere efficienti i processi di scoperta dei composti guida, muovendosi dal mondo della speri-mentazione in vitro a quello dei modelli astratti e del calcolo automatico
Docking di ligandi 1 • Il docking è la simulazione in silicio dell’aggancio della proteina con un ligando, ovvero obiettivo del docking è determinare come possono interagire due molecole di struttura nota • Geometria delle superfici • Interazioni tra residui affini • Campi di forza elettrostatici
Docking di ligandi 2 • In molti casi, la struttura tridimensionale di una protei-na e del suo ligando sono note, ma la struttura del complesso che essi formano è sconosciuta • Nella progettazione di farmaci, il docking molecolare viene impiegato per determinare come un particolare farmaco si lega ad un bersaglio o come due proteine interagiscano fra loro a formare un sito di legame • Gli approcci di docking molecolare hanno molto in comune con gli algoritmi per il ripiegamento delle proteine • Entrambe le problematiche implicano il calcolo dell’ener-gia di una particolare conformazione molecolare e la ricerca della conformazione che minimizza l’energia libera del sistema Molti gradi di libertà: ricerche euristiche e soluzioni subottime
Docking di ligandi 3 • Come nel ripiegamento proteico, vi sono due considerazioni principali di cui tenere conto all’atto della progettazione di un algoritmo di docking • Formulare una funzione energia per valutare la qualità di un particolare complesso e successivamente utilizzare un algorit-mo per esplorare lo spazio di tutti i possibili modi e conforma-zioni di legame alla ricerca di una struttura con energia minima • Gestire la flessibilità sia della proteina sia del ligando putativo • L’approccio chiaveserratura assume una struttura proteica rigida a cui si aggancia un ligando con struttura flessibile (approccio computazionalmente vantaggioso) • Il docking con adattamento indotto permette la flessibilità sia della proteina che del ligando • Compromesso: assumere per la proteina una catena principale rigida, mentre si permette la flessibilità delle catene laterali vicino al sito di legame del ligando
Docking di ligandi 5 • AutoDock (http://autodock.scripps.edu/) è un metodo ben noto per il docking di ligandi rigidi o flessibili • Per valutare un particolare complesso usa un campo di forza basato su una griglia • Il campo di forza viene utilizzato per dare un punteggio al complesso in base alla formazione di interazioni elettrostatiche favorevoli, al numero di legami idrogeno, alle interazioni di vanderWaals, etc.
Docking di ligandi 6 • AutoDock utilizzava originariamente un approccio Monte Carlo/simulatedannealing • Si inducono cambiamenti casuali nella posizione e conforma-zione corrente del ligando, tenendo quelli che danno origine a conformazioni a più bassa energia rispetto a quella corrente (quando un cambiamento porta ad un aumento di energia, viene scartato) • Tuttavia, per permettere all’algoritmo di trovare stati a bassa energia, superando eventuali barriere energetiche, i cambia-menti che portano ad energie più alte, talvolta, vengono ac-cettati (con una frequenza alta all’inizio del processo di ottimiz-zazione, che decresce lentamente per iterazioni successive) • Le versioni più recenti utilizzano algoritmi genetici, programmi di ottimizzazione che emulano la dinamica della selezione naturale su una popolazione di soluzioni in competizione
Screening di database 1 • Una delle considerazioni principali nel progettare algoritmi di docking è il bilanciamento tra la necessità di una completa ed accurata ricerca di tutte le possibili conformazioni e modalità di legame del ligando e la necessità di realizzare un algoritmo di complessità computazionale “ragionevole” • Per lo screening di database di possibili farmaci, gli algoritmi devono infatti effettuare il docking di migliaia di ligandi al sito attivo di una proteina e, pertanto, hanno bisogno di un efficienza elevata