300 likes | 695 Views
Docking. Il problema del docking molecolare. Date due molecole di cui sono note le geometrie 3D il docking si pone di rispondere a: Le due molecole si legano tra di loro? Quanto vale l’energia di interazione? (binding energy) Qual’è la geometria del complesso fra le due molecole?
E N D
Il problema del docking molecolare • Date due molecole di cui sono note le geometrie 3D il docking si pone di rispondere a: • Le due molecole si legano tra di loro? • Quanto vale l’energia di interazione? (binding energy) • Qual’è la geometria del complesso fra le due molecole? • Problemi di docking in biochimica: • Docking proteina-molecola • Docking DNA-molecola • Docking proteina-proteina • Docking proteina-DNA
Importanza del docking Il docking permette di studiare come una molecola si lega ad una macromolecola biologica (enzima, proteina, DNA, recettore) processo alla base del riconoscimento molecolare • Il riconoscimento molecolare è un fenomeno di enorme importanza in biologia • Enzima substrato, inibitore • Anticorpo antigene • Recettore ligando (agonista, antagonista) • Strutture di complessi proteina-ligando • raggi X • NMR • Importanza in chimica farmaceutica • Ligando = Molecola con azione farmacologica?
Generalità sul docking • L’associazione fra le due molecole è basata su interazioni: • Van der Waals • Elettrostatiche • Legami idrogeno • Le interazioni corrispondenti sono deboli e a corto raggio • Complementarietà geometrica • Complementarietà chimica • Nel docking si cerca di determinare la geometria del complesso intermolecolare formato fra le due molecole • L’energia di binding è la differenza di energia fra il complesso e le due molecole separate • Il solvente (acqua) gioca un ruolo importante • L’entropia ha un impatto significativo sul binding.
Aspetti Energetici • Interazioni a corto raggio implicano elevata complementarietà geometrica fra le superfici a contatto: “docking geometrici” • Ligando e proteina sono conformazionalmente flessibili • La stima dell’energia è difficoltosa (energie conformazionali, effetto del solvente, effetto entropico, energia elettrostatica,..)
Applicazioni • Stima dell’energia di binding target-ligando • Predizione della geometria del complesso target-ligando • Principale campo di applicazione delle tecniche di docking è lo studio delle proprietà (energia e geometria) di binding di potenziali nuovi farmaci: • Modalità di binding di farmaci già noti • Ricerca di molecole potenzialmente attive su nuovi target recettoriali (virtual screening) • Previsione “in silico” della potenziale attività farmacologica di nuove molecole
Peculiarità del docking • La ricerca farmaceutica richiede elevate prestazioni (arrivare a risultati plausibili in poco tempo), per cui tutte le tecniche di docking impiegate in questo ambito puntano a: • Sfruttare al meglio tutte quello che si conosce del sistema target-ligando in oggetto • Impiegare algoritmi specializzati per la ricerca della geometria di binding • Impiegare funzioni parametrizzate per la stima dell’affinità target-ligando e per la previsione della geometria di binding
Condizioni iniziali • Lo studio di docking può essere effettuato quando: • È nota la struttura 3D del target recettoriale • Sono note le principali interazioni target-ligando • La struttura di target e ligando sono compatibili con la parametrizzazione dei modelli impiegati • Le dimensioni e la complessità del sistema possono essere trattati dai modelli impiegati • Quasi tutte le condizioni citate sono soddisfatte quando è possibile trovare la struttura di complessi co-cristallizzati del target con molecole simili al ligando in oggetto.
Protein Data Bank (PDB) Un organismo che si occupa di raccogliere, catalogare, classificare e rendere disponibile a chiunque i dati cristallografici relativi ad enzimi, recettori, acidi nucleici e, in generale, macromolecole biologiche. Tutti possono accedere, consultare e scaricare strutture Xray dall’archivio PDB, www.pdb.org Esistono anche siti o applicazioni specifiche per la consultazione guidata del dati presenti sul PDB. Tutti i programmi di modelling sono in grado di leggere i files depositati nell’archivio PDB.
Funzioni di score L’ enorme mole di dati strutturali disponibili tramite l’archivio PDB, è stata ed è fondamentale per lo sviluppo di metodi di docking validi. L’obiettivo più importante è sviluppare metodi di docking in grado di prevedere la geometria di binding tramite una funzione che stima l’affinità tra target e ligando. Questa funzione viene generalmente indicata con il nome di funzione di score. Effettivamente, i diversi programmi di docking finora sviluppati si differenziano proprio in base alla funzione di score e all’algoritmo di ricerca.
Finora sono state implementate diversi tipi di funzioni di score e, quasi certamente, negli anni la lista è destinata ad aumentare. • Attualmente, possiamo distiguere tra classi principali: • Force field based: la stima dell’affinità target-ligando viene effettuata tramite la meccanica molecolare. • Knowledge based: funzioni che stimano la probabilità di “avvicinamento” tra atomi del ligando ed atomi del target. • Consensus scoring: lo scoring complessivo è dato dalla combinazione di più funzioni di score.
Approcci al docking • Target • Rigido: gli atomi del target sono fissi durante la ricerca della geometria di binding ( cruciale la scelta della struttura inziale del target) • Semi-rigido: alcuni atomi del sito di binding possono adattarsi al binding del ligando • Flessibile: le conformazioni di target e ligando si adattano reciprocamente( attualmente si può fare solo con la dinamica molecolare, non con il docking) • Ligando • Rigido: nel docking sono ricercate la posizione e l’orientamento di una conformazione fissa del ligando nel sito recettoriale. • Flessibile: nel docking sono ricercate la posizione, l’orientamento e la conformazione del ligando nel sito recettoriale.
Variabili del docking Una combinazione delle 6+n variabili definisce la posa di un ligando. xcm, ycm, zcm , , 1, 2
Sono algoritmi di ricerca del minimo globale basati sull’analogia con la genetica e l’evoluzione Genotipo: ogni posa è individuata da un cromosoma, a sua volta formato da 6+ngeni: - 3 coordinate del centro di massa - 3 angoli di Eulero - n angoli di torsione dei legami rotabili Fenotipo: l’affinità con il target (score) è l’unico fattore che viene considerato nell’evoluzione e si identifica con la fitness. Questi algoritmi di ricerca creano popolazioni di pose che di generazione in generazione evolvono trasmettendosi i caratteri ereditari sotto una costante pressione selettiva. Il meccanismo di trasmissione dei caratteri avviene in base a processi che mimano il rimescolamento dell’informazione genica che si osservano in natura: mutazioni puntiformi e crossing-over. I parametri di controllo di questi algoritmi sono tipicamente il numero di generazioni, la pressione selettiva, il tasso di mutazione e crossing-over, il numero di nicchie evolutive, etc. Algoritmi Genetici (GA)
Popolazione initiale di m conformazioni: Ciascuna conformazione è rappresentata da un cromosoma 1 0 1 0 0 1 0 1 0 0 1 0 0 0 1 0 1 0 0 1 1 2 3 4 Nel cromosoma, ciascuna torsione può essere rappresentata da uno dei 25=32 valori corrispondenti a numeri binari a 5 cifre Si calcola la funzione di fitness ( l’energia) per ciascun cromosoma
00100011110001 11000011001100 00100011001100 11000011110001 00100011110001 00100010110001 Nuova popolazione ottenuta tramite gli operatori genetici: Selezione: solo gli individui con miglior fitness si riproducono Crossover: Mutazione puntuale:
Gold • Fitness evaluation of individual with chromosome c: • Build conformation according to c. • Superimpose matching interacting groups. • Calculate docking score: -Ehydrogenbond – (Einternal + EVdW-complex) • Genetic operators • Cross over • Mutation • Migration • Operators randomly selected. • 20-50 runs, each with up to 100000 genetic operations.
Gold Validation: Good 4PHV - A peptide-like ligand docked into HIV protease
Gold Validation: Close 1GLQ - A nitrophenyl-substituted peptide ligand docked into glutathione-S-transferase
L’algoritmo effettua un search conformazionale preliminare allo scopo di generare un numero elevato di conformeri del ligando. La popolazione di conformeri viene sottoposta ad una serie di test, via via più restrittivi, per individuare un numero ristretto di candidati. Viene effettuato lo scoring dei conformeri così ottenuti; quelli corrispondenti alle pose migliori vengono considerati per una fase successiva di rescoring, in cui viene stimata in maniera più accurata l’interazione tra target e ligando. Algoritmi a ricerca gerarchica
Preparazione della proteina ed del ligando: la funzione di score implementata in Glide usa il campo di forze OPLS il programma deve assegnare i parametri del FF agli atomi del target e del ligando. Calcolo dei campi molecolari di interazione: il sito di binding del target viene mappato con griglie tridimensionali (Grid Generation). Il mapping renderà lo scoring (eseguito nella succesiva fase di docking) molto più rapido ed efficiente. Docking: le pose del ligando vengono calcolate, filtrate ed i risultati vengono elaborati per renderli disponibili all’utente. Docking con Glide