550 likes | 741 Views
Drug Design. Etienne Thoreau. Généralités sur le drug discovery, contexte industriel Petites molécules / macromolécules Types atomiques, types d'interaction Acides aminés Energie et molécules Analyse conformationnelle Énergie libre Structure(s) 3D de la cible : Docking , SBDD
E N D
Drug Design Etienne Thoreau
Généralités sur le drug discovery, • contexte industriel • Petites molécules / macromolécules • Types atomiques, types d'interaction • Acides aminés • Energie et molécules • Analyse conformationnelle • Énergie libre • Structure(s) 3D de la cible : Docking, SBDD • Rigide • Flexible • molécules actives : Pharmacophores, QSAR • pas de structure 3D de la cible, • pas de molécules actives : diversité
Modélisation moléculaire et recherchePharmaceutique (RDD,CADD, SBDD…) Target Sélection Structure 3D de la cible connue, faisabilité ? ligands connus, pharmacophore ? Hit finding Virtual screening, database filtering Hit to lead docking, sélectivité Lead Optimisation virtual ADMET, chemogenomics Recherche Développement
Evolution de la recherche en Drug discovery Nouvelles technologies et nouvelles limitations • 70s • Leads = produits naturels, hazard • Optimisation tributaire de la chimie, fondée sur hypothèses • Limitations : expérimentation animale • 90s • Modélisation moléculaire • Tests in-vitro ( inhibition d'enzymes, liaison au récepteur) • Limitations : synthèse chimique • 2000 • Genie génétique (production de proteines) • Structure-based drug design • Chimie conbinatoire (mélanges) • High-throughput screening (HTS) • Limitations : propriété ADMET des leads • 2000 • Genomique, proteomique, pharmacogenomique, bioinformatique • Animaux transgéniques proof of concept (POC) • Chimie combinatoire (1 composé par puit, librairies focalisées ou diverses) • Structure-based drug design • Data mining (screening virtuel de très grande librairie) • ADMET profiling (HTS et virtual ADMET, chemo-génomique) • data pipelining • Limitations : validation de cible, déluge de données
Causes des échecs en Drug Discovery • mauvaise pharmacocinetique (mauvais profile ADME chez l'homme, métabolites problématiques) • Faibles activités cliniques • Effets secondaires, toxicité (métabolites, sélectivité) • Stratégie marketing • Plus l'échec est tardif plus il coûteux !
Nouvelles Stratégies en Drug Design • Conception d'inhibiteurs à partir de la structure du substrat • Identification de Pharmacophores • peptidomimétiques • Structure-based drug design Meilleure prise en compte de l'Affinité, de la sélectivité • Computer-aided drug design • Combinatorial drug design • caratère drug-like, biodisponibilité (e.g., Lipinski’s Rule of Five)
Petites molécules / Macro-molécules • Distinction en fonction de la chimie et de la complexité de la molécule, cible ligand • Distinction en terme d’accessibilité de la structure 3D par le calcul • Similarité pour les interactions 12,5 HRWM Progestérone PGF2a
Petites molécules / Macro-molécules D’un point de vue computationnel, une petite molécule est une molécule pour laquelle on peut énumérer toutes ses conformations : 20 liaisons sp3-sp3 incrémént 120° Nconformations = 320= 3.5 109 Cycles saturés fusionnés Pour une petite molécule, par analyse conformationnelle on peut calculer les conformations d’énergies minimales (énumération) (la conformation active implique l’énergie du complexe proteine-ligand !)
Petites molécules / Macro-molécules Les différentes conformations des macromolécules protéiques ne peuvent être recherchées exhaustivement. On ne peut déduire la structure 3D d’une protéine à partir de sa seule séquence (proteinfolding). L’information structurale fiable est principalement expérimentale par cristallographie ou RMN . En revanche, ces polymères sont simples au niveau de leur séquence primaire (analyse de séquences et obtention de modéles approximatifs par homologie au sein de protéines de la même famille) RFGENHAIMGVAFTWVMALACAAPPLV ARVSVARARLALAAVAAVALAVALLPL AVASQRRAWATVGLVWAAALALGLLPL TKITSKHVKMMLSGVCLFAVFIALLPILG
Interactions moléculaires Les interactions inter et intra-moléculaires sont de plusieurs types Interactions polaires liaisons hydrogènes interactions électrostatiques, pont salins dipoles-dipoles Interactions hydrophobes aromatiques aliphatiques
R Liaison-H : "Partage" un H Dd- Ad- Hd+ R Interactions moléculaires Les interactions polaires proviennent de la distribution inégales des charges dues aux associations chimiques entre atomes d'électronégativités différentes fonctions chimiques Energie ~ 5Kcal/mol
Interactions électrostatiques Interactions électrostatiques
Interactions hydrophobes Biodisponibilité et LogP Des molécules, (fragments) apolaires ont tendance à s'associer avec des parties Également apolaire entropie LogP = Log du coefficient de partition entre le 1-octanol et l'eau (logKO/W) • Le logP mesuré ou calculé (clogP) est un descripteur fondamental pour estimer la biodisponibilité des molécules. • Bonne balance hydrophobe/hydrophile • Suffisamment hydrophile pour être soluble dans les milieux aqueux (sang, liquide intersticiel, cytoplasme ...) • Suffisamment hydrophobe pour traverser les membranes • Valeurs typiques varient de -3 (très hydrophile) à +7 (très hydrophobe) • La plupart des molécules Drug like ont des logP dans la gamme 2-5. • Importance du LogP pour modéliser des résultats in Vivo
C H 3 N O C H H C H 3 3 O N O H O O O H O H Morphine (clog P = 0.24) Cocaine (clog P = 2.72) Indinavir (clog P = 2.78) Imipramine (clog P = 4.49)
CARACTERE DRUG-LIKE Lipinski “Rule of Five”(1) • MW 500 (opt = ~350) • # accepteurs de liaison-H 10 (opt = ~5) • # donneurs de liaison-H 5 (opt = ~2) • -2 < cLog P < 5 (opt = ~3.0) • # Flexibilité : rotules 5 1: C. Lipinski et al, Adv. Drug. Del. Rev, 23, 3-25 (1997)
Acides aminés Ac carboxylique amine Carbonne alpha A PH 7 : le groupe amino est ionisé NH3+ Et le groupe ac. Carboxylique aussi COO- Chainelatérale Les acides aminés s'associent Par liaison peptidique (fonction amide polaire)
Les chaines latérales, R, déterminent les differences dans les propriétées structurales et chimiques des 20 acides aminés naturels . classifications • Aliphatiques/hydrophobes Ala, Leu, Ile, Val • Polaires Asn, Gln • Fonction Alcool Ser, Thr, (Tyr) • Souffrés Met, Cys • Aromatique Phe, Tyr, Trp, (His) • Chargés Arg, Lys, Asp, Glu, (His) • Speciaux Gly (pas de R) Pro (cyclic, imino-acid)
Petits Acides aminés A Ala Alanine P Pro Proline C Cys Cysteine peu chargé, hydrophobePonts SSchélate les métauxSH très réactif Imino acid Rigidité hydrophobe Petit, hydrophobe Hélice alpha G Gly Glycine T Thr Threonine S Ser Serine Pas de R Très flexible Hydrophobicité indéterminée Petit, polaire Fonction Alcool HBD, HBA Petit, hydrophobe Fonction Alcool HBD, HBA
H His Histidine K Lys Lysine R Arg Arginine D Asp Aspartic acid Gros, guanidine rigide Chargé +, HBD Long, flexible Hydrophile Chargé +, HBD Neutre ou chargé + Aromatique, HBD, HBA E Glu Glutamic acid Acides aminés Polaires ou chargés Taille moyenne Hydrophile, Chargé – , HBA Hydrophile, Chargé – , HBA N Asn Asparagine Q GlnGlutamine Polaire, neutre HBD, HBA Polaire, neutre HBD, HBA
Hydrophobes aliphatiques M Met Methionine V Val Valine Beta branché souffré L Leu Leucine I Ile Isoleucine Beta branché
Hydrophobes aromatiques Y Tyr Tyrosine F Phe Phenylalanine F Phe Phenylalanine Hydrophobe, Phenol, HBD et HBA Grand, hydrophobe W Trp Tryptophan Grand, hydrophobe, HBD
Energie et molécules Les structures moléculaires et les interactions moléculaires sont gouvernées Par des considérations énergétiques. Les calculs d’énergies peuvent être effectués avec différents modèles Au niveau de la mécanique quantique l’énergie de la molécule est calculée À partir des interactions explicites entre les électrons et les noyaux. méthodes ab-initio méthodes semi-empiriques Intérêt : précision Problèmes : temps de calcul 10-100s atomes La mécanique moléculaire est une méthode empirique permettant de reproduire raisonnablement des résultats expérimentaux à partir de modèles mathématiques simples des interactions. Ces modèles sont paramétrés pour les principaux types atomiques qui servent à décrire les molécules d’intérêt. L’ensemble fonction mathématique + paramètres est appelé champ de force. Intérêt : rapidité, taille Problèmes : paramétrisation, précision.
différences chimie quantique / mécanique moléculaire Méthodes quantiques On distingue les noyaux et les électrons Les interactions électrons-électrons et électrons-noyaux sont explicites. Les interactions sont régies par les charges électroniques et nucléaires (énergie potentielle) et les mouvements électroniques. Les interactions déterminent la distribution spatiale des électrons et des noyaux Ainsi que leurs énergies Mécanique moléculaire Noyaux et électrons sont modélisés en une seule particule Particules sont sphériques (rayons atomiques expérimentaux ou théoriques) et possède une charge nette (théorique) Les interactions sont modélisées par des ressorts et des potentiels classiques Les interactions doivent être préassignées à un jeu spécifique de type d’atomes Les interactions déterminent la distribution spatiale des particules atomique et leurs énergies
Energie et molécules • Energy = • Stretching Energy + Bending Energy + • Torsion Energy + Non-Bonded Interaction Energy
"A" contrôle l'amplitude et "n" la périodicité "phi" est la phase
"A" et "B" controlent la profondeur et la position du puit pour i et j
Importance de la consistance du champ de force. Cohérence des paramêtres avec les charges partielles
Initial Trajectoire final MINIMISATION d’ENERGIE et DYNAMIQUE MOLECULAIRE Notion de Surface d’énergie potentielle Notion de surface d’énergie potentielle
Minimisation • Les algorithmes de minimisation d’énergie mesurent l’énergie le long de la surface de façon incrémentale pour déterminer des directions qui mènent a un minimum. • Algorithmes incapables de changer de vallée. • Minima locaux Steepest Descent Suit le gradient de la fonction énergie à chaque pas. Peut conduire à des oscillations Mauvaise convergence à l’approche du minimum. Conjugate Gradients Tient compte des gradients calculés aux étapes précedentes Pour éviter les oscillations. Peut rencontrer des problèmes quand conformations initiales sont très distordues Newton-Raphson Prédit la position du minimum
Dynamique moléculaire, simulation Comme pour la minimisation d’énergie, la dynamique moléculaire change les degrés de liberté du système pas à pas. Mais les pas en dynamique moléculaire, représentent les changement des positions atomiques, ri, en fonction du temps (i.e. vitesses). La dynamique moléculaire utilise l’équation du mouvement de Newton pour simuler les mouvements atomiques La force exercée sur un atome peut être calculée à partir de la variation d’énergie entre deux positions. L’énergie E est obtenue par mécanique moléculaire
Connaissant les forces et les masses on peut ensuite résoudre les positions de chaque atome le long d’une série de pas de temps de l‘ordre de la femtoseconde (10-15 secondes). La série de positions instantanés obtenue constitue une trajectoire. En pratique les accélérations atomiques sont calculées À partir des forces et des masses Les vitesses sont calculées à partir des accélérations Les positions sont calculées à partir des vitesses On assigne des vitesses initiales aux atomes en fonction de l’énergie cinétique totale elle-même fonction de la température de simulation. Le pas de calcul limite la durée des trajectoires calculables de l’ordre de Quelques picosecondes (10-12 secondes)
Analyse conformationnelle Passage de 1D ou 2D à 3D Programmes : Corina, Concord, Converter … Problèmes : stéréochimie non définie formes tautomères état d’ionisation (représentation différente) aromaticité macro-cycles, cycles branchés multiplicité des formats de fichier texte (sdf, mol, mol2, smile) ou binaire Solution : data pipelining
Adenine Amino form Imino form Thymine Keto form Enol form Tautomérie Format smile du benzène C1:C:C:C:C:C1
Format mol2 1 # Name: benzene 2 # Creating user name: tom 3 # Creation time: Wed Dec 28 00:18:30 1988 4 5 # Modifying user name: tom 6 # Modification time: Wed Dec 28 00:18:30 1988 7 8 @<TRIPOS>MOLECULE 9 benzene 10 12 12 1 0 0 11 SMALL 12 NO_CHARGES 13 14 15 @<TRIPOS>ATOM 16 1 C1 1.207 2.091 0.000 C.ar 1 BENZENE 0.000 17 2 C2 2.414 1.394 0.000 C.ar 1 BENZENE 0.000 18 3 C3 2.414 0.000 0.000 C.ar 1 BENZENE 0.000 19 4 C4 1.207 -0.697 0.000 C.ar 1 BENZENE 0.000 20 5 C5 0.000 0.000 0.000 C.ar 1 BENZENE 0.000 21 6 C6 0.000 1.394 0.000 C.ar 1 BENZENE 0.000 22 7 H1 1.207 3.175 0.000 H 1 BENZENE 0.000 23 8 H2 3.353 1.936 0.000 H 1 BENZENE 0.000 24 9 H3 3.353 -0.542 0.000 H 1 BENZENE 0.000 25 10 H4 1.207 -1.781 0.000 H 1 BENZENE 0.000 26 11 H5 -0.939 -0.542 0.000 H 1 BENZENE 0.000 27 12 H6 -0.939 1.936 0.000 H 1 BENZENE 0.000 28 @<TRIPOS>BOND 29 1 1 2 ar 30 2 1 6 ar 31 3 2 3 ar 32 4 3 4 ar 33 5 4 5 ar 34 6 5 6 ar 35 7 1 7 1 36 8 2 8 1 37 9 3 9 1 38 10 4 10 1 39 11 5 11 1 40 12 6 12 1 41 @<TRIPOS>SUBSTRUCTURE 42 1 BENZENE 1 PERM 0 **** **** 0 ROOT
Analyse conformationnelle Génération des conformèreset évaluation des énergies - énumération exhaustive - Algorithme + élaboré : arborescence élagage de l'arbre - Procédure d'échantillonnage suivi de minimisation - dynamique a haute température + minimisation Différent programmes : Clustering Diversité des conformères Contraintes (pharmacophores, données expérimentales, statistiques (CCDC, PDB)
Arborescence de l’échantillonnage élagage Echantillonnage systématique et surface D’énergie potentielle
Des informations sur la structure 3D de la cible sont disponibles Expérimentale3D Cristallographie, RMN, Microscopie électronique. Précision atomique (résolution !) Les structures expérimentales ne sont pas forcément dans la conformation recherchée ! Apo proteine, complexe avec agoniste alors qu’on cherche un antagoniste Expérimentale 1D mutation + effet biologique … mutagénèse dirigée Modèles par homologie la séquence de la cible est connue et La structure 3D d’au moins une protéine homologue (template) est connue. Construction de la structure 3D de la cible calquée et adaptée à partir Des templates expérimentales homologues.
Modélisation par homologie : modeller 1 Les templates 3D sont alignées avec la séquence cible 2 Des caractéristiques spatiales (distances Ca-Ca, dihèdres du squelette et des chaines latérales …) sont transférées sous forme de contraintes spatiales sur la cible. La forme des contraintes sont dérivées de l’analyse statistique de proteines homologues. 3 Ces contraintes sont combinées avec le champ de force CHARMM pour donner une fonction objectif à minimiser par dynamique moléculaire et minimisation.
Modélisation par homologie modeller La qualité de l’alignement initial est le paramêtre principal de la méthode sur lequel On peut jouer. Alignement de familles + ajustement manuel. Le degré d’homologie détermine la qualité de la structure 3D que l’on peut obtenir. La distribution de la similarité sur les séquences a aussi son importance. MODELLER implemente une automatisation de la modélisation par homologie En incorporant des contraintes dérivées empiriquement d’une analyse statistique des relations entre un grand nombre de paires de structures homologues. Cette analyse repose sur une base de données de 105 familles d’alignement incluant 416 proteines de structures 3D connues. En pratique, des contraintes plus compliquées (probabilités conditionnelles) sont utilisées qui dépendent d’informations comme l’accessibilité au solvent et les distances par rapport aux gaps.
Modélisation par homologie modeller Par analogie avec la RMN, modeller proposes différentes solutions avec des énergies voisines qui satisfont plus ou moins les contraintes. L’analyse et la validation des modèles générées sont essentielles. distribution des violations de contraintes sur la séquence. Validation empirique par satisfaction de contraintes expérimentales Sélection des modèles qui rendent le mieux compte des relations structures activités … La modélisation par homologie reste une science approximative ! On reste à proximité de la structure 3D template. Problèmes spécifiques avec les boucles, gaps Autres programmes d’intérêt : Composer, Fugue Il existe de nombreux serveurs qui combinent l’étape d’analyse de séquence Et de construction des modèles ex : http://swissmodel.expasy.org
Différents types de cibles Acides nucléiques triples hélices , ARN antisens Protéines Canaux ioniques transporteurs Enzymes : protéases, kinases, caspases … Récepteurs : nucléaires, trans-membranaires GPCR Récepteurs de petites molécules ou interactions protéines-protéines