1 / 54

M.Orozco J.L.Gelpi M.Rueda J.R.Blas

M.Orozco J.L.Gelpi M.Rueda J.R.Blas. Clase 4: Algoritmo general de optimización. Adaptado de Numerical Receipts J.A.McCammon & S.Harvey. Dynamics of Proteins and Nucleic Acids. Cambdrige University Press. Cambridge 1991. Optimización de geometría. {x} 0. NO. Epot. g= Epot/∂ x.

sharne
Download Presentation

M.Orozco J.L.Gelpi M.Rueda J.R.Blas

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. M.Orozco J.L.Gelpi M.Rueda J.R.Blas

  2. Clase 4: Algoritmo general de optimización Adaptado de Numerical Receipts J.A.McCammon & S.Harvey. Dynamics of Proteins and Nucleic Acids. Cambdrige University Press. Cambridge 1991.

  3. Optimización de geometría {x}0 NO Epot g= Epot/∂x Convergido? Algoritmo de búsqueda SI Nuevo conjunto {x}1 Final

  4. Precondiciones del cálculo • Coordenadas iniciales de soluto y solvente. • Dimensiones de la caja periódica Campo de fuerzas, incluidos “restrains”. • Definición de los “constrains” aplicados al sistema (en general evitar su uso en optimización).

  5. Objetivos MM • Mejorar la geometría local evitando malos contactos. • Obtener una primera evaluación de la energía del sistema. • Preparación del sistema para el cálculo de Dinámica Molecular.

  6. Definición matemática de la optimización Una función continua y diferenciable (de x), es posible expandirla como una serie de Taylor centrada en x0 Donde ‘ significa derivada y O representa términos orden superior Donde en nuestro caso x es un vector 3N dimensional

  7. Definición matemática de la optimización (2) Asumiendo que cerca mínimo la función es cuadrática: Se deduce que obviando Θ en el mínimo: Newton-Raphson: Problemas anarmonicidad de la función, coste del Cálculo de V’’(x) para macromoléculas prohibitivo.

  8. Definición matemática de la optimización (3) • Podemos simplificar el problema: • Iterando: llegar a x* iterando x0xkx* • Obviando el cálculo de la curvatura • Aproximando la matriz de derivadas segundas (Hessiano) Descent-techniques

  9. Steepest descent Método más robusto para acercarse al mínimo, aunque le cuesta converger al mínimo de energía Xk: vector 3N-dimensional con la configuración sistema iteración k lk: escalar: magnitud del salto en la dirección de búsqueda Sk: vector de busqueda: vector unitario dirección negativa del gradiente S,X son vectores

  10. Steepest descent(2) • Se busca siempre según la dirección del gradiente (sk). • Inicialmente para x0 se escoge un valor pequeño de l, i.e. se es conservador con la progresión en la búsqueda. • Si la nueva geometría da energía menor lk =1.2* lk-1 • Si la nueva geometría da energía mayor lk =0.5* lk-1

  11. Conjugate gradient Método más eficiente para converger en el mínimo, pero peor que SD cuando geometría inicial es muy mala En el primer paso se calcula el vector de búsqueda como en SD S,X son vectores

  12. Conjugate gradient(2) En los siguientes pasos el vector de búsqueda se deriva del gradiente según una función que es combinación lineal del gradiente actual y el de la previa iteración Dirección SD etapa k-1 Dirección SD etapa k Peso relativo: S,X son vectores

  13. Aspectos prácticos • En general se combina SD al inicio de la optimización con CG al final. • Métodos como Newton-Raphson solo se emplean muy cerca del mínimo (ej cálculo de frecuencias). • Es conveniente partir de diferentes conformaciones iniciales. • Es necesario verificar que es realmente un mínimo.

  14. Criterios de convergencia • Gradiente total muy pequeño. • Componente mayor del gradiente pequeño. • Diferencia energía entre etapa k y k+1 muy pequeña. • Diferencia de geometría prevista entre paso k y k+1 muy pequeña. • En principio matriz de derivadas segundas con todos los valores propios positivos.

  15. Criterios de convergencia(2) • En cálculos de minimización de geometría de macromoléculas normalmente no se llega a la convergencia total. • En cálculos de minimización de geometría de macromoléculas casi siempre el proceso se queda atrapado en un mínimo local.

  16. Limitaciones de la mecánica molecular • Las propias del uso de un force-field clásico. • No proporciona información dinámica sobre el sistema. • No introduce efectos de temperatura. • Es fácil converger el cálculo en mínimos locales en lugar de en el mínimo absoluto

  17. Clase 5: Algoritmo general de MD Adaptado de J.Phys.Chem. A., 1999, 103,3596 J.A.McCammon & S.Harvey. Dynamics of Proteins and Nucleic Acids. Cambdrige University Press. Cambridge 1991.

  18. Objetivos Dinámica Molecular • Obtener visiones promediadas de un sistema (Boltzman’s sampling). • Obtener muestreo de transiciones temporales. • Estudiar cambios en un sistema inducido por perturbaciones externas • Mejorar geometría de un sistema. • Obtener la termodinámica de un sistema y sus interacciones. • Ayudar en el refinado de estructuras a partir de restricciones X-Ray o NMR.

  19. Dinámica molecular Epot {xi} Fi= -∂Epot/∂xi Trayectoria ai= Fi/mi vi (t+dt)=v(t)i+aidt xi (t+dt)=x(t)i+vidt

  20. Precondiciones del cálculo t=t+Dt/2 • Coordenadas y velocidades de soluto y solvente a t=t-Dt/2 (obtenidas en un paso previo de integración) • Energía cinética a t=t-Dt/2 • Dimensiones de la caja periódica t=t-Dt/2 • Campo de fuerzas, incluidos “restrains” • Definición de las condiciones de simulación (“ensemble”, T,P,...) • Definición de los “constrains” aplicados al sistema • Soluto centrado en el origen de coordenadas

  21. “Ensembles” usuales en Dinámica Molecular • Cálculo libre  N,E,V  Microcanónico • T constante  N,T,V  Canónico • P constante N,P,H  Isobárico-Isoentálpico • T,P constantes  N,P,T  Isotérmico-Isobárico

  22. (1) Cálculo de velocidades moleculares (a) y energías cinéticas soluto donde Ma es la masa de la molécula a (ia átomos) Componente de rotación e intra del átomo i de la molécula a. V,v, f, R, r son vectores

  23. (1) Cálculo de velocidades moleculares (a) y energías cinéticas soluto Energía cinética translacional del soluto sx Energía cinética interna y rotacional del solutosx V,v, f, R, r son vectores

  24. (2) Cálculo del centro de masas de cada molécula (a) Centro de masas de la molécula a Posiciones de cada átomo ia relativas al centro de masas. V,v, f, R, r son vectores

  25. (3) Cálculo fuerzas “unconstrained” Donde V es la energía potencial determinada por el force field V,v, f, R, r son vectores

  26. (4) Cálculo del Virial(simulaciones a presión constante) Donde para el cálculo de riajb se aplican condiciones entorno (PBC) y donde no hay contribuciones de términos covalentes (Virial molecular) V,v, f, R, r son vectores

  27. (5) Cálculo de la presión(simulaciones a presión constante) Donde Vbox es el volumen de la caja periódica V,v, f, R, r son vectores

  28. (6) Cálculo de las nuevas velocidades “unconstrained” Etapa 1 V,v, f, R, r son vectores

  29. (7) Escalado de las velocidades (simulaciones a T constante) La ecuación térmica de estado define la Temperatura: V,v, f, R, r son vectores

  30. (7b) Temperatura constante Existen diferentes algoritmos el de Berendsen es el más popular tT tiempo de relajación, T0 T de referencia Se puede tomar b igual para todos los átomos o por grupos V,v, f, R, r son vectores

  31. (8) Determinar nuevas posiciones Si es preciso se aplica SHAKE para forzar los “constrains” V,v, f, R, r son vectores

  32. (9) Determinar velocidades “constrained” Calcular energía cinética de soluto, solvente y total V,v, f, R, r son vectores

  33. (10) Escalado de posiciones y de la caja (simulaciones a P constante) El escalado es molecular, i.e no cambia geometría interna En general se usa el mismo escalado para todos los átomos El escalado puede ser isotrópico mx=my=mz o anisotrópico V,v, f, R, r son vectores

  34. (10b) Escalado de posiciones y de la caja (simulaciones a P constante) Existen diferentes algoritmos el de Berendsen es el más popular tP tiempo de relajación, P0 P de referencia V,v, f, R, r son vectores

  35. (11) Incrementar etapa de integración ,...y repetir todo el proceso hasta que n= número de pasos Dt entre 0.5 y 2 fs, i.e 5x10-16 – 2x10-15 seg. V,v, f, R, r son vectores

  36. Algunas escalas temporales • Vibraciones átomos 10-14 seg. • Stretching global Ac. Nuc. 10-12 seg. • Global twisting Ac. Nuc. 10-12 seg. • Repuckering azucares. 10-10 seg. • Movimiento relativos dominios. 10-9 seg. • Bending global Ac. Nuc. 10-8 seg. • Transiciones alostéricas. 10-3 seg. • Desnaturalizaciones parciales. 10-0 seg.

  37. Modificaciones del algoritmo MD • Introducción de restricciones geométricas • Introducción de fuerzas externas (steered Molecular Dynamics) • Activación de transiciones (Activated Molecular Dynamics) • Introducción de términos stochasticos (Stochastic Molecular Dynamics)

  38. Stochastic MD Se introduce una fuerza externa f ext debida a grados de libertad no considerados explícitamente en la simulación Fuerza promedio externa Fricción Fluctuaciones en el tiempo V,v, f, R, r son vectores

  39. Stochastic MD En lugar de las ecuaciones de Newton se resuelven las ecuaciones de Langevin Fuerza interna (FF) Fricción Fuerza promedio externa Término random V,v, f, R, r son vectores

  40. Condiciones iniciales MD Coordenadas: Experimentales, Modelado, Optimización,... Velocidades: Al azar, pero que en conjunto cumplan: Será necesario equilibrar el sistema V,v, f, R, r son vectores

  41. SET-UP DEL SISTEMA (1) • Construir soluto, asignarle topología y parámetros del force-field. • Rodearlo de solvente (capas, gota, caja) empleando solvente preequilibrado. • Optimizar • Termalizar • Equilibrar

  42. SET-UP DEL SISTEMA (2) • La calidad en la estructura del soluto no está siempre garantizada. • La no-calidad en la representación del solvente esta garantizada. • La optimización, termalización y equilibrado son claves para la calidad de la trayectoria.

  43. SET-UP DEL SISTEMA (3):SOLVENTE • El soluto se introduce en una caja infinita de solvente pre-equilibrado • Se eliminan las moléculas solvente demasiado próximas • Se espera que en la optimización-equilibrado-termalización se equilibrará el solvente. • Problemas muy graves con aguas atrapadas en canales y cavidades  introducir aguas cristal, o aguas cMIP, GRID,...

  44. CMIP - Energy evaluation Precalculated potential grids Felec FVdWC FVdwO (…) Protein is mapped in a 3D grid FVdWX

  45. Update Energy grids Protein Energy grids Select E min & add ion to protein cMIP Titration Wat docking Na+ docking Cl- docking

  46. cMIP reproduce aguas cristalográficas con precisión

  47. Normal set-up Catalase Thymidine Kinase CMIP-set-up

  48. SET-UP DEL SISTEMA (4)Optimización • Siempre es parcial, combina ciclos de SD y de CG (típicamente 5- 10000 ciclos) • Se suele optimizar por etapas. 1o solvente, 2o soluto, 3o todo junto. • Útil revisar componentes máximos gradiente  átomo atrapado

  49. SET-UP DEL SISTEMA (5)Termalización • Las velocidades iniciales se generan a temperatura menor a la de trabajo • Se va incrementando la temperatura típicamente 10 grados x 1-5 ps. • Pueden calentarse independientemente soluto y solvente. • Puede restringirse movimiento del soluto. • Puede iniciarse NVT para acabar NPT. • Muchas variantes dependiendo del sistema

More Related