540 likes | 683 Views
M.Orozco J.L.Gelpi M.Rueda J.R.Blas. Clase 4: Algoritmo general de optimización. Adaptado de Numerical Receipts J.A.McCammon & S.Harvey. Dynamics of Proteins and Nucleic Acids. Cambdrige University Press. Cambridge 1991. Optimización de geometría. {x} 0. NO. Epot. g= Epot/∂ x.
E N D
M.Orozco J.L.Gelpi M.Rueda J.R.Blas
Clase 4: Algoritmo general de optimización Adaptado de Numerical Receipts J.A.McCammon & S.Harvey. Dynamics of Proteins and Nucleic Acids. Cambdrige University Press. Cambridge 1991.
Optimización de geometría {x}0 NO Epot g= Epot/∂x Convergido? Algoritmo de búsqueda SI Nuevo conjunto {x}1 Final
Precondiciones del cálculo • Coordenadas iniciales de soluto y solvente. • Dimensiones de la caja periódica Campo de fuerzas, incluidos “restrains”. • Definición de los “constrains” aplicados al sistema (en general evitar su uso en optimización).
Objetivos MM • Mejorar la geometría local evitando malos contactos. • Obtener una primera evaluación de la energía del sistema. • Preparación del sistema para el cálculo de Dinámica Molecular.
Definición matemática de la optimización Una función continua y diferenciable (de x), es posible expandirla como una serie de Taylor centrada en x0 Donde ‘ significa derivada y O representa términos orden superior Donde en nuestro caso x es un vector 3N dimensional
Definición matemática de la optimización (2) Asumiendo que cerca mínimo la función es cuadrática: Se deduce que obviando Θ en el mínimo: Newton-Raphson: Problemas anarmonicidad de la función, coste del Cálculo de V’’(x) para macromoléculas prohibitivo.
Definición matemática de la optimización (3) • Podemos simplificar el problema: • Iterando: llegar a x* iterando x0xkx* • Obviando el cálculo de la curvatura • Aproximando la matriz de derivadas segundas (Hessiano) Descent-techniques
Steepest descent Método más robusto para acercarse al mínimo, aunque le cuesta converger al mínimo de energía Xk: vector 3N-dimensional con la configuración sistema iteración k lk: escalar: magnitud del salto en la dirección de búsqueda Sk: vector de busqueda: vector unitario dirección negativa del gradiente S,X son vectores
Steepest descent(2) • Se busca siempre según la dirección del gradiente (sk). • Inicialmente para x0 se escoge un valor pequeño de l, i.e. se es conservador con la progresión en la búsqueda. • Si la nueva geometría da energía menor lk =1.2* lk-1 • Si la nueva geometría da energía mayor lk =0.5* lk-1
Conjugate gradient Método más eficiente para converger en el mínimo, pero peor que SD cuando geometría inicial es muy mala En el primer paso se calcula el vector de búsqueda como en SD S,X son vectores
Conjugate gradient(2) En los siguientes pasos el vector de búsqueda se deriva del gradiente según una función que es combinación lineal del gradiente actual y el de la previa iteración Dirección SD etapa k-1 Dirección SD etapa k Peso relativo: S,X son vectores
Aspectos prácticos • En general se combina SD al inicio de la optimización con CG al final. • Métodos como Newton-Raphson solo se emplean muy cerca del mínimo (ej cálculo de frecuencias). • Es conveniente partir de diferentes conformaciones iniciales. • Es necesario verificar que es realmente un mínimo.
Criterios de convergencia • Gradiente total muy pequeño. • Componente mayor del gradiente pequeño. • Diferencia energía entre etapa k y k+1 muy pequeña. • Diferencia de geometría prevista entre paso k y k+1 muy pequeña. • En principio matriz de derivadas segundas con todos los valores propios positivos.
Criterios de convergencia(2) • En cálculos de minimización de geometría de macromoléculas normalmente no se llega a la convergencia total. • En cálculos de minimización de geometría de macromoléculas casi siempre el proceso se queda atrapado en un mínimo local.
Limitaciones de la mecánica molecular • Las propias del uso de un force-field clásico. • No proporciona información dinámica sobre el sistema. • No introduce efectos de temperatura. • Es fácil converger el cálculo en mínimos locales en lugar de en el mínimo absoluto
Clase 5: Algoritmo general de MD Adaptado de J.Phys.Chem. A., 1999, 103,3596 J.A.McCammon & S.Harvey. Dynamics of Proteins and Nucleic Acids. Cambdrige University Press. Cambridge 1991.
Objetivos Dinámica Molecular • Obtener visiones promediadas de un sistema (Boltzman’s sampling). • Obtener muestreo de transiciones temporales. • Estudiar cambios en un sistema inducido por perturbaciones externas • Mejorar geometría de un sistema. • Obtener la termodinámica de un sistema y sus interacciones. • Ayudar en el refinado de estructuras a partir de restricciones X-Ray o NMR.
Dinámica molecular Epot {xi} Fi= -∂Epot/∂xi Trayectoria ai= Fi/mi vi (t+dt)=v(t)i+aidt xi (t+dt)=x(t)i+vidt
Precondiciones del cálculo t=t+Dt/2 • Coordenadas y velocidades de soluto y solvente a t=t-Dt/2 (obtenidas en un paso previo de integración) • Energía cinética a t=t-Dt/2 • Dimensiones de la caja periódica t=t-Dt/2 • Campo de fuerzas, incluidos “restrains” • Definición de las condiciones de simulación (“ensemble”, T,P,...) • Definición de los “constrains” aplicados al sistema • Soluto centrado en el origen de coordenadas
“Ensembles” usuales en Dinámica Molecular • Cálculo libre N,E,V Microcanónico • T constante N,T,V Canónico • P constante N,P,H Isobárico-Isoentálpico • T,P constantes N,P,T Isotérmico-Isobárico
(1) Cálculo de velocidades moleculares (a) y energías cinéticas soluto donde Ma es la masa de la molécula a (ia átomos) Componente de rotación e intra del átomo i de la molécula a. V,v, f, R, r son vectores
(1) Cálculo de velocidades moleculares (a) y energías cinéticas soluto Energía cinética translacional del soluto sx Energía cinética interna y rotacional del solutosx V,v, f, R, r son vectores
(2) Cálculo del centro de masas de cada molécula (a) Centro de masas de la molécula a Posiciones de cada átomo ia relativas al centro de masas. V,v, f, R, r son vectores
(3) Cálculo fuerzas “unconstrained” Donde V es la energía potencial determinada por el force field V,v, f, R, r son vectores
(4) Cálculo del Virial(simulaciones a presión constante) Donde para el cálculo de riajb se aplican condiciones entorno (PBC) y donde no hay contribuciones de términos covalentes (Virial molecular) V,v, f, R, r son vectores
(5) Cálculo de la presión(simulaciones a presión constante) Donde Vbox es el volumen de la caja periódica V,v, f, R, r son vectores
(6) Cálculo de las nuevas velocidades “unconstrained” Etapa 1 V,v, f, R, r son vectores
(7) Escalado de las velocidades (simulaciones a T constante) La ecuación térmica de estado define la Temperatura: V,v, f, R, r son vectores
(7b) Temperatura constante Existen diferentes algoritmos el de Berendsen es el más popular tT tiempo de relajación, T0 T de referencia Se puede tomar b igual para todos los átomos o por grupos V,v, f, R, r son vectores
(8) Determinar nuevas posiciones Si es preciso se aplica SHAKE para forzar los “constrains” V,v, f, R, r son vectores
(9) Determinar velocidades “constrained” Calcular energía cinética de soluto, solvente y total V,v, f, R, r son vectores
(10) Escalado de posiciones y de la caja (simulaciones a P constante) El escalado es molecular, i.e no cambia geometría interna En general se usa el mismo escalado para todos los átomos El escalado puede ser isotrópico mx=my=mz o anisotrópico V,v, f, R, r son vectores
(10b) Escalado de posiciones y de la caja (simulaciones a P constante) Existen diferentes algoritmos el de Berendsen es el más popular tP tiempo de relajación, P0 P de referencia V,v, f, R, r son vectores
(11) Incrementar etapa de integración ,...y repetir todo el proceso hasta que n= número de pasos Dt entre 0.5 y 2 fs, i.e 5x10-16 – 2x10-15 seg. V,v, f, R, r son vectores
Algunas escalas temporales • Vibraciones átomos 10-14 seg. • Stretching global Ac. Nuc. 10-12 seg. • Global twisting Ac. Nuc. 10-12 seg. • Repuckering azucares. 10-10 seg. • Movimiento relativos dominios. 10-9 seg. • Bending global Ac. Nuc. 10-8 seg. • Transiciones alostéricas. 10-3 seg. • Desnaturalizaciones parciales. 10-0 seg.
Modificaciones del algoritmo MD • Introducción de restricciones geométricas • Introducción de fuerzas externas (steered Molecular Dynamics) • Activación de transiciones (Activated Molecular Dynamics) • Introducción de términos stochasticos (Stochastic Molecular Dynamics)
Stochastic MD Se introduce una fuerza externa f ext debida a grados de libertad no considerados explícitamente en la simulación Fuerza promedio externa Fricción Fluctuaciones en el tiempo V,v, f, R, r son vectores
Stochastic MD En lugar de las ecuaciones de Newton se resuelven las ecuaciones de Langevin Fuerza interna (FF) Fricción Fuerza promedio externa Término random V,v, f, R, r son vectores
Condiciones iniciales MD Coordenadas: Experimentales, Modelado, Optimización,... Velocidades: Al azar, pero que en conjunto cumplan: Será necesario equilibrar el sistema V,v, f, R, r son vectores
SET-UP DEL SISTEMA (1) • Construir soluto, asignarle topología y parámetros del force-field. • Rodearlo de solvente (capas, gota, caja) empleando solvente preequilibrado. • Optimizar • Termalizar • Equilibrar
SET-UP DEL SISTEMA (2) • La calidad en la estructura del soluto no está siempre garantizada. • La no-calidad en la representación del solvente esta garantizada. • La optimización, termalización y equilibrado son claves para la calidad de la trayectoria.
SET-UP DEL SISTEMA (3):SOLVENTE • El soluto se introduce en una caja infinita de solvente pre-equilibrado • Se eliminan las moléculas solvente demasiado próximas • Se espera que en la optimización-equilibrado-termalización se equilibrará el solvente. • Problemas muy graves con aguas atrapadas en canales y cavidades introducir aguas cristal, o aguas cMIP, GRID,...
CMIP - Energy evaluation Precalculated potential grids Felec FVdWC FVdwO (…) Protein is mapped in a 3D grid FVdWX
Update Energy grids Protein Energy grids Select E min & add ion to protein cMIP Titration Wat docking Na+ docking Cl- docking
Normal set-up Catalase Thymidine Kinase CMIP-set-up
SET-UP DEL SISTEMA (4)Optimización • Siempre es parcial, combina ciclos de SD y de CG (típicamente 5- 10000 ciclos) • Se suele optimizar por etapas. 1o solvente, 2o soluto, 3o todo junto. • Útil revisar componentes máximos gradiente átomo atrapado
SET-UP DEL SISTEMA (5)Termalización • Las velocidades iniciales se generan a temperatura menor a la de trabajo • Se va incrementando la temperatura típicamente 10 grados x 1-5 ps. • Pueden calentarse independientemente soluto y solvente. • Puede restringirse movimiento del soluto. • Puede iniciarse NVT para acabar NPT. • Muchas variantes dependiendo del sistema