640 likes | 778 Views
M.Orozco J.L.Gelpí M.Rueda J.R.Blas. Clase 2: Introducción a la Dinámica Molecular. The long range goal of molecular approaches to biology is to describe living systems in terms of chemistry and physics. Prof. Dirac. Proc.Roy.Soc., 123 , 714 (1929). Dinámica molecular.
E N D
M.Orozco J.L.Gelpí M.Rueda J.R.Blas
The long range goal of molecular approaches to biology is to describe living systems in terms of chemistry and physics Prof. Dirac. Proc.Roy.Soc., 123, 714 (1929)
Dinámica molecular • Técnica para obtener una visión en el tiempo de un sistema molecular. • Permite seguir sistemas que evolucionan en el tiempo (transiciones) • Permite guiar sistemas a zonas de energía óptima • Permite obtener visiones promediadas de sistemas en equilibrio: Promedios de Boltzman (< >)
Técnica para muestrear espacio conformacional en zonas delimitadas Técnica para representar interacciones moleculares Herramienta para seguir transiciones conformacionales. Técnica que permite analizar el efecto de perturbaciones en el sistema Una caja negra Una técnica que permite encontrar transiciones dramáticas Una técnica competitiva con NMR o X-Ray en resolución de estructura Una herramienta de uso universal Que es la dinámica molecular
No olvidar! • Experimento mal No hay resultado • Experimento correcto Resultado correcto • Cálculo MD mal Hay resultado! • Cálculo MD mal Resultado incorrecto • Cálculo MD correcto ?
Apuntes históricos Isaac Newton desarrolló el esqueleto formal de la dinámica molecular siglo XVIII
Apuntes históricos (2) • Primer intento de trayectoria H+H2H2+H: Hirschfelder 1936.(J.A. Hirschfelder, H.Eyring and B.Topley. J.Chem.Phys, 4, 170 (1936)). • Trayectoria líquidos ideales Alder & Wainright 1959. (B.J.Alder and T.E.Wainwright, J.Chem.Phys, 31, 459 (1959)). • Trayectoria argón liquida Rahman 1964. (A.Rahman, Phys.Rev., A136, 405 (1964)). • Trayectoria agua líquida Stillinger & Rahman 1974.(F.H.Stillinger and A.Rahman, J.Chem.Phys., 60,1545 (1974). • Trayectoria de la primera proteína (10 ps BPTI).McCammon & Karplus 1977.(J.A.McCammon, B.R.Gelin and M.Karplus, Nature, 267, 585 (1976))
Apuntes históricos (3) • Van Gunsteren & Berendsen introducen constrains en dinámica proteínas (BPTI) 1977.(W.F.van Gunsteren, and H.J.C.Hermans, Molecular Physics, 34, 1311 (1977)). • Introducción del efecto del entorno van Gunsteren (20 ps BPTI)1983. (W.F.van Gunsteren, H.J.C.Berendsen, J.Hermans and W.G.J. Postma PNAS, 80, 4315 (1983)). • Desarrollo de los primeros programas de MD (CHARMM, GROMOS) 1976-1978. • Berendsen desarrolla métodos para mantener P y T constante 1984.(H.J.C.Berendsen, J.P.M.Postma and W.F.van Gunsteren, J.Chem.Phys., 81,3684 (1984). • Primer cálculo MD/FEP. McCammon 1985.(T.P.Lybrand, I.Ghosh and J.A.McCammon, J.Am.Chem.Soc, 107, 7793 (1985))
Dinámica molecular • Su base física es la dinámica de Newton en cualquiera de sus formulaciones.
El Hamiltoniano(La función de energía potencial V) • Puramente cuántico: • H(x)= H(R,r) • Los electrones están en equilibrio. Solo se integra explícitamente el movimiento de núcleos (BO). • Se integran los movimientos de núcleos y electrones.
Dinámica de Carr-Parrinello • Se integra el movimiento de núcleos y de “orbitales”. • Funciona con “ondas planas”. • Permite estudiar sistemas reactivos, efectos de transferencia de carga, conductividad,... • Simulan procesos en escalas del picosegundo • Su uso en biología es restringido. Acc. Chem. Res., 35, 455, 2002
El Hamiltoniano: • Mixto QM/MM: • H(x)= H(Rext,r) + H(Rext)+ HQM/MM(Rint,Rext) • Se integran los movimientos de núcleos. • Los electrones están en equilibrio. Solo se integra el movimiento de núcleos (BO).
Métodos QM/MM • Se acoplan a cálculos de MD o métodos de Monte Carlo. • Permiten estudiar reactividad en macromoléculas donde se pueda trazar la frontera entre la parte clásica y la cuántica. • Han tenido un uso moderado: • La partición QM/MM no es siempre fácil • Lentos • El cálculo QM de referencia es bajo y a menudo requiere reparametrización • El acoplamiento QM/MM no es trivial
El Hamiltoniano: • Clásico: • H(x)= H(R) • Solo se integran los movimientos nucleares. • Los electrones están en equilibrio y su efecto sobre el sistema se introduce paramétricamente: Force-Field
La MD permite a priori simular cualquier sistema de impacto biológico, aún los no descritos estructuralmente e inabordables por cualquier otra técnica (teórica o experimental)
La mayoría de los datos que se obtienen en proyectos de genómica y proteómica se realizan en medios muy diferentes de los fisiológicos Tienen estos resultados valor?
MS-ELECTROSPRAY Determination of mass for large macromolecules with high accuracy Does it provide structural information?
“Although DNA duplex ions have been observed for seven years, the nature of interaction between strands in the gas phase remains a major unanswered question” S.A.Hofstadler and R.H. Griffey Chem. Rev. 101, 377 (2001)
16-mer LC 298 16-mer LC 448 12-mer LC 298 12-mer LC 448 16-mer water 12-mer water 16-mer DC 298 16-mer DC 448 12-mer DC 298 12-mer DC 448
El force-field clásico está limitado a estudiar cambios conformacionales e interacciones débiles. • Típicamente la información estructural de partida debe ser de alta calidad. • El sistema de simulación se suele limitar a unos miles o decenas de miles de átomos. • Escala de simulación limitada (state of the art 10 ns, sistemas modelos hasta 1 ms). Ello conduce a problemas de muestreos insuficientes. • El cálculo inunda de información difícil de desencriptar (data mining).
E(stab) DNA pairs Hobza et al., JCC,18,1136, 1997
Mejorar general de la capacidad de muestreo • Aumento de temperatura • Suavización del force-field • Introducir “penalizaciones de visita” • Van Gunsteren J.Comput., 8, 695, 1994 • Parrinello PNAS, 99, 12562, 2002 • Cálculos paralelos (M ns n·m ns) • Pande JMB., 323, 927, 2002
Mejorar de la capacidad de muestreo en una dirección • Modificación función potencial. Brooks, Ann.Rev. Phys.Chem., 52, 499, 2001. • Multiple-copies. LES Elber & Karplus JACS, 112, 9161, 1990 • Método intercambio de réplicas a distintas temperaturas. Berne PNAS, 98, 14931, 2001. • Sesgo por replica seleccionada (M-evil) • Introducción de fuerzas (steered-MD), simulando experimento AFM. Schulten PNAS, 99, 1351, 1999. Karplus PNAS, 97, 6521, 1997.
CÁLCULO DE ENERGÍA LIBRE • Una trayectoria de equilibrio permite calcular • Alternativamente la Mec. Estadística nos dice:
PROBLEMAS CALCULO DG DIRECTO • Aunque en algún caso es aplicable en general es difícil • Problemas para tener muestreo simultáneo de los dos estados A y B • Problemas para construir la función partición global para A y B. • Es necesario sesgar la trayectoria para mejorar el muestreo y buscar fórmulas alternativas:
OTRAS TÉCNICAS RELACIONADAS • Umbrella sampling. Torrie&Valleau J.Comp.Phys., 23, 187, 1977 • Adaptative umbrella sampling. Karplus & cow. J.Chem.Phys., 111, 8048, 1999. • Weigthed hystogram analysis (WHAM). Rosenberg J.Comp.Chem., 13, 1011, 1992.
ALGUNAS IDEAS RECIENTES • Steered-MD acoplada a cálculos energía libre. • Hummer-Szabo PNAS, 98, 3658, 2001. (EFM) • Schulten Science, 296, 525, 2002. • Método de penalizaciones de visita acoplado a cálculos de energía libre • Laio-Parrinello. PNAS, 99, 12562, 2002
Mejorar la velocidad de cálculo • Uno de los cambios mayores en la aplicación útil de la MD va a venir de la mejora en los ordenadores: • Procesadores más rápidos • Procesadores dirigidos únicamente a MD • Mejora en los algoritmos de paralelización • Aumento capacidad de almacenamiento
En nuestra experiencia,... • EnTirado et al., Biochemistry, 36,7313, 1997presentamos trayectorias de 2 ns de una proteína < 100 residuos. En nuestra mejor máquina recogíamos 5 ps x día. • En Cubero et al.,JACS,121, 8653, 1999 presentamos 1 trayectoria de 5 ns de un 12-mer (PME). En nuestra mejor máquina recogíamos 25 ps x día. • Nuestro standard actual de trabajo son 2-6 simulaciones de 10-15 ns sobre DNAs o proteínas (PME). En nuestra mejor máquina recogemos > 100 ps x día. • Nuestras máquinas más rápidas eran WS (10M<precio<5M), ahora son AMD(2 GHz) (0.5M<precio<0.3M).
90’s 100 ps 95’s 500 ps -1 ns 02’s 10-25 ns 00’s 5 ns 05’s 100 ns – 1 ms
Almacenamiento • Las trayectorias generan una gran cantidad de datos, pero la densidad de información es pobre: • Problemas de disco. • El coste de los post-análisis puede ser mayor que el costo de la simulación. • El “data minning” es muy complejo.
EL PROBLEMA DEL ANÁLISIS DE LAS TRAYECTORIAS Buscar una aguja en billón de pajares
Análisis de las trayectorias • Geometría/conformación • Determinación pautas de interacción con solvente. • Energética del sistema • Cálculos de energía libre • Cálculos de flexibilidad y entropía
Análisis de las trayectorias • Datos de geometría del sistema. • RMS, Rg, size-descriptors, Y, F,..., secondary structure, helical analysis, interaction maps, H-bond population,... • Datos interacción sistema-solvente. • Solvent maps, rdf, solvent-population,...
Surco reactivo Shields et al., JACS, 119, 7463, 1997
SOLVATION MAPS 5'-CCAA(G·C)CTTGG-3' 5'-CCAA(G·T)CTTGG-3’ 5'-CCAA(O·C)CTTGG-3' 5'-CCAA(O·T)CTTGG-3' Hernández et al., NAR 28, 4873, 2000.
Analysis of the trajectories • Flexibility • Principal component analysis Essential dynamics (Berendsen) • Comparison of frequencies • Comparison of eigenvalues • Entropy calculations Karplus-van Gunsteren • Schlitter’s method (van Gunsteren) • Extrapolation to infinite (Laughton-Orozco)
Principal component analysis(PCA) Trayectoria Matriz covarianza Diagonalización Val. propios frecuencias Vect. propios Nat. movimiento
Comparación de eigenvectors: Para un conjunto: Medida relativa: 5’GATTAATTAATTAATC3’ 0.94 0.77 2.72 0.72 5’GATTAATTAATTAATC3’ 0.30 0.51 0.85 0.62 0.81 0.81 0.14 g =2.72/5= 0.54 2.72
Entropías configuracionales • Karplus: • S = 0.5 k ln(det s) • s: covariance matrix of set of “important” coordinates • Schlitter: • S = 0.5 kS ln[1 + (kTe2/h2) <qi2>] • <qi2>: eigenvalues of diagonalized mass-weighted cartesian coordinate covariance matrix
775 l o 750 M l Free a 725 C K 1 : 1 Complex 700 y p 2 : 1 Complex 675 o r t n 650 E 625 1000 2000 3000 4000 Length of Sampling Window ps Entropías configuracionales • Los valores de S calculados son sensibles al tiempo de simulación • Ajuste de una función 1/x para estimar S para una simulación infinitaS=So-a/tb(Harris et al., 2001)