240 likes | 412 Views
RMN de proteinas Ahora mas o menos conocemos las tecnicas que se utilizan en la determinacion de redes de acoples (estructura quimica) y distancias internucleares (estructura 3D, conformacion). Vamos a ver como se utilizan en el estudio de estructura
E N D
RMN de proteinas • Ahora mas o menos conocemos las tecnicas que se utilizan • en la determinacion de redes de acoples (estructura quimica) • y distancias internucleares (estructura 3D, conformacion). • Vamos a ver como se utilizan en el estudio de estructura • 3D y preferencias conformacionales de macromoleculas, en • particular proteinas. Vamos a tratar de cubrir en dos calses • algo para lo que se han escrito muchos libros… • Hay ciertas cosas que tenemos que mencionar antes de • hacer una analisis de las tecnicas de RMN de proteinas: • 1) La informacion que obtenemos no es ni mejor ni peor que • los datos de rayos-X. Nos da una imagen que puede ser • considerada complemetaria a la cristalografica. En ciertos • aspectos experimentales es mas rapido que los rayos-X. • 2) Una de las razones por las cuales es mas rapido es que no • necesitamos cristales. Esto nos da dos ventajas. Primero, • no tenemos que esperar por los cristales, y segundo, pode- • mos hacerlo aunque la muestra no cristalize (esto se da • mucho con peptidos flexibles, oligosacaridos, etc.). • 3) Nos da la estructura 3D en agua, que es el solvente donde • ocurren las reacciones biologicas (las enzimas y las drogas • interactuan en agua). • 4) Nos da informacion sobre la dinamica de la molecula. No • es una imagen estatica.
A A 2 A A A A 1 3 • Breve resumen de estructura de proteinas • Antes de ver como determinamos la estructura 3D de una • proteina por RMN, vamos a repasar un poco de bioquimica… • Las proteinas/peptidos estan armados de 20 aminoacidos. • Esto nos va a hacer la vida mas facil… • La estructura quimica de la proteina es la secuencia de • aminoacidos que la forman. Siempre la escribimos del NH2 • libre al COOH libre: • Esto es la estructura primaria.Vemos claramente que entre • entre cada AA tenemos grupos C=O. Osea, el sistema de • espines de cada AA esta aislado del de los otros. • Por esta razon el espectro 1H de la proteina es, en principio, • una superposicion de los espectros de los AA aislados. Sin • embargo, hay pequeñas desviaciones de corriemientos qui- • micos causadas por una estructura definida, y esto es lo que • nos permite estudiarlas por RMN… Ha residuo H H O O N N N N H O H Ha Ha grupo peptidico
Estructura de proteinas (continuado) • La forma en que los residuos de la proteina se organizan lo- • calmente es la estructura secundaria. Los elementos mas • comunes de estructura secundaria son la a-helice y la hoja • plegada b (paralela o antiparalela): • Otro elemento importante de estructura secundaria es el • bucle b (b-turn), ya que le permite a la cadena cambiar de • direccion:
Las basicas de la RMN de proteinas • La estructura terciaria es como todo se acomoda (o no) en • solucion, o como los distintos elementos de estructura secun- • daria se organizan espacialmente entre ellos. • Lo primero que tenemos que saber es donde aparecen los • picos de los 1Hs de los aminoacidos en el espectro: • Como estan muy cerca unos de otros, despues de 3 o 4 • aminoacidos necesitamos hacer espectroscopia 2D para • poder resolver las señales. • Como dijimos antes, no hay conexion entre los distintos AAs: • No podemos determinar cual es cual. Para poder determinar • la estructura de una proteina por RMN necesitamos saber la • estructura primaria de la proteina. • El primer paso a seguir es asignar todas las señales del • espectro 1H a los protones de todos los aminoacidos de la • proteina. agua Aromaticos Iminas Amidas HCa HCb, g, d, ... 10 9 8 7 6 5 4 3 2 1 0
Asignacion de sistemas de espines • Para hacer esto, nos valemos de los espectros 1H 1D (si es • un peptido), COSY, y TOCSY. Ya hemos visto como un • TOCSY nos permite identificar todo un sistema de espines. • En proteinas, cada aminoacido nos va a dar una linea inde- • pendiente en el TOCSY empezando en el NH y llendo hasta • el ultimo proton de su cadena lateral. • Las unicas excepciones son Phe, Tyr, Trp, e His, donde • el sistema de espines de la cadena lateral esta dividido en • dos por un carbono cuaternario. • Con suerte podemos asignar todas las señales a amino- • acidos, pero lo mas probable es que nos queden algunas sin • asignar porque esten solapadas. Si pasa esto necesitamos • mas dimensiones y/o proteina marcada (mas luego…). • De cualquier manera, una vez que todos los sistemas de • espines estan identificados, tenemos que ‘atarlos’ unos a • otros y determinar su posicion en la estructura primaria. • Tenemos dos formas de hacer esto. Una es el metodo de • asignacion secuencial, y el otro el metodo de cadena • principal. • Los dos metodos se basan en que hay correlaciones NOE • caracteristicas de 1Hs del residuo i a los de residuos (i ± n).
A A 2 A A A A 1 3 • Patrones NOE caracteristicos • Las mas simples de identificar son correlaciones interesi- • duales y secuenciales, que corresponden con NOEs entre • protones de un residuo a protones de residuos (i ± 1): • Aparte de estos, regiones de estructura secundaria definida • van a dar NOE caracteristicos. En -helices y hojas : daa dNN daN Ha H H O O N N N N H O H Ha Ha dNb, dNg, … daa dab, dag, … da(i)N(j) i+4 C N i+3 dab(i, i+3) daN(i, i+3) dNN(i, i+3) daN(i, i+4) i+2 da(i)a(j) N C C N i+1 dN(i)N(j) i N C i-1
Asignacion secuencial • En el metodo de asignacion secuencial tratamos de atar sis- • temas de espines por medio de conectividades NOE secuen- • ciales (de un residuo a residuos i + 1 y/o i - 1). • La idea es elejir un residuo cuyas señales esten bien resuel- • tas en el TOCSY y despues buscar en el NOESY correlacio- • nes NOE secuenciales de sus protones a protones en otros • sistemas de espines. • Estas son generalmente correlaciones dNN, daN, and dbN. En • este momento tambien podemos buscar correlaciones dbd • para establecer la identidad de los residuos aromaticos, Asn, • Arg, Gln, etc… • Despues de encontrar esos, volvemos al TOCSY para identi- • ficar a que residuo corresponden las correlaciones que vimos • en el NOESY. Esos protones van a estar en residuos i ± 1. • Hacemos esto hasta que se nos acaban los residuos (i.e., • hasta que llegamos a una punta de la cadena peptidica), o • hasta que tenemos mucho solapamiento. • Como podemos tener muchos puntos de partida y direccio- • nes, el metodo se ‘valida’ a si mismo automaticamente. • Se han propuesto varios algoritmos para hacer esto de forma • computarizada. Cada uno de estos metodos tiene pros y con- • tras, pero todos requieren de un usuario ‘capaz’…
Asignacion secuencial (continuado) • Esto lo podemos ver en un diagrama simple (no encontre • nada muy lindo entre lo mio…). • Digamos que estamos miarando cuatro lineas en el TOCSY • que corresponden a Ala, Asn, Gly y Leu. Tambien sabemos • que tenemos Ala-Leu-Gly en el peptido, y no en otro orden. • En el TOCSY vemos todos los espines. En el NOESY tene- • mos correlaciones intraresiduales ( ) e interesiduales ( ) • que nos permiten determinar que residuos contiguos en la • cadena peptidica. TOCSY NOESY HC HC Gly Gly Asn Asn Ala Ala NH NH Leu Leu
Metodo de cadena principal • Este metodo fue propuesto por Wüthrich (el abuelo del RMN • de proteinas y ganador del Nobel en Quimica del 2003 por su • trabajo en el area). Ya hemos visto que regiones de estructu- • ra secundaria definidas dan patrones de NOE regulares. • ¿Qut tal si, en vez de hacer la asignacion secuencial y perder • tiempo en regiones que tengan estructura indefinida, nos • concentramos en buscar estos patrones de NOE regulares? • Esto es exactamente lo que hace este metodo. Buscamos • patrones de NOE ciclicos, que se dan generalmente cuando • tenemos estructura secundaria definida. • Cuando encontramos estos patrones de NOE, tratamos de • correlacionarlos con fragmentos de la estructura primaria de • la proteina/peptido.Es ideal para hacer por computadora: • -El programa primero busca a-helices (busca correlaciones • dab(i, i+3), daN(i, i+3), dNN(i, i+3), daN(i, i+4), etc…). • - Despues que elimina todos los picos correspondienes a • helices, busca hojas (regiones en que las conectividades • son de cosas que estan alejadas una de otra en la estructu- • ra primaria). • - Despues de eliminar estos, busca bucles y regiones de es- • tructura indefinida.
Estructura secundaria y terciaria • A pesar de que el metodo de cadena principal encuentra • patrones de estructura secundaria, el fin es identificar los • residuos en el espectro (i.e., asignar sistemas de espines). • Todavia hay que buscar la estructura secundaria/terciaria. • Si usamos el metodo de cadena principal, ya tenemos casi • todo el trabajo hecho (casi el 90 %), porque las regiones de • estructura secundaria definida (a-helices, hojasb) ya las • tenemos identificados. • Si usamos el metodo secuencial tenemos casi todos los NOE • entre el residuo i e i + 1 y i - 1, o de rango corto. Solo nos • queda buscar correlaciones NOE de rango medio (i + 2, 3, • y 4) y de rango largo (> i + 5). • La cantidad y tipo de NOEs de rango largo obviamente de- • pendera de la estructura secundaria/terciaria del peptido. • Estos NOEs son agrupados en tablas. Se les asigna un valor • dependiendo de la intensidad de la correlacion (i.e., el volu- • men del cross-peak) usando una referencia interna de inten- • sidad, como ser un NOE entre 1Hs del CH2 de una Phe). • Como en las macromoleculas podemos tener distintos pro- • cesos de relajacion compitiendo, los NOEs no tienen un valor • unico. Generalmente los agrupamos como fuertes, medios, • y debiles. • Luego vamos a ver como los convertimos a ‘distancias’ ...
Lo que el NOE nos dice y lo que no nos dice • Ahora tenemos casi todo: Los sistemas de espines identifi- • cados, sus NOEs secuenciales, medios, y largos medidos, y • sus intensidades tabuladas. • A esta altura vamos a tener algunos conflictos en las asig- • naciones. En particular, hay casos en los cuales vamos a ver • ciertos NOE pero no otros que ‘tendrian’ que estar alli… • Esto es debido a que los NOE no solo dependen de la dis- • tancia entre dos protones, pero tambien de la dinamica entre • ellos (osea, el grado de movimiento de uno con respecto al • otro). Esto va a ser importante en peptidos chicos, porque en • estos casos tenemos mucha movilidad en las cadenas late- • rales y en el esqueleto peptidico. • Lo mas importante a tener en cuenta siempre es que no ver • un NOE no significa que dos protones esten a mas de 5 Å. • A su vez, un NOE puede surgir de un promedio de confor- • meros del peptido. Podemos ver algo como NOE medio (1.8 • a 3.3 Å), cuando en realidad es una mezcla de NOE fuerte • (1.8 a 2.7 Å) y ausencia de correlacion: Aparente: Real: dij ~ 3 Å dij < 3 Å dij > 6 Å
Acoples y angulos diedros • Hasta ahora hemos visto como usar algunos datos de RMN • para obtener parametros estructurales usados en la determi- • nacion de estructuras 3D de macromoleculas en solucion. • En particular, los NOE nos permiten determinar distancias • aproximadas entre protones cercanos. Son muy utiles si los • vemos entre protones que estan en residuos que esten dis- • tantes uno de otro en la estructura primaria. • Sin embargo, los NOE no nos permiten, en general, decir na- • da acerca de la conformacion de enlaces con libre rotacion. • Para determinar esto podemos usar acoples 3J que se obser- • van en peptidos (o azucares, ADN, y ARN). Se pueden usar • acoples 3J/2J homo/heteronucleares, pero nos vamos a con- • centrar en el acople 3J homonuclear. • Estos incluyen 3JNa, que nos da informacion acerca de la • conformacion del esqueleto peptidico (), y 3Jab, que esta re- • lacionado con la conformacion de la cadena lateral (c): H O f w N 3JNa f 3Jab c c N y Hb Ha H Hb AA
Acoples y angulos diedros (continuado) • Como vimos, la constante de acoplamiento 3J esta relacio- • nada con el angulo diedro por la ecuacion de Karplus. • Como vimos antes, la ecuacion es una suma de cosenos, y • dependiendo de la topologia (H-N-C-H or H-C-C-H) tenemos • distintos parametros: • Los parametros han sido derivados de moleculas rigidas y • datos de rayos-X. Graficamente: 3JNa = 9.4 cos2( f - 60 ) - 1.1 cos( f - 60 ) + 0.4 3Jab = 9.5 cos2( y - 60 ) - 1.6 cos( y - 60 ) + 1.8 3J (Hz) f - 60
Acoples y angulos diedros (…) • ¿Como medimos las 3J? Si tenemos pocos aminoacidos, • directamente del 1D. Tambien las podemos medir de espe- • ctros HOMO2DJ, o de espectros tipo COSY de alta resolu- • cion (MQF-COSY y E-COSY). • El problema mas grande de la ecuacion de Karplus es que • introduce ambiguedades. Si tenemos acoples 3JNa menores • de 4 Hz y los pongo en la grafica vemos que podemos tener • hasta 4 valores posibles para el angulo f: • En estos casos podemos hacer dos cosas. Una es tratar de • determinar la estructura usando solo NOEs y despues confir- • mar lo que nos da con los acoples J. Esto anda bien, pero • estamos ‘tirando’ informacion util… 9.4 5.0 ~ -60 ~0 ~110 ~170 4.0 0.0 f - 60
Acoples y angulos diedros (…) • Otra cosa que se puede hacer es usar solo los angulos que • son mas comunes que conocemos de estructuras de • rayos-X. Para f, los angulos ‘estandar’ tienen valores ne- • gativos de ~ -60 y ~ -170). Usando rangos: • Para las cadenas laterales tenemos also similar, pero en este • caso hay que elegir entre tres posibles rotameros (como en • etano…). Como se pueden medir dos acoples 3Jab (hay 2 • protones b), nos permiten elegir el conformero adecuado: 3JNa < 5 Hz -80 < f < -40 3JNa > 8 Hz -150 < f < 170 (-190) N N N Hb1 Hb2 Hb2 Cg Cg Hb1 C’ C’ Ha Ha C’ Ha Hb1 Cg Hb2 3Jab1~ 3Jab2 < 5 3Jab1< 5 (o vice versa) 3Jab2> 8
Introduccion al modelado molecular • Ahora tenemos casi toda la informacion estructural que pode- • mos sacar por RMN de nuestra muestra: tablas de NOEs con • distintas intensidades (distancias), constantes de acople 3J, y • rangos de angulos derivados de los acoples 3J. • Tenemos que ver como usar toda esta informacion para ob- • tener una ‘imagen’ de la molecula en solucion. • Contrario a los rayos-X, con los que ‘vemos’ la densidad • electronica de la molecula y pueden ser considerados como • un metodo directo, con RMN solo obtenemos informacion in- • directa acerca de la estructura, y esta informacion la dan • unos pocos atomos (basicamente los 1Hs…). • Por lo tanto nos valemos de un modelo teorico para repre- • sentar a la macromolecula. En general, esto es un modelo • molecular generado por computadora. • Este puede tener distintos grados de complejidad: • - ab initio: Solo considera orbitales atomicos/moleculares • y resolvemos la ecuacion de Schröedinger. No necesita pa- • rametros. Computacionalemte caro (10 - 100 atomos). • - Semiempirico: Usamos algunos parametros para represen- • tar a los orbitales atomicos/moleculares (100 - 500 atomos). • - Mecanica Molecular: Usamos un potencial parametrizado • simple tipo masa-y-resorte (todo lo demas…).
Modelado molecular (continuado) • Aca estamos lidiando con proteinas (miles de atomos), osea • que usamos mecanica molecular (MM). • El corazon de la MM es el campo de fuerza (force field) o • las ecuaciones que describen la energia del sistema en fun- • cion de las coordenadas xyz. En general es una suma de • distintos terminos de energia: • Cada termino depende de una forma u otra con la geometria • del sistema. Por ejemplo, Een, o potencial de enlace del sis- • tema (bond stretching), es: • Las distintas constantes (Kbs, ro, etc., etc.) son los parame- • tros del campo de fuerza, y se obtienen a partir de datos ex- • perimentales (rayos-X, microondas) o calculos a alto nivel de • teoria (ab initio o semiempiricos). • Distintos campos de fuerza incluyen distintos terminos, y • necesitamos uno que tenga aquellos que representen bien • a nuestro sistema (proteinas). Etotal = EvdW + Een + Ean + Etor + Eelec + … Een = Si Keni * ( ri - roi )2
Incorporacion de datos de RMN • Lo bueno de los campos de fuerza para MM es que si tene- • mos una funcion que relacione nuestros datos experimenta- • les con las coordenadas xyz la podemos sumar directamen- • te a la ecuacion del potencial total del sistema. • Esto es lo que hacemos con los datos derivados de RMN. • Para NOEs usamos rangos de distancias en vez de valores • unicos porque podemos tener otros fenomenos de relajacion • en juego, y/o promediado de NOEs: • La funcion de energia potencial relacionada con estos rangos • es una funcion cuadratica de base plana: • Cuanto mas lejos este la distancia calculada en el modelo te- • orico (rcalc) del rango determinado experimentalmente, mas • grande la penalizacion. Estas son restricciones de NOE. NOE fuerte 1.8 - 2.7 Å NOE medio 1.8 - 3.3 Å NOE debil 1.8 - 5.0 Å ENOE = KNOE * ( rcalc - rmax)2 si rcalc > rmax ENOE = 0 si rmax> rcalc > rmin ENOE = KNOE * ( rmin - rcalc )2 si rcalc < rmin
Incorporacion de datos de RMN (continuado) • De manera similar podemos incluir restricciones en el rango • de angulos o constantes de acoplamiento: • Graficamente, las funciones tienen este aspecto: EJ = KJ * ( Jcalc - Jmax)2 si Jcalc > Jmax EJ = 0 si Jmax> Jcalc > Jmin EJ = KJ * (Jcalc - Jmin )2 si Jcalc < Jmin E 0 rmax fmax Jmax rmin fmin Jmin Rcalc, fcalc, o Jcalc
Optimizacion de estructuras • Ahora tenemos todas las funciones incluidas en el potencial • de la molecula, incluyendo interacciones covalentes (enlace, • angulos, y torsiones), no covalentes (vdW, electroestatica), y • restricciones NOE y 3J derivadas de RMN. • Para obtener un modelo estructural del peptido decente hay • que minimizar la energia del sistema, lo que implica encon- • trar un conforermo de baja energia (o el de mas baja energia) • o una familia de conformeros de baja energia. • En una funcion con la cantidad de variables que tenemos • en un peptido esto es laborioso, porque tenemos una super- • ficie de n dimensiones (cada uno de las variables que esta- • mos optimizando). Para y en un disacarido: • Tenemos picos (maximos) y valles (minimos) de energia. E (Kcal/mol) y f
Optimizacion de estructuras (continuado) • Minimizar la funcion implica ‘bajar’ en la (hiper)superficie • de energia de la molecula. Para esto neceitamos calcular • las derivadas CRA xyz (las variables) de todos los atomos: • Esto nos permite ver como vamos ‘para abajo’ para todas • las variables, y por lo tanto determinar que direccion hay • que tomar para minimizar la energia del sistema. • La minimizacion solo ‘baja.’ Podemos tener muchos minimos • locales en la superficie, y si solo usamos minimizaciones el • sistema puede quedar atrapado en uno de estos. Esto es lo • que sucede en proteinas, donde tenemos cientos de grados • de libertad (considerando solo enlaces con libre rotacion…). • En estos casos necesitamos otros metodos para encontrar • el minimo de energia. Uno de estos metodos es la dinamica • molecular (DM). • Como tenemos la funcion potencial del sistema, le podemos • dar energia (por ejemplo, ‘elevar’ la temperatura) y ver como • evoluciona. Un aumento de temperatura implica mas energia • cinetica y la posibilidad de superar barreras energeticas. Etotal Etotal > 0 Etotal < 0 Etotal xyz xyz
Dinamica molecular y enfriamineto simulado • En las DMs ‘calentamos’ el sistema a una temperatura fisica- • mente ‘razonable,’ ~ 300 K. La energia por mol a esta tempe- • ratura es ~RT, dondeRes la constante de Boltzmann (por • mol). Si hacemos los numeros, esto es ~ 0.5 Kcal/mol. • Esto puede ser suficiente para ciertas barreras, pero no para • otras que seguramente vamos a tener en el sistema. Para • estos casos necesitamos un metodo de busqueda conforma- • cional mas drastico, como ser el templado simulado. • ‘Calentamos’ el sistema a temperaturas ridiculamente altas • (2000 K), y despues lo dejamos enfriar lentamente. La idea • es que este proceso permite que el sistema pase por barre- • ras energeticas considerables, y al enfriarse produzca con- • formeros estables y de baja energia. Conformeros ‘calientes’ Conformeros ‘frios’ T Tiempo (generalmente ps)
Geometria de distancia • Otro metodo compleatmente diferente a la DM y al TS es la • geometria de distancias. Vamos a presentar solo lo que • nos da pero no como funciona. • Basicamente, randomizamos las coordenadas xyz de los • atomos del peptido dandoles limites altos y bajos por fuera • de los cuales los atomos no pueden estar. Aca incluimos los • enlaces y las restricciones de RMN. • Esto nos da una matriz de distancias limite, que es optimi- • zada por medio de un algoritmo SIMPLEX (desigualdades de • trinagulos), lo que se conoce como suavizado de la matriz. • Las estructuras que salen de esto no estan optimizadas, y • generalmente las mejoramos por DM y/o minimizacion. • Este esquema da un resumen de como los distintos metodos • hacen que la estructura se mueva en la superficie de energia • potencial del sistema: ME DM TS GD
Presentacion de resultados • La idea es samplear el espacio conformacional al que la • proteina tiene acceso bajo los efectos de las restricciones • estructurales que obtuvimos de los NOE y los acoples. • Las estructuras que obtenemos por estos metodos que no • muestren violaciones grandes de las restricciones que inclu- • imos se dicen ser consistentes con los datos de RMN. • Como ninguna de estas estructuras se puede descartar, lo • que hacemos es presentarlas como un set de estructuras de • baja energia superimpuestas en las regiones mas rigidas: • En esta solo mostramos los atomos pesados del esqueleto • peptidico. A pesar de que no lo buscamos, la flexibilidad de • ciertas regiones indica una falta de restricciones NOE, y • refleja que esa parte de la molecula es flexible en solucion. N-termini C-termini