RMN de proteinas Ahora mas o menos conocemos las tecnicas que se utilizan

RMN de proteinas • Ahora mas o menos conocemos las tecnicas que se utilizan • en la determinacion de redes de acoples (estructura quimica) • y distancias internucleares (estructura 3D, conformacion). • Vamos a ver como se utilizan en el estudio de estructura • 3D y preferencias conformacionales de macromoleculas, en • particular proteinas. Vamos a tratar de cubrir en dos calses • algo para lo que se han escrito muchos libros… • Hay ciertas cosas que tenemos que mencionar antes de • hacer una analisis de las tecnicas de RMN de proteinas: • 1) La informacion que obtenemos no es ni mejor ni peor que • los datos de rayos-X. Nos da una imagen que puede ser • considerada complemetaria a la cristalografica. En ciertos • aspectos experimentales es mas rapido que los rayos-X. • 2) Una de las razones por las cuales es mas rapido es que no • necesitamos cristales. Esto nos da dos ventajas. Primero, • no tenemos que esperar por los cristales, y segundo, pode- • mos hacerlo aunque la muestra no cristalize (esto se da • mucho con peptidos flexibles, oligosacaridos, etc.). • 3) Nos da la estructura 3D en agua, que es el solvente donde • ocurren las reacciones biologicas (las enzimas y las drogas • interactuan en agua). • 4) Nos da informacion sobre la dinamica de la molecula. No • es una imagen estatica.

A A 2 A A A A 1 3 • Breve resumen de estructura de proteinas • Antes de ver como determinamos la estructura 3D de una • proteina por RMN, vamos a repasar un poco de bioquimica… • Las proteinas/peptidos estan armados de 20 aminoacidos. • Esto nos va a hacer la vida mas facil… • La estructura quimica de la proteina es la secuencia de • aminoacidos que la forman. Siempre la escribimos del NH2 • libre al COOH libre: • Esto es la estructura primaria.Vemos claramente que entre • entre cada AA tenemos grupos C=O. Osea, el sistema de • espines de cada AA esta aislado del de los otros. • Por esta razon el espectro 1H de la proteina es, en principio, • una superposicion de los espectros de los AA aislados. Sin • embargo, hay pequeñas desviaciones de corriemientos qui- • micos causadas por una estructura definida, y esto es lo que • nos permite estudiarlas por RMN… Ha residuo H H O O N N N N H O H Ha Ha grupo peptidico

Estructura de proteinas (continuado) • La forma en que los residuos de la proteina se organizan lo- • calmente es la estructura secundaria. Los elementos mas • comunes de estructura secundaria son la a-helice y la hoja • plegada b (paralela o antiparalela): • Otro elemento importante de estructura secundaria es el • bucle b (b-turn), ya que le permite a la cadena cambiar de • direccion:

Las basicas de la RMN de proteinas • La estructura terciaria es como todo se acomoda (o no) en • solucion, o como los distintos elementos de estructura secun- • daria se organizan espacialmente entre ellos. • Lo primero que tenemos que saber es donde aparecen los • picos de los 1Hs de los aminoacidos en el espectro: • Como estan muy cerca unos de otros, despues de 3 o 4 • aminoacidos necesitamos hacer espectroscopia 2D para • poder resolver las señales. • Como dijimos antes, no hay conexion entre los distintos AAs: • No podemos determinar cual es cual. Para poder determinar • la estructura de una proteina por RMN necesitamos saber la • estructura primaria de la proteina. • El primer paso a seguir es asignar todas las señales del • espectro 1H a los protones de todos los aminoacidos de la • proteina. agua Aromaticos Iminas Amidas HCa HCb, g, d, ... 10 9 8 7 6 5 4 3 2 1 0

Asignacion de sistemas de espines • Para hacer esto, nos valemos de los espectros 1H 1D (si es • un peptido), COSY, y TOCSY. Ya hemos visto como un • TOCSY nos permite identificar todo un sistema de espines. • En proteinas, cada aminoacido nos va a dar una linea inde- • pendiente en el TOCSY empezando en el NH y llendo hasta • el ultimo proton de su cadena lateral. • Las unicas excepciones son Phe, Tyr, Trp, e His, donde • el sistema de espines de la cadena lateral esta dividido en • dos por un carbono cuaternario. • Con suerte podemos asignar todas las señales a amino- • acidos, pero lo mas probable es que nos queden algunas sin • asignar porque esten solapadas. Si pasa esto necesitamos • mas dimensiones y/o proteina marcada (mas luego…). • De cualquier manera, una vez que todos los sistemas de • espines estan identificados, tenemos que ‘atarlos’ unos a • otros y determinar su posicion en la estructura primaria. • Tenemos dos formas de hacer esto. Una es el metodo de • asignacion secuencial, y el otro el metodo de cadena • principal. • Los dos metodos se basan en que hay correlaciones NOE • caracteristicas de 1Hs del residuo i a los de residuos (i ± n).

A A 2 A A A A 1 3 • Patrones NOE caracteristicos • Las mas simples de identificar son correlaciones interesi- • duales y secuenciales, que corresponden con NOEs entre • protones de un residuo a protones de residuos (i ± 1): • Aparte de estos, regiones de estructura secundaria definida • van a dar NOE caracteristicos. En -helices y hojas : daa dNN daN Ha H H O O N N N N H O H Ha Ha dNb, dNg, … daa dab, dag, … da(i)N(j) i+4 C N i+3 dab(i, i+3) daN(i, i+3) dNN(i, i+3) daN(i, i+4) i+2 da(i)a(j) N C C N i+1 dN(i)N(j) i N C i-1

Asignacion secuencial • En el metodo de asignacion secuencial tratamos de atar sis- • temas de espines por medio de conectividades NOE secuen- • ciales (de un residuo a residuos i + 1 y/o i - 1). • La idea es elejir un residuo cuyas señales esten bien resuel- • tas en el TOCSY y despues buscar en el NOESY correlacio- • nes NOE secuenciales de sus protones a protones en otros • sistemas de espines. • Estas son generalmente correlaciones dNN, daN, and dbN. En • este momento tambien podemos buscar correlaciones dbd • para establecer la identidad de los residuos aromaticos, Asn, • Arg, Gln, etc… • Despues de encontrar esos, volvemos al TOCSY para identi- • ficar a que residuo corresponden las correlaciones que vimos • en el NOESY. Esos protones van a estar en residuos i ± 1. • Hacemos esto hasta que se nos acaban los residuos (i.e., • hasta que llegamos a una punta de la cadena peptidica), o • hasta que tenemos mucho solapamiento. • Como podemos tener muchos puntos de partida y direccio- • nes, el metodo se ‘valida’ a si mismo automaticamente. • Se han propuesto varios algoritmos para hacer esto de forma • computarizada. Cada uno de estos metodos tiene pros y con- • tras, pero todos requieren de un usuario ‘capaz’…

Asignacion secuencial (continuado) • Esto lo podemos ver en un diagrama simple (no encontre • nada muy lindo entre lo mio…). • Digamos que estamos miarando cuatro lineas en el TOCSY • que corresponden a Ala, Asn, Gly y Leu. Tambien sabemos • que tenemos Ala-Leu-Gly en el peptido, y no en otro orden. • En el TOCSY vemos todos los espines. En el NOESY tene- • mos correlaciones intraresiduales ( ) e interesiduales ( ) • que nos permiten determinar que residuos contiguos en la • cadena peptidica. TOCSY NOESY HC HC Gly Gly Asn Asn Ala Ala NH NH Leu Leu

Metodo de cadena principal • Este metodo fue propuesto por Wüthrich (el abuelo del RMN • de proteinas y ganador del Nobel en Quimica del 2003 por su • trabajo en el area). Ya hemos visto que regiones de estructu- • ra secundaria definidas dan patrones de NOE regulares. • ¿Qut tal si, en vez de hacer la asignacion secuencial y perder • tiempo en regiones que tengan estructura indefinida, nos • concentramos en buscar estos patrones de NOE regulares? • Esto es exactamente lo que hace este metodo. Buscamos • patrones de NOE ciclicos, que se dan generalmente cuando • tenemos estructura secundaria definida. • Cuando encontramos estos patrones de NOE, tratamos de • correlacionarlos con fragmentos de la estructura primaria de • la proteina/peptido.Es ideal para hacer por computadora: • -El programa primero busca a-helices (busca correlaciones • dab(i, i+3), daN(i, i+3), dNN(i, i+3), daN(i, i+4), etc…). • - Despues que elimina todos los picos correspondienes a • helices, busca hojas (regiones en que las conectividades • son de cosas que estan alejadas una de otra en la estructu- • ra primaria). • - Despues de eliminar estos, busca bucles y regiones de es- • tructura indefinida.

Estructura secundaria y terciaria • A pesar de que el metodo de cadena principal encuentra • patrones de estructura secundaria, el fin es identificar los • residuos en el espectro (i.e., asignar sistemas de espines). • Todavia hay que buscar la estructura secundaria/terciaria. • Si usamos el metodo de cadena principal, ya tenemos casi • todo el trabajo hecho (casi el 90 %), porque las regiones de • estructura secundaria definida (a-helices, hojasb) ya las • tenemos identificados. • Si usamos el metodo secuencial tenemos casi todos los NOE • entre el residuo i e i + 1 y i - 1, o de rango corto. Solo nos • queda buscar correlaciones NOE de rango medio (i + 2, 3, • y 4) y de rango largo (> i + 5). • La cantidad y tipo de NOEs de rango largo obviamente de- • pendera de la estructura secundaria/terciaria del peptido. • Estos NOEs son agrupados en tablas. Se les asigna un valor • dependiendo de la intensidad de la correlacion (i.e., el volu- • men del cross-peak) usando una referencia interna de inten- • sidad, como ser un NOE entre 1Hs del CH2 de una Phe). • Como en las macromoleculas podemos tener distintos pro- • cesos de relajacion compitiendo, los NOEs no tienen un valor • unico. Generalmente los agrupamos como fuertes, medios, • y debiles. • Luego vamos a ver como los convertimos a ‘distancias’ ...

Lo que el NOE nos dice y lo que no nos dice • Ahora tenemos casi todo: Los sistemas de espines identifi- • cados, sus NOEs secuenciales, medios, y largos medidos, y • sus intensidades tabuladas. • A esta altura vamos a tener algunos conflictos en las asig- • naciones. En particular, hay casos en los cuales vamos a ver • ciertos NOE pero no otros que ‘tendrian’ que estar alli… • Esto es debido a que los NOE no solo dependen de la dis- • tancia entre dos protones, pero tambien de la dinamica entre • ellos (osea, el grado de movimiento de uno con respecto al • otro). Esto va a ser importante en peptidos chicos, porque en • estos casos tenemos mucha movilidad en las cadenas late- • rales y en el esqueleto peptidico. • Lo mas importante a tener en cuenta siempre es que no ver • un NOE no significa que dos protones esten a mas de 5 Å. • A su vez, un NOE puede surgir de un promedio de confor- • meros del peptido. Podemos ver algo como NOE medio (1.8 • a 3.3 Å), cuando en realidad es una mezcla de NOE fuerte • (1.8 a 2.7 Å) y ausencia de correlacion: Aparente: Real: dij ~ 3 Å dij < 3 Å dij > 6 Å

Acoples y angulos diedros • Hasta ahora hemos visto como usar algunos datos de RMN • para obtener parametros estructurales usados en la determi- • nacion de estructuras 3D de macromoleculas en solucion. • En particular, los NOE nos permiten determinar distancias • aproximadas entre protones cercanos. Son muy utiles si los • vemos entre protones que estan en residuos que esten dis- • tantes uno de otro en la estructura primaria. • Sin embargo, los NOE no nos permiten, en general, decir na- • da acerca de la conformacion de enlaces con libre rotacion. • Para determinar esto podemos usar acoples 3J que se obser- • van en peptidos (o azucares, ADN, y ARN). Se pueden usar • acoples 3J/2J homo/heteronucleares, pero nos vamos a con- • centrar en el acople 3J homonuclear. • Estos incluyen 3JNa, que nos da informacion acerca de la • conformacion del esqueleto peptidico (), y 3Jab, que esta re- • lacionado con la conformacion de la cadena lateral (c): H O f w N 3JNa f 3Jab c c N y Hb Ha H Hb AA

Acoples y angulos diedros (continuado) • Como vimos, la constante de acoplamiento 3J esta relacio- • nada con el angulo diedro por la ecuacion de Karplus. • Como vimos antes, la ecuacion es una suma de cosenos, y • dependiendo de la topologia (H-N-C-H or H-C-C-H) tenemos • distintos parametros: • Los parametros han sido derivados de moleculas rigidas y • datos de rayos-X. Graficamente: 3JNa = 9.4 cos2( f - 60 ) - 1.1 cos( f - 60 ) + 0.4 3Jab = 9.5 cos2( y - 60 ) - 1.6 cos( y - 60 ) + 1.8 3J (Hz) f - 60

Acoples y angulos diedros (…) • ¿Como medimos las 3J? Si tenemos pocos aminoacidos, • directamente del 1D. Tambien las podemos medir de espe- • ctros HOMO2DJ, o de espectros tipo COSY de alta resolu- • cion (MQF-COSY y E-COSY). • El problema mas grande de la ecuacion de Karplus es que • introduce ambiguedades. Si tenemos acoples 3JNa menores • de 4 Hz y los pongo en la grafica vemos que podemos tener • hasta 4 valores posibles para el angulo f: • En estos casos podemos hacer dos cosas. Una es tratar de • determinar la estructura usando solo NOEs y despues confir- • mar lo que nos da con los acoples J. Esto anda bien, pero • estamos ‘tirando’ informacion util… 9.4 5.0 ~ -60 ~0 ~110 ~170 4.0 0.0 f - 60

Acoples y angulos diedros (…) • Otra cosa que se puede hacer es usar solo los angulos que • son mas comunes que conocemos de estructuras de • rayos-X. Para f, los angulos ‘estandar’ tienen valores ne- • gativos de ~ -60 y ~ -170). Usando rangos: • Para las cadenas laterales tenemos also similar, pero en este • caso hay que elegir entre tres posibles rotameros (como en • etano…). Como se pueden medir dos acoples 3Jab (hay 2 • protones b), nos permiten elegir el conformero adecuado: 3JNa < 5 Hz -80 < f < -40 3JNa > 8 Hz -150 < f < 170 (-190) N N N Hb1 Hb2 Hb2 Cg Cg Hb1 C’ C’ Ha Ha C’ Ha Hb1 Cg Hb2 3Jab1~ 3Jab2 < 5 3Jab1< 5 (o vice versa) 3Jab2> 8

Introduccion al modelado molecular • Ahora tenemos casi toda la informacion estructural que pode- • mos sacar por RMN de nuestra muestra: tablas de NOEs con • distintas intensidades (distancias), constantes de acople 3J, y • rangos de angulos derivados de los acoples 3J. • Tenemos que ver como usar toda esta informacion para ob- • tener una ‘imagen’ de la molecula en solucion. • Contrario a los rayos-X, con los que ‘vemos’ la densidad • electronica de la molecula y pueden ser considerados como • un metodo directo, con RMN solo obtenemos informacion in- • directa acerca de la estructura, y esta informacion la dan • unos pocos atomos (basicamente los 1Hs…). • Por lo tanto nos valemos de un modelo teorico para repre- • sentar a la macromolecula. En general, esto es un modelo • molecular generado por computadora. • Este puede tener distintos grados de complejidad: • - ab initio: Solo considera orbitales atomicos/moleculares • y resolvemos la ecuacion de Schröedinger. No necesita pa- • rametros. Computacionalemte caro (10 - 100 atomos). • - Semiempirico: Usamos algunos parametros para represen- • tar a los orbitales atomicos/moleculares (100 - 500 atomos). • - Mecanica Molecular: Usamos un potencial parametrizado • simple tipo masa-y-resorte (todo lo demas…).

Modelado molecular (continuado) • Aca estamos lidiando con proteinas (miles de atomos), osea • que usamos mecanica molecular (MM). • El corazon de la MM es el campo de fuerza (force field) o • las ecuaciones que describen la energia del sistema en fun- • cion de las coordenadas xyz. En general es una suma de • distintos terminos de energia: • Cada termino depende de una forma u otra con la geometria • del sistema. Por ejemplo, Een, o potencial de enlace del sis- • tema (bond stretching), es: • Las distintas constantes (Kbs, ro, etc., etc.) son los parame- • tros del campo de fuerza, y se obtienen a partir de datos ex- • perimentales (rayos-X, microondas) o calculos a alto nivel de • teoria (ab initio o semiempiricos). • Distintos campos de fuerza incluyen distintos terminos, y • necesitamos uno que tenga aquellos que representen bien • a nuestro sistema (proteinas). Etotal = EvdW + Een + Ean + Etor + Eelec + … Een = Si Keni * ( ri - roi )2

Incorporacion de datos de RMN • Lo bueno de los campos de fuerza para MM es que si tene- • mos una funcion que relacione nuestros datos experimenta- • les con las coordenadas xyz la podemos sumar directamen- • te a la ecuacion del potencial total del sistema. • Esto es lo que hacemos con los datos derivados de RMN. • Para NOEs usamos rangos de distancias en vez de valores • unicos porque podemos tener otros fenomenos de relajacion • en juego, y/o promediado de NOEs: • La funcion de energia potencial relacionada con estos rangos • es una funcion cuadratica de base plana: • Cuanto mas lejos este la distancia calculada en el modelo te- • orico (rcalc) del rango determinado experimentalmente, mas • grande la penalizacion. Estas son restricciones de NOE. NOE fuerte 1.8 - 2.7 Å NOE medio 1.8 - 3.3 Å NOE debil 1.8 - 5.0 Å ENOE = KNOE * ( rcalc - rmax)2 si rcalc > rmax ENOE = 0 si rmax> rcalc > rmin ENOE = KNOE * ( rmin - rcalc )2 si rcalc < rmin

Incorporacion de datos de RMN (continuado) • De manera similar podemos incluir restricciones en el rango • de angulos o constantes de acoplamiento: • Graficamente, las funciones tienen este aspecto: EJ = KJ * ( Jcalc - Jmax)2 si Jcalc > Jmax EJ = 0 si Jmax> Jcalc > Jmin EJ = KJ * (Jcalc - Jmin )2 si Jcalc < Jmin E 0 rmax fmax Jmax rmin fmin Jmin Rcalc, fcalc, o Jcalc

Optimizacion de estructuras • Ahora tenemos todas las funciones incluidas en el potencial • de la molecula, incluyendo interacciones covalentes (enlace, • angulos, y torsiones), no covalentes (vdW, electroestatica), y • restricciones NOE y 3J derivadas de RMN. • Para obtener un modelo estructural del peptido decente hay • que minimizar la energia del sistema, lo que implica encon- • trar un conforermo de baja energia (o el de mas baja energia) • o una familia de conformeros de baja energia. • En una funcion con la cantidad de variables que tenemos • en un peptido esto es laborioso, porque tenemos una super- • ficie de n dimensiones (cada uno de las variables que esta- • mos optimizando). Para  y  en un disacarido: • Tenemos picos (maximos) y valles (minimos) de energia. E (Kcal/mol) y f

Optimizacion de estructuras (continuado) • Minimizar la funcion implica ‘bajar’ en la (hiper)superficie • de energia de la molecula. Para esto neceitamos calcular • las derivadas CRA xyz (las variables) de todos los atomos: • Esto nos permite ver como vamos ‘para abajo’ para todas • las variables, y por lo tanto determinar que direccion hay • que tomar para minimizar la energia del sistema. • La minimizacion solo ‘baja.’ Podemos tener muchos minimos • locales en la superficie, y si solo usamos minimizaciones el • sistema puede quedar atrapado en uno de estos. Esto es lo • que sucede en proteinas, donde tenemos cientos de grados • de libertad (considerando solo enlaces con libre rotacion…). • En estos casos necesitamos otros metodos para encontrar • el minimo de energia. Uno de estos metodos es la dinamica • molecular (DM). • Como tenemos la funcion potencial del sistema, le podemos • dar energia (por ejemplo, ‘elevar’ la temperatura) y ver como • evoluciona. Un aumento de temperatura implica mas energia • cinetica y la posibilidad de superar barreras energeticas. Etotal Etotal > 0 Etotal < 0 Etotal xyz xyz

Dinamica molecular y enfriamineto simulado • En las DMs ‘calentamos’ el sistema a una temperatura fisica- • mente ‘razonable,’ ~ 300 K. La energia por mol a esta tempe- • ratura es ~RT, dondeRes la constante de Boltzmann (por • mol). Si hacemos los numeros, esto es ~ 0.5 Kcal/mol. • Esto puede ser suficiente para ciertas barreras, pero no para • otras que seguramente vamos a tener en el sistema. Para • estos casos necesitamos un metodo de busqueda conforma- • cional mas drastico, como ser el templado simulado. • ‘Calentamos’ el sistema a temperaturas ridiculamente altas • (2000 K), y despues lo dejamos enfriar lentamente. La idea • es que este proceso permite que el sistema pase por barre- • ras energeticas considerables, y al enfriarse produzca con- • formeros estables y de baja energia. Conformeros ‘calientes’ Conformeros ‘frios’ T Tiempo (generalmente ps)

Geometria de distancia • Otro metodo compleatmente diferente a la DM y al TS es la • geometria de distancias. Vamos a presentar solo lo que • nos da pero no como funciona. • Basicamente, randomizamos las coordenadas xyz de los • atomos del peptido dandoles limites altos y bajos por fuera • de los cuales los atomos no pueden estar. Aca incluimos los • enlaces y las restricciones de RMN. • Esto nos da una matriz de distancias limite, que es optimi- • zada por medio de un algoritmo SIMPLEX (desigualdades de • trinagulos), lo que se conoce como suavizado de la matriz. • Las estructuras que salen de esto no estan optimizadas, y • generalmente las mejoramos por DM y/o minimizacion. • Este esquema da un resumen de como los distintos metodos • hacen que la estructura se mueva en la superficie de energia • potencial del sistema: ME DM TS GD

Presentacion de resultados • La idea es samplear el espacio conformacional al que la • proteina tiene acceso bajo los efectos de las restricciones • estructurales que obtuvimos de los NOE y los acoples. • Las estructuras que obtenemos por estos metodos que no • muestren violaciones grandes de las restricciones que inclu- • imos se dicen ser consistentes con los datos de RMN. • Como ninguna de estas estructuras se puede descartar, lo • que hacemos es presentarlas como un set de estructuras de • baja energia superimpuestas en las regiones mas rigidas: • En esta solo mostramos los atomos pesados del esqueleto • peptidico. A pesar de que no lo buscamos, la flexibilidad de • ciertas regiones indica una falta de restricciones NOE, y • refleja que esa parte de la molecula es flexible en solucion. N-termini C-termini

RMN de proteinas Ahora mas o menos conocemos las tecnicas que se utilizan

RMN de proteinas Ahora mas o menos conocemos las tecnicas que se utilizan

Presentation Transcript

los objetos que se utilizan en la misa

¿QUE SE USABA ANTES DE QUE EXISTIERAN LAS COMPUTADORAS?

BIOQUIMICA DE LAS PROTEINAS

AHORA MISMO SE OR, AHORA MISMO SE OR, YO TE PIDO QUE ROMPAS LAS CADENAS. 2X QUE SE ABRAN LAS PUERTAS DE LOS CIELOS; DE

Menos del 1% de las bolsas se recicla. Es mas costoso reciclar una bolsa plástica que producir una nueva.

Los OBJETOS que se utilizan en la MISA

O QUE SE SABE DE PSA

La ciencia confirma que el estrés produce mucho más afecciones de las que hasta ahora se creía

Como se utilizan las palancas

LAS PROTEINAS

¿Qué tecnologías se utilizan?

Las fuentes de energía que contaminan menos

Dizem que não se cobra pelo que se faz, mas pelo que se sabe!

Mas, o que é saúde?

BIOMOLECULAS PROTEINAS MACROMOLECULAS MAS DE 10,000AMINOACIDOS

nueve palabras que las mujeres utilizan ...

Las aves: una de las cadenas productivas que mas crece

MATERIALES QUE SE UTILIZAN EN LA INFORMATICA

LAS TECNICAS OBJETIVAS

LAS PROTEINAS=PROTEINS

LAS PROTEINAS

CLASIFICACION DE LAS PROTEINAS