170 likes | 304 Views
Clase # 6: Potencial Estadístico (II). Prof. Ramón Garduño Juárez Modelado Molecular Diseño de Fármacos. Enfoque de Manfred Sippl et al. “ ¿Cuál es la probabilidad de observar C a de Leu a 5 Å de un C a de Ala?”
E N D
Clase # 6: Potencial Estadístico (II) Prof. Ramón Garduño Juárez Modelado Molecular Diseño de Fármacos
Enfoque de Manfred Sippl et al. • “¿Cuál es la probabilidad de observar Ca de Leu a 5 Å de un Ca de Ala?” • f (s) : probabilidad para un par de residuos para estar separados por una distancia s. • fab(s) : probabilidad para el residuo ab que ocurra a la distancia s. • Potencial: Se requiere además que los residuos a, b son k residuos fuera de la secuencia primaria. • Datos muy dispersos: 7 tipos de interacciones atómicas entre N, O, de la cadena principal y Cb. 20 de 20 residuos, más 20 intervalos para la distancia de secuencia k. • Corrección de tamaño menor ad hoc : no muy diferente de una pseudo cuenta. Hendlicsh JMB 1990 216:167-80 Sippl JMB 1990 213:859-883
Construcción: Potencial Atómico Extraer las distancias observadas entre pares de átomos N(observada) E(i,j,distancia) = -log N(random) N(random) = N(total) Mi Mj Base de datos de estructuras nativas no redundantes Mi, Mj son la fracción molar de i y j
El potencial atómico tuvo éxito en escoger las estructuras nativas de todos los señuelos de Park-Levitt. Las correlaciones de energía-RMSD son más altas de 0.6 en todos los casos. Validación: Potencial Atómico RMSD (Å)
Potencial estadístico de unión Proteína-DNA • Los potenciales se construyen a partir de los complejos proteína-DNA • Su desempeño se revisa en una validación cruzada y z-score de secuencias azarosas de ADN • Aplicar el potencial a casos de prueba reales
Conjunto de Datos - ComplejosProteína-DNA • Resolución<=3 Angstrom • Doble cadena ADN • Semejanza de secuencias de proteína <= 35% • 132 PDB estructuras de Rayos-X
Propensidades de los amino ácidos • Residuos de la Superficie área de superficie expuesta > 40% del área de superficie total del residuo (DSSP) • Residuos enterrados = residuos totales – residuos de superficie • Residuos interfaciales d < 4.5 A
Distribuciones espaciales de amino ácidos alrededor de bases Arg-A-CB Arg-C-CB Arg-G-CB Arg-T-CB
Derivación de un potencial estadístico Grid-based • Para un par de amino ácido a y base b en un punto de la malla s, el potencial está dado por • Donde Nabes el numero de pares ab observados, w es el peso dado a cada observación, f(s) es la frecuencia relativa de la ocurrencia de cualquier amino ácido en los puntos de la malla contra cualquiera de las bases , gab (s)es la frecuencia relativa equivalente a la ocurrencia del amino ácido contra la base b, K y T son las constantes de los gases y la temperatura absoluta respectivamente.
Derivación de un potencial estadístico Grid-based • Para un par de amino ácido i y base j en un punto r de la malla, el potencial está dado por
PDB Ranking Zscore PDB Ranking Zscore Comparación con 50000 secuencias azarosas 1CGP 142 -2.813 LacZ 612 -2.291 1TF3 3 -3.345 LacZ 3 -2.345 1FJL 1 -4.28 LacZ 1 -4.062 1PDN 1 -4.819 malE 24 -3.951 1GLU 905 -2.241 malT 702 -3.369 1LAT 2 -3.874 araC 70 -2.309 1HCQ 1 -5.167 araE 5 -3.194 1OCT 1 -3.823 crp 522 -3.821 1AAY 1 -4.047 crp 2 -2.442 1MEY 1 -4.43 deoC 5 -4.346 1PYI 1053 -2.1 deoC 11 -3.968 1APL 1 -3.451 exuT 60 -3.693 1SVC 21 -3.365 fur 612 -3.179 1NFK 468 -2.289 galE 2562 -1.714 1YRN 2 -4.413 tnaA 15410 -0.492 glpD 37 -3.365 melR 99 -3.016
Puntos Clave • Selección de la Base de Datos. • Estado de Referencia. • Validación.