720 likes | 913 Views
DETERMINACION DE LA ESTRUCTURA DE UNA PROTEINA MEDIANTE METODOS COMPUTACIONALES. Modelado por homología. Dra. Cristina Marino Buslje Septiembre 2006. Preedición de la estructura de una proteína. Es una de las tareas mas significantes abordadas en la biología estructural computacional.
E N D
DETERMINACION DE LA ESTRUCTURA DE UNA PROTEINA MEDIANTE METODOS COMPUTACIONALES Modelado por homología Dra.CristinaMarino Buslje Septiembre 2006
Preedición de la estructura de una proteína Es una de las tareas mas significantes abordadas en la biología estructural computacional. Tiene por objeto determinar la estructura tridimensional de proteínas a partir de su secuencia de aminoácidos. En términos mas formales, es la predicción de la estructura terciaria por su estructura primaria. Dada la utilidad del conocimiento de la estructura de proteínas en tareas tan valiosas como el diseño de drogas, este es un campo altamente activo de investigación. 1i9b.pdb
Secuencia Estructura Plegamiento El plegamiento de proteínas es esencial Proteínadesplegada Proteínaplegada • Forma casi única • Precisamente ordenada • Estable • activa • Altamente móvil • inactiva • Asociaciones especificas • Reacciones especificas • La función depende de la forma
Dominio estructural Dentro de una proteína, un dominio estructural (dominio) es un elemento que se estabiliza por si mismo y generalmente se pliega independientemente del resto de la proteína. Muchos dominios no son únicos de las proteínas producto de un gen o una familia de genes, sino que aparecen en una gran variedad de proteínas. Los dominios son frecuentemente nombrados según la función biológica en la que intervienen en la proteína donde aparecen predominantemente, por ejemplo, el "calcium-binding domain” de la calmodulina LAS PROTEINAS ESTAN FORMADAS POR DOMINIOS
Hay zonas de baja complejidad? Hay zonas trans membrana? secuencia secuencia PPPQNNSSSSTP Hay homologías parciales? secuencia secuencia Kinasa Cys rich SH2 Región hojas b Región a helices La predicción de estructura secundaria sugiere dominios? Asignación de dominios
Jerarquía SCOPE. Ej: 1tc2 • Superfamily:PRTase-like • Lineage: • Root:scop • Class:Alpha and beta proteins (a/b)Mainly parallel beta sheets (beta-alpha-beta units) • Fold:PRTase-likecore: 3 layers, a/b/a; mixed beta-sheet of 6 strands, order 321456; strand 3 is antiparallel to the rest • Superfamily:PRTase-like • Families: • Phosphoribosyltransferases (PRTases) • Phosphoribosylpyrophosphatesynthetase
Jerarquía CATH Ej: 1tc2 Clase Arquitectura (Fold) Topología (Superfamilia) Homologous superfamily Sequence family
Typos de Modelado • “Homology modelling” • “Fold recognition Modelling” • “Ab initio”
“Comparative protein modelling (Homology Modelling)” Usa estructuras previamente resueltas como puntos de partida o moldes se basa en la razonable suposición de que dos proteínas homologas compartirán estructura similar
De novo “Ab initio” protein modelling • Predecir la estructura de una proteína basándose solo en su secuencia. • Las predicciones “ab initio” recaen en la hipótesis termodinámica del plegamiento, que postula que las estructuras nativas de una secuencia proteica, corresponde a un mínimo global de energía libre. Actualmente hay tres problemas principales a los que debe enfrentarse este campo de investigación que son básicamente: • definir un sistema de “scoring” que diferencie estructuras nativas de las no nativas. • definir un campo de fuerzas para el cual la estructura con mínima energía libre global coincida con la estructura que conocemos como “nativa”. • El tiempo de computación necesario que requiere una cadena polipeptídica para recorrer todas las posibilidades conformacionales.
Pasos para el modelado por homologia (“homology modelling”) • Busqueda de la proteína homologa (”molde” en general) • Alineamiento • Selección del modelo • Refinamiento del modelo • Validación del modelo
El proceso de modelado por homología es cíclico Secuencia Alineamiento Validación del modelo Construcción del modelo Hasta no obtener mejoras
Homologo PDB Homologo PDB Proceso de Modelado por homología Secuencia Datos experimentales Alineamiento múltiple de secuencias Búsqueda en bases de datos Asignación de dominios Predicción de estructura secundaria NO Reconocimiento de plegamiento Análisis de la familia de plegamiento SI Alineamiento de estructuras secundarias SI NO Modelado por homologia Predicción estructura terciaria Alineamiento de la secuencia a las estructuras Modelo 3D de la proteína Basado en Bob Rusell
Cosas a tener en cuenta para evaluar una predicción de plegamiento (Fold recognition): • Correr mas de un programa de “Fold recognition” • En lo posible, correrlo sobre mas de un homologo. • Evaluar todas las salidas de un programa (no la primera) la solución puede estar entre las 10. • Función de la proteína de estructura desconocida. • Función de la proteína de estructura conocida. • La familia de plegamiento “FOLD FAMILY”. • Predicción de estructura secundaria.
Datos experimentales • Tener todo dato experimental en mente a la hora de hacer un trabajo predictivo. • Comprobar si la predicción concuerda con los resultados experimentales. En caso negativo, habrá que re plantearse lo hecho.
Datos experimentales pueden guiar el proceso de predicción ej: • Puentes disulfuro, restringen las posiciones de las cisteinas en el espacio. • Datos espectroscópicos. Dan información del contenido de estructura secundaria. • Mutagénesis dirigida, da información a cerca de que residuos intervienen en el centro activo o lugares de unión. • Conocimiento de lugares proteolíticos, modificaciones post-transduccionales, glucosilaciones, sugieren residuos accesibles. • Sitios antigénicos. • Etc.
Validación de modelos CUAL es el correcto???
Validación de modelos Procheck
Validación de modelos Verify3D
Validación de modelos Datos experimentales Procheck Verify3D Prosa II Errat WhatCheck ProQ …
Modelado de Loops El modelado de Loops constituye un problema de “homology Modelling” dentro de la proteína. • Modelado “Knowledge based” (por homología) • Modelado “ab initio” (loop building)
Clasificación de Loops http://sbi.imim.es/cgi-bin/archdb//loops.pl
Clasificación de Loops Numero de clases Vs. Longitud del loop en ArchDB Fernández Fuentes, Narcís. Tesis doctoral UAB 2004
Clasificación de Loops b-a 3.1.1 (2 cons GLY. 1 PH) b-b hairpin 5.1.1(1 cons GLY. 1 PH) Fernández Fuentes, Narcís. Tesis doctoral UAB 2004 a-b 4.1.1 (cons GLY PRO. 1 PH)
Modelado de Loops • ej: Knowlege based http://manaslu.aecom.yu.edu/loopred/ http://www-cryst.bioc.cam.ac.uk/servers.html • ej: By satisfaction of spatial restrains http://alto.compbio.ucsf.edu/modloop/
Errores mas frecuentes en modelos creados por “homology modelling” • Mala elección del “template” • Mal alineamiento entre el “template” y la proteína de estructura desconocida.
Mala elección del “template” Mal asignación 1hht RNAdep-RNAPol. Bacteriophage phi-6 1c2p RNAdep-RNAPol. HCV
Mala elección del “template” Mal asignación RHDV HCV PV Ribbon diagrams of RNA-dependent RNA polymerases shown from a similar vantage point
Mala elección del “template” Molde no adecuado HCV Ramachandran Plot statistics Most favoured regions [A,B,L] 835 88.3%* Additional allowed regions [a,b,l,p] 102 10.8% Generously allowed regions [~a,~b,~l,~p] 5 0.5% Disallowed regions [XX] 4 0.4%* Non-glycine and non-proline residues 946 100.0% Glycine residues 58 Proline residues 54 Total number of residues 1062
Mala elección del “template” HCV Ramachandran Plot statistics Most favoured regions [A,B,L] 909 91.5% Additional allowed regions [a,b,l,p] 84 8.5% Generously allowed regions [~a,~b,~l,~p] 0 0.0% Disallowed regions [XX] 0 0.0% Non-glycine and non-proline residues 993 100.0% End-residues (excl. Gly and Pro) 8 Glycine residues 62 Proline residues 56 Total number of residues 1119
Alineamiento parcialmente erróneo Superposición molde modelo
Parcialmente mal alineamiento 1C2P unk
Estudio Comparativo distintos softwares Para modelado por Homología 76% 52% 42% 39% 38% 24% 19% Akbar Nayeem. Et. Al. Protein Sci. 2006 15: 808-824
Estado del arte: CASP http://predictioncenter.org/casp6/Casp6.html 6th Community Wide Experiment on the Critical Assessment of Techniques for Protein Structure Prediction Gaeta (Italy) December 2004 Critical Assessment of Techniques for Protein Structure Prediction Asilomar Conference Center, Pacific Grove, CANovember 2006 (CASP7), 2006
Estado del arte: CAPRI CAPRI: Critical Assessment of PRediction ofInteractions CAPRI community wide experiment on the comparative evaluation of protein-protein docking for structure prediction Hosted By EMBL/EBI-MSD Group
Utilidad de un modelo EJEMPLODE ESTUDIOS ESTRUCTURALES
M. A. Marti i Renom et. Al Current Protocols in Bioinformatics (2003) 5.1.1-5.1.3
Construcción de estructuras supramoleculares IR ILGFR 1999
Identification of functional residues • Residues with backbone dihedral angles in strained conformation. • Clusters of charged residues. • Cavities or clefts in the protein structure. • Surface properties such as hydrophobicity, planarity, size or shape. • Energetics of the protein structure. • Surface mapping of phylogenetic information.