810 likes | 986 Views
SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía. X. Nativa. Búsqueda homólogos con estructura conocida Selección homólogos de interés (miembros más cercanos, criterios adicionales) Obtención del alineamiento de la secuencia con los homólogos Cálculo del modelo Contraste del modelo
E N D
SELECCION DE “TEMPLATES” Y ALINEAMIENTO
Energía X Nativa
Búsqueda homólogos con estructura conocida • Selección homólogos de interés (miembros más cercanos, criterios adicionales) • Obtención del alineamiento de la secuencia con los homólogos • Cálculo del modelo • Contraste del modelo • Experimentación • “Feed-back” con el modelo
SIMILITUD ENTRE SECUENCIAS INDICA SIMILITUD ENTRE ESTRUCTURAS Y FUNCION
HOMOLOGIA Y COMPARACION DE SECUENCIAS SIMILITUD ENTRE SECUENCIAS HOMOLOGIA (Mismo orígen evolutivo)
ALINEAMIENTO DE SECUENCIAS AGGVIIIQVG AGGVLIQVG AGGVIIIQVG AGGVL-IQVG
IMPORTANCIA ALINEAMIENTO • Detección homólogos • Construcción modelo estructural
Búsqueda de homólogos BASE DE DATOS DE SECUENCIAS AGLM...WTKR TCGGLMN..HICG WRKCPGL ... SECUENCIA INCOGNITA ATTVG...LMN
COMPARACION SECUENCIAS • Construir alineamiento óptimo • Puntuar candidato
COMPARACION DE SECUENCIAS • HOMOLOGIA ALTA: AWTRRATVHDGLMEDEFAA AWTRRATVHDGLCEDEFAA • HOMOLOGIA BAJA: AWTKLATAVVVFEGLCEDEWGG VHDGLMEDEFAA AWTRRAT
Búsqueda de homólogos • PUNTUACION SECUENCIAS BASE DATOS (Proteínas estructura conocida) • LOCALIZACION CANDIDATO CON MAYOR PUNTUACION • PREDICCION FUNCIONAL/ESTRUCTURAL POR ASOCIACION/”HERENCIA”
PROBLEMAS HABITUALES • Solo hay familiares remotos: • BAJA SIMILITUD DE SECUENCIA • DIFICIL TENER BUENOS ALINEAMIENTOS
ALINEAMIENTO DE SECUENCIAS • OBTENER EL ALINEAMIENTO OPTIMO • NECESARIO: • METODO PARA PUNTUAR AMINOACIDOS COMPARADOS • METODO PARA CONSTRUIR LOS ALINEAMIENTOS
A C D ...Y A 1 0 0 ...0 C 0 1 0 ...0 ..... Y 0 0 .....1 MATRIZ DE IDENTIDADES
N + M N 10600 N = M = 1000 NUMERO TOTAL DE ALINEAMIENTOS DOS SECUENCIAS DE LONGITUD N Y M:
HERRAMIENTAS BASICAS • MATRIZ COMPARACION AMINOACIDOS (Dayhoff, 1972) • ALGORITMOS DE COMPARACION DE SECUENCIAS (Needleman & Wunsch, 1970).
MATRIZ DE DAYHOFF PUNTUACION DE LOS AMINOACIDOS ALINEADOS log(fij/qi.qj) fij: frecuencia de mutación de residuo i al j qi, qj: frecuencia de los residuos i, j
MATRIZ DE DAYHOFF • REFLEJA LAS PROPIEDADES FISICO-QUIMICAS DE LOS AMINOACIDOS: propensidades de estructura secundaria hidrofobicidad volumen
MATRICES COMPARACION SECUENCIAS • BLOSUM62 (Henikoff & Henikoff, 1992): derivada a partir de la comparación bloques de secuencias • GONNET (Gonnet et al, 1992): alineamiento masivo de secuencias
R G F Q R 1 0 0 0 Y 0 0 0 0 G 0 1 0 0 Q 0 0 0 1 R G F Q R 3 1 1 0 Y 2 1 1 0 G 1 2 1 0 Q 0 0 0 1 ALGORITMO NEEDLEMAN & WUNSCH R_GFQ RYG_Q
GAPS (INSERCIONES/DELECIONES) • LOCALIZADOS EN LOOPS
GAPS (INSERCIONES/DELECIONES) • ESQUEMAS DE PUNTUACION: • DEPENDIENDO DE ESTRUCTURA 2a • VALOR CONSTANTE • FUNCION LINEAL go + n . gl
PROGRAMACION DINAMICA • VENTAJAS: PROPORCIONA UN ALINEAMIENTO REPRODUCIBLE Y OPTIMO • DESVENTAJAS: ES LENTO
METODOS SUBOPTIMOS • 10 – 100 MAS RAPIDOS • PROPORCIONAN ALINEAMIENTOS SUBOPTIMOS • BLAST, FASTA
BLAST • BLAST (Altschul et al, 1990): • localiza pequeños fragmentos comunes • extenderlos hasta que la puntuación cae
BLAST • RAPIDO, segundos EXPLORAR GENBANK, PDB • FILTROS BAJA COMPLEJIDAD • INDICES DE FIABILIDAD
ESTADISTICA • INDICE DE REFERENCIA: E: número de falsos positivos esperado • Búsquedas esporádicas: 0.01 – 0.001 • Búsquedas masivas (anotación genoma) : 10-6
LIMITES COMPARACION SECUENCIAS • EXISTENCIA DE PARENTESCOS INDETECTABLES • PREDICCIONES ESTRUCTURALES DE BAJA CALIDAD EN MUCHOS CASOS
THE TWILIGHT ZONE • IDENTIDAD INFERIOR AL 25 % • SIMILITUD ESTRUCTURAL: HOMOLOGIA REMOTA Y ANALOGIA
THE TWILIGHT ZONE • HOMOLOGIA REMOTA: ORIGEN EVOLUTIVO COMUN. E.G. HEMOGLOBINAS • ANALOGIA: CONVERGENCIA ESTRUCTURAL. E.G. HEMOGLOBINA Y COLICINA
AVTTGLNMWTTAKRPGMDDFYTILLPGLMNCI GLFTAIDMHFFGRKPACEEYFTLVVDGLCNCI USO DE ALINEAMIENTOS MULTIPLES • SIMILITUD BAJA, DOS SECUENCIAS: • SIMILITUD BAJA, SECUENCIASMULTIPLES: GIFTDIDMHFYVKKPGLDEFFTLVLRTLCMAA ALTTGIDMWTTAKRPDMDDYYTIIIPGLMNCI AVTTGLNMWTTAKRPGMDDFYTILLPGLMNCI GVTTGLNMYFTARRPGLDEFYTLVLRTLCMCL GIFTDIDMHFYVKKPGLDEFFTLVLRTLCMAA AVTTGLNMWTTAKRPGMDDFYTILLPGLMNCI GLFTALNMHFFGRKPACEEYFTLVVDGLCNCI
ALINEAMIENTOS MULTIPLES • RESIDUOS CONSERVADOS: RELEVANTES PARA FUNCION O ESTRUCTURA • PUNTUACION PONDERA LA CONSERVACION
PSI-BLAST • BUSQUEDA UTILIZANDO ALINEAMIENTOS MULTIPLES: • BUSQUEDA BASE DE DATOS • CONSTRUCCION POSITION-SPECIFIC SCORE • ITERAR
PSI-BLAST • PSI-BLAST NO ENCUENTRA LO QUE NO HAY EN LA PRIMERA BUSQUEDA BLAST • DEFINIR E PARA LA INCLUSION DE SECUENCIAS (0.01)
THREADING/FOLD RECOGNITION • ESTRATEGIA SIMILAR COMPARACION DE SECUENCIAS • USO BASE DE DATOS ESTRUCTURAL • DIFERENTE PUNTUACION CANDIDATOS
CANDIDATO SELECCIONADO ATTWV....PRKSCT .......... 10.5 > .......... 5.2
COMPARACION SECUENCIA-ESTRUCTURA • EVALUAR “EL GRADO DE AJUSTE DE LA SECUENCIA A LA ESTRUCTURA” • UTILIZAR PROPIEDADES DIVERSAS: DISTANCIAS INTERRESIDUO, ESTRUCTURA SECUNDARIA, ETC
Selección templates: uso información adicional 1YTS, 2HNQ: TIROSINA-FOSFATASA ................ Proyecto: 2HNQ ....HYTTWPDFGVP... CANDIDATO: 1YTS ....HVGNWPDQTAV... Proyecto: 2HNQ .....HCSAGIGRS... CANDIDATO: 1YTS .....HSRAGVGRT...
SELECCION “TEMPLATES” • Varios candidatos, similitudes bajas (30% - 35 %) • Bibliografía: sólo SSAO en H.Polymorpha y E.coli con TPQ en orientación correcta (modelos previos erróneos).
SELECCION “TEMPLATES” • Preferible X-ray sobre NMR • Uso información experimental (e.g. centro activo) • Preferible sin ligandos unidos, o generar dos modelos • Vigilar la presencia de contactos en el cristal • Preferible nativo sobre mutante
ALINEAMIENTOS • SECUENCIA - CANDIDATO • Entre candidatos estructurales
ALINEAMIENTO ENTRE CANDIDATOS • Alineamientos estructurales, ya disponibles (HOMSTRAD), mediante software (SAP, Taylor & Orengo, 1989). • Mejor pocos candidatos estructurales, y similares