1 / 57

Comparar secuencias = Obtener información

Comparar secuencias = Obtener información. Alineamiento de secuencias.

duman
Download Presentation

Comparar secuencias = Obtener información

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Comparar secuencias = Obtener información

  2. Alineamiento de secuencias

  3. Los aa importantes para el mantenimiento de la estructura y/o función de la proteína se encuentran bajo presión evolutiva: o se conservan o, si cambian, lo hacen por aa parecidos. Estos aa se pueden identificar haciendo un alineamiento de proteínas homólogas. Si dos secuencias están muy próximas en la evolución, habrán cambiado muy poco y será difícil detectar qué aa son los realmente importantes Si dos secuencias están muy lejanas será difícil hacer un alineamiento capaz de detectar los residuos importantes. Este problema se puede resolver alineando el mayor número posible de secuencias homólogas. Alineamiento de dos secuencias

  4. El porcentaje de identidad entre secuencias

  5. Para ser útil, un AMS debe incluir un amplio rango de similitudes

  6. Current Opinion in Structural Biology 16 (2006): 368-373 ¿Cómo se construye un AMS?

  7. Alineamiento óptimo de múltiples secuencias

  8. Regiones conservadas y no conservadas

  9. Al alinear muchas secuencias, las columnas que contienen aa idénticos o similares destacarán claramente. Estos aa conservados corresponden a aquellas regiones de la proteína que son importantes para el mantenimiento de la estructura y/o función. Las regiones de la proteína que toleran indels suelen corresponder a regiones expuestas (bucles sin elementos de estructura secundaria. Regiones conservadas y no conservadas

  10. AMS y predicción de estructuras

  11. AMS y relaciones filogenéticas

  12. Aplicaciones de los AMS Aplicaciones de los AMS (1)

  13. Aplicaciones de los AMS (2)

  14. Selección de secuencias para un AMS (1)

  15. Selección de secuencias para un AMS (2)

  16. ¿Qué tipo de secuencias necesito para un AMS?

  17. No es una buena idea seleccionar muchas secuencias

  18. Hacer un AMS con muchas secuencias es complicado

  19. Nombrar las secuencias de un AMS

  20. Consejos sobre cómo hacer un AMS

  21. Criterios para la construcción de un AMS (2)

  22. Métodos exactos (basados en la PD) MSA CLUSTALW T-COFFEE MUSCLE AMS globales Métodos progresivos PRPP PSI-BLAST SAGA Métodos iterativos Métodos estadísticos y probabilísticos HMM Métodos para hacer AMS globales

  23. 1.- Métodos exactos

  24. Programa MSA Método basado en la programación dinámica

  25. 3002 = 9  104 3003 = 2,7  107 El espacio de búsqueda con 3 secuencias (PD)

  26. Para alinear dos secuencias de 300 aa, el algoritmo de programación dinámica (PD) utiliza una matriz bidimensional: El número de operaciones que hay que realizar es 3002. Para alinear N secuencias de 300 aa, el algoritmo de PD utiliza una matriz n-dimensional: El número de operaciones que hay que realizar es 300N. Este método necesita una gran cantidad de recursos computacionales y mucho tiempo. En la práctica apenas se utiliza: sólo si n = 3 ó, si las secuencias son cortas, 6 < n < 8. Método de programación dinámica

  27. Reducción heurística del espacio de búsqueda

  28. Método de la “suma de pares” Un sistema de puntuación del AMS

  29. http://xylian.igh.cnrs.fr/msa/msa.html

  30. 2.- Métodos progresivos

  31. J. Mol. Evol. (1987) 25: 351-360

  32. Compara todas las secuencias, dos a dos, utilizando el algoritmo de programación dinámica. Se cuenta el número de residuos que coinciden en cada pareja de secuencias. Hace un análisis de grupo (cluster analysis) para generar una jerarquía de secuencias en base a su similitud. Con esos datos se genera un árbol filogenético que servirá de guía para la construcción del AMS. El AMS comienza alineando las dos secuencias más parecidas. A continuación va añadiendo de forma progresiva las secuencias (o grupos de secuencias) que más se parecen a las que ya están alineadas. El AMS depende mucho de los alineamientos iniciales por parejas. Cualquier error cometido en las primeras etapas se va arrastrando durante todo el proceso. Algoritmo del método progresivo (1)

  33. Algoritmo del método progresivo (2)

  34. Dynamic Programming Using A Substitution Matrix Algoritmo del método progresivo (3)

  35. Inconvenientes del método progresivo

  36. ClustalW – ClustalW2 – Clustal Omega

  37. ClustalW es el más utilizado

  38. El algoritmo de ClustalW

  39. ClustalW compara las secuencias dos a dos

  40. Se utiliza el algoritmo de programación dinámica para calcular la distancia genética entre cada pareja de secuencias (nº de mismatches /nº matches) ClustalW: etapa nº 1

  41. ClustalW agrupa las secuencias y genera un dendrograma

  42. Con esos datos se construye un “árbol guía” que sirve para decidir el orden de los alineamientos (no tiene que ser especialmente preciso). ClustalW: etapa nº 2

  43. Se empieza alineando las dos secuencias más parecidas. A este alineamiento se le van añadiendo secuencias o alineamientos por orden decreciente de similitud. ClustalW: etapa nº 3

  44. http://www.ebi.ac.uk/Tools/msa/clustalw2/ El servidor EBI ya no mantiene ClustalW2 y recomienda utilizar Clustal Omega Página principal de ClustalW2 (EBI)

  45. http://www.ebi.ac.uk/Tools/msa/clustalo/ Página principal de Clustal Omega (EBI)

  46. Para hacer un AMS con ClustalW2: 1.- Seleccionar las secuencias en formato FASTA 2.- Introducir las secuencias en el campo 3.- Seleccionar los parámetros del alineamiento por parejas 4.- Seleccionar los parámetros del alineamiento múltiple 5.- Indicar si quieres recibir los resultados por e-mail 6.- Submit!! Cómo se hace un AMS con ClustalW2

  47. Escoge DNA o proteínas Corta/pega las secuencias aquí (de una en una). El límite son 500. Si ya tienes las secuencias seleccionadas en un único archivo, pincha aquí para cargarlo en el formulario. El tamaño máximo del archivo es 1 Mega Introduce las secuencias

  48. Selecciona el tipo de alineamiento Selecciona la penalización por abrir un indel Selecciona la penalización por extender un indel Selecciona la matriz de sustitución Selecciona parámetros del alineamiento por parejas

  49. Selecciona los parámetros del alineamiento múltiple Selecciona la penalización por extender un indel Selecciona la matriz de sustitución Selecciona la penalización por abrir un indel Indica si quieres recibir el resultado por e- mail Selecciona parámetros del alineamiento múltiple

More Related