1.07k likes | 1.23k Views
ALINEAMIENTOS SIMPLE Y MÚLTIPLE. Juan José Nieto Lunes, 11 de Julio de 2005. ALINEAMIENTO SIMPLE. Consiste en establecer un segmento entre dos secuencias biológicas donde el número de coincidencias sea máximo. INDELS. Inserción: IN SERT Se asigna una base demasiado pronto
E N D
ALINEAMIENTOS SIMPLE Y MÚLTIPLE Juan José Nieto Lunes, 11 de Julio de 2005
ALINEAMIENTO SIMPLE Consiste en establecer un segmento entre dos secuencias biológicas donde el número de coincidencias sea máximo
INDELS • Inserción: INSERT • Se asigna una base demasiado pronto • Eliminación: DELETED • Queda sin asignar una base • Se introduce una nueva letra en el alfabeto DNA: El “hueco” (gap) -
Comparación • Secuencia 1: M A R I A • Secuencia 2: M I R I A M • Secuencia 3: M A R I O • Secuencia 4: A R I A D N A
Comparación • Secuencia 1: M A R I A • Secuencia 2: M I R I A M 4 coincidencias
Comparación • Secuencia 1: MAR I A • Secuencia 3: MAR I O 3 coincidencias
Comparación • Secuencia 1: M A R I A • Secuencia 4: A R I A D N A 0 Coincidencias
Comparación • Secuencia 1: M A R I A • Secuencia 4: - A R I A D N A 4 Coincidencias
Comparación • Secuencia 5: J O S E • Secuencia 6: P E P E
Comparación • Secuencia 5: J O S E • Secuencia 6: P E P E 1 coincidencia
Comparación DNA - Leucina • Secuencia : T T A • Secuencia : C T G 1 coincidencia
SIMILITUD Cuantitativo HOMOLOGÍA Cualitativo ALINEAMIENTO
Por número de secuencias • Simple • Múltiple
Por nivel de análisis • Global • Local
Programas • BLAST (Basic Local Alignment Search Tool) http://www.ncbi.nlm.nih.gov • FASTA http://www.ebi.ac.uk
BLAST • blastp • blastn • blastx • tblastn • tblastx
Ejemplo • g c t g a a c g • c t a t a a t c
¿Cuántos alineamientos posibles hay? • Problema combinatorio • No se permite alinear dos huecos • Hay un número finito de alineamientos
Número de alineamientos • Primera secuencia: 8 letras • Segunda secuencia: 8 letras • Hay 265 729 alineamientos posibles
¿Cómo elegir el mejor alineamiento? • Hay que dar un valor a cada alineamiento • Elegiremos el (los) que tengan mayor puntuación. • Por ej.: Coincidencia +1 puntos No coincidencia 0 puntos Nos da el número de coincidencias
Otra puntuación • Por ej.: Coincidencia +2 puntos No coincidencia -1 punto
Algoritmo (teórico) • Paso 1 : Considerar todos los alineamientos posibles • Paso 2 :Determinar un valor para ese alineamiento • Paso 3 :Guardar el valor máximo
Problema • El número de operaciones crece e una forma “exagerada”
Número de alineamientos de dos secuencias de longitudn ,m • n = m = 8 265 729 alineamientos • n = m = 10 8 097 453 alineamientos
Fórmula del número de alineamientos posibles para dos secuencias de longitud n y m:f(n,m)
Fórmula de recurrencia f(n+1 , m+1) = f(n,m+1) + f(n+1,m) + f(n,m)
Demostración • Se basa en que el final de un alineamiento es: (- , letra) , (letra , - ) ó (letra , letra) • A. Torres, A. Cabada, J.J. Nieto “An exact formula for the number of alignments between two DNA sequences” DNA SEQUENCE (2003)
Consecuencias • f(n+1,n+1) > 3n • f (107 , 107 ) > 1080 • Una secuencia “pequeña” tiene 200-500 nucleótidos • Una proteína sobre 200-400 aminoácidos
¿Cómo se puede determinar el alineamiento óptimo? • Aunque no tengamos ni idea, sabemos una cosa: El alineamiento tiene que tener una de las tres terminaciones siguientes • g-g • -cc
Terminación • cg • c-
Simplificación del problema original • Secuencia 1: g c t g a a Longitud 6 • Secuencia 2: c t a t a a t Longitud 7
Posibles terminaciones • a-a • -tt
Terminación • a- • at