200 likes | 720 Views
Busqueda avanzada con BLAST. Preparada por Genis Parra. Contenido. Blast traducidos Aplicaciones especiales de Blast NCBI PSI-Blast Busqueda de homólogos remotos. 1. Blast traducidos. La familia Blast. Blast estándar: blastn: nucleótido x nucleótido blastp: proteína x proteína
E N D
Busqueda avanzada con BLAST Preparada por Genis Parra
Contenido • Blast traducidos • Aplicaciones especiales de Blast NCBI • PSI-Blast Busqueda de homólogos remotos
La familia Blast • Blast estándar: • blastn: nucleótido x nucleótido • blastp: proteína x proteína • Blast traducidos: • blastx : nucleótido x proteína • tblastn : proteína x nucleótido • tblastx : nucleótido x nucleótido
blastx Traduce la secuencia de DNA, en sus seis posibles pautas de lectura, y las compara contra una base de datos de proteínas. • Secuencia problema: DNA • Base de datos: Proteína
blastx (ejemplo) • Conocemos una secuencia de DNA que sabemos que se transcribe y queremos saber si tiene alguna proteína codificada en ella que se parezca a una proteína de la base de datos # Problema Traducción ATGATTCATGCAGACTAGTACMIHAD*Y *FMQTSDSCRLV VLVCMNHY*SA*ITSLHES # Base de datos ASFGTDA SSAEVBH FASDEAG SDFEARS FSASDF ASFSERA
tblastn Compara una proteína problema contra una base de datos de DNA traducida dinámicamente • Secuencia problema: proteína • Base de datos: DNA
tblastn (ejemplo) • Queremos saber si la proteína que estamos estudiando se encuentra en algún genoma recién secuenciado de otra especie. # Problema ASFGTDAMHVN # Base de datos Traducción TAACGTCAGT CATGCATGCA *RQSCMH NVSHAC TSVMHA MHA*LTL CMHD*R ACMTDV ATGATTCATGCAGACTAGTACMIHAD*Y *FMQTSDSCRLV VLVCMNHY*SA*ITSLHES
tblastx Compara las seis posibles traducciones de una secuencia de DNA contra las las seis posibles traducciones de una base de datos de DNA. • Secuencia problema: DNA • Base de datos: DNA
tblastx (ejemplo) • Tenemos un fragmento genómico que sospechamos que codifica para una proteína queremos saber si algún fragmento de DNA de otra especie se parece a nivel de proteína traducida para reforzar nuestra hipótesis. # Problema Traducción TTACATAGTCATGGCTTGCT *RQSCMH NVSHAC TSVMHA MHA*LTL CMHD*R ACMTDV # Base de datos Traducción TAACGTCAGTCATGCATGCA *RQSCMH NVSHAC TSVMHA MHA*LTL CMHD*R ACMTDV ATGATTCATGCAGACTAGTACMIHAD*Y *FMQTSDSCRLV VLVCMNHY*SA*ITSLHES
Aplicaciones especiales (I) • Alineando dos secuencias con BLAST • Blast2Sequences • BLAST especializados: • Detección de contaminación durante el clonado y secuenciación (VecScreen) • Detección de inmunoglobulinas y sus dominios (IgBLAST)
Aplicaciones especiales (II) • Búsqueda de dominios conservados en Conserved Domain Database. (CDD) • Megablast: Blast optimizado para búsquedas en largas regiones genómicas (genomas completos). • Blast configurado automáticamente para encontrar fragmentos cortos y altamente conservados.
PSI-BLASTPosition-Specific Iterated BLAST PSI-BLAST realiza una búsqueda iterativa en que las secuencias encontradas en cada búsqueda son utilizadas para generar una matriz de sustitución especifica para cada posición de la proteína problema. La nueva matriz de substituciones generada con las proteínas alineadas nos permite reconocer homólogos remotos, ya que tenemos información de las substituciones especificas de esta familia.
Que ocurrirá si volvemos a ejecutar BLAST ? sustitución específica de posición Nuevo score de sustitución Aliniamiento multiple A = a1a2a3a4a5 B = b1b2b3b4b5 C = c1c2c3c4c5 D = d1d2d3d4d5 E = e1e2e3e4e5 Matriz de pesos target homólogo 1 homólogo 2 homólogo 3 homólogo 4
La misma target Nueva matriz ANNQERTYWDFGH GQQ-DKSFY--GG Nuevo Score BLAST 2 ANNQERTYWDFGH GQQD-KKS--HG Nueva Secuencia PSI-BLAST ANNQERTYWDFGH AQQQDKSFFEYGG Score BLAST ANNQERTYWDFGH GQQ-DKSFY--GG Score
PSI-BLAST Iterativo Incrementa el número de homólogos remotos No hay nuevas secuencias STOP
Problemas del PSI-blast • Necesitamos un conjunto de proteínas relacionadas evolutivamente para generar la matriz de substitución específica. • Si incluimos proteínas que no están relacionadas evolutivamente, estamos degenerando el patrón de búsqueda.