1 / 19

Busqueda avanzada con BLAST

Busqueda avanzada con BLAST. Preparada por Genis Parra. Contenido. Blast traducidos Aplicaciones especiales de Blast NCBI PSI-Blast Busqueda de homólogos remotos. 1. Blast traducidos. La familia Blast. Blast estándar: blastn: nucleótido x nucleótido blastp: proteína x proteína

liang
Download Presentation

Busqueda avanzada con BLAST

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Busqueda avanzada con BLAST Preparada por Genis Parra

  2. Contenido • Blast traducidos • Aplicaciones especiales de Blast NCBI • PSI-Blast Busqueda de homólogos remotos

  3. 1. Blast traducidos

  4. La familia Blast • Blast estándar: • blastn: nucleótido x nucleótido • blastp: proteína x proteína • Blast traducidos: • blastx : nucleótido x proteína • tblastn : proteína x nucleótido • tblastx : nucleótido x nucleótido

  5. blastx Traduce la secuencia de DNA, en sus seis posibles pautas de lectura, y las compara contra una base de datos de proteínas. • Secuencia problema: DNA • Base de datos: Proteína

  6. blastx (ejemplo) • Conocemos una secuencia de DNA que sabemos que se transcribe y queremos saber si tiene alguna proteína codificada en ella que se parezca a una proteína de la base de datos # Problema Traducción ATGATTCATGCAGACTAGTACMIHAD*Y *FMQTSDSCRLV VLVCMNHY*SA*ITSLHES # Base de datos ASFGTDA SSAEVBH FASDEAG SDFEARS FSASDF ASFSERA

  7. tblastn Compara una proteína problema contra una base de datos de DNA traducida dinámicamente • Secuencia problema: proteína • Base de datos: DNA

  8. tblastn (ejemplo) • Queremos saber si la proteína que estamos estudiando se encuentra en algún genoma recién secuenciado de otra especie. # Problema ASFGTDAMHVN # Base de datos Traducción TAACGTCAGT CATGCATGCA *RQSCMH NVSHAC TSVMHA MHA*LTL CMHD*R ACMTDV ATGATTCATGCAGACTAGTACMIHAD*Y *FMQTSDSCRLV VLVCMNHY*SA*ITSLHES

  9. tblastx Compara las seis posibles traducciones de una secuencia de DNA contra las las seis posibles traducciones de una base de datos de DNA. • Secuencia problema: DNA • Base de datos: DNA

  10. tblastx (ejemplo) • Tenemos un fragmento genómico que sospechamos que codifica para una proteína queremos saber si algún fragmento de DNA de otra especie se parece a nivel de proteína traducida para reforzar nuestra hipótesis. # Problema Traducción TTACATAGTCATGGCTTGCT *RQSCMH NVSHAC TSVMHA MHA*LTL CMHD*R ACMTDV # Base de datos Traducción TAACGTCAGTCATGCATGCA *RQSCMH NVSHAC TSVMHA MHA*LTL CMHD*R ACMTDV ATGATTCATGCAGACTAGTACMIHAD*Y *FMQTSDSCRLV VLVCMNHY*SA*ITSLHES

  11. 2. Aplicaciones especiales de BLAST NCBI

  12. Aplicaciones especiales (I) • Alineando dos secuencias con BLAST • Blast2Sequences • BLAST especializados: • Detección de contaminación durante el clonado y secuenciación (VecScreen) • Detección de inmunoglobulinas y sus dominios (IgBLAST)

  13. Aplicaciones especiales (II) • Búsqueda de dominios conservados en Conserved Domain Database. (CDD) • Megablast: Blast optimizado para búsquedas en largas regiones genómicas (genomas completos). • Blast configurado automáticamente para encontrar fragmentos cortos y altamente conservados.

  14. 3. PSI-BLAST

  15. PSI-BLASTPosition-Specific Iterated BLAST PSI-BLAST realiza una búsqueda iterativa en que las secuencias encontradas en cada búsqueda son utilizadas para generar una matriz de sustitución especifica para cada posición de la proteína problema. La nueva matriz de substituciones generada con las proteínas alineadas nos permite reconocer homólogos remotos, ya que tenemos información de las substituciones especificas de esta familia.

  16. Que ocurrirá si volvemos a ejecutar BLAST ? sustitución específica de posición Nuevo score de sustitución Aliniamiento multiple A = a1a2a3a4a5 B = b1b2b3b4b5 C = c1c2c3c4c5 D = d1d2d3d4d5 E = e1e2e3e4e5 Matriz de pesos target homólogo 1 homólogo 2 homólogo 3 homólogo 4

  17. La misma target Nueva matriz ANNQERTYWDFGH GQQ-DKSFY--GG Nuevo Score BLAST 2 ANNQERTYWDFGH GQQD-KKS--HG Nueva Secuencia PSI-BLAST ANNQERTYWDFGH AQQQDKSFFEYGG Score BLAST ANNQERTYWDFGH GQQ-DKSFY--GG Score

  18. PSI-BLAST Iterativo Incrementa el número de homólogos remotos No hay nuevas secuencias STOP

  19. Problemas del PSI-blast • Necesitamos un conjunto de proteínas relacionadas evolutivamente para generar la matriz de substitución específica. • Si incluimos proteínas que no están relacionadas evolutivamente, estamos degenerando el patrón de búsqueda.

More Related