1 / 28

Anotaci ón Automática

Anotaci ón Automática. Dante Travisany. Temas. Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl. Identificaci ón del Problema. Virus : 15 – 20 Bacteria 3000 - 5000 Eucariontes : sobre los 10000. Pipeline. Pipeline. Unix S ímbolo : | Segmentaci ón. Tools. BLAST

brock
Download Presentation

Anotaci ón Automática

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. AnotaciónAutomática Dante Travisany

  2. Temas • Pipeline • Tools • Bases de Datos • Conceptos • Ejemplos • Ensembl

  3. Identificación del Problema • Virus : 15 – 20 • Bacteria 3000 - 5000 • Eucariontes: sobre los 10000

  4. Pipeline Pipeline Unix Símbolo: | Segmentación

  5. Tools • BLAST • InterProScan • AmiGO • Pathway Tools • Infernal • Glimmer • Critica • GeneMark • GeneWise • BedTools • Samtools • GenomicTools • KEGG-API

  6. Base de Datos BLAST DB Protein BLAST DB Nucleotide - NT - REFSEQ - RDP -KEGG -PRIAM -SWISSPROT-UNIPROT -NR InterProScan - Databases • Pfam • SSF • Gene3D • TIGRfam

  7. Nuevo Problema • Gran cantidad de bases de datos. • Errores en Anotación, dobleanotación. • Necesidad de Crear un vocabularioControlado • Gene Ontology, UniPROT, SwissPROT, InterProScan. • Capacidad de realizarreferenciascruzadas en las bases de datos.

  8. AlgunosConceptosImportantes • Gene Name • VocabularioControlado • IFAA

  9. GeneName:Para cadaOrganismoexisten gene names particulares, según la base de datos de Referencia. HUGO: www.genenames.org

  10. Gene Ontology Consortium Gene Ontology: Proyectocolaborativo entre variadasinstituciones. Vocabulario: Estructurado Preciso Común Controlado Permitedescribir los roles de los genes y los productosgénicos en cualquierorganismo.

  11. División Gene Ontology • ProcesoBiológico • Función Molecular • ComponenteCelular

  12. COG - KOG

  13. Idea • Filtrarpor bases de datos • Generarunarutinaautomáticacapaz de iterar el proceso, paracada set de genes.

  14. Tools & Databases

  15. Resumen • Hasta ahora, se hanvisto: NGS sequencing. Assembly.Gene Prediction.Annotation (Databases).Automatic Annotation

  16. CasoTranscriptómica

  17. Nannochloropsis salinatranscriptomics

  18. GenDB • Automatic Annotation System for Prokaryotic genomes • Development for the University of Bielefeld since 2002. • Modular system developed using an OOP and a relational database (O2DBI). • Provide an Application program Interface (API).

  19. GenDB • Folker Meyer et all. GenDB an open source genome annotation system for prokaryote genomes. Nucleic Acids Research,2003

  20. GenDBPipeline 25

  21. GenDB

  22. Ensembl • Inicio:1999 • Objetivo: generarherramientas de anotaciónautomática. Ensembl Pipeline. • Website: http://www.ensembl.org/

  23. Galaxy • Workflows, para NGS sequence, web based.http://galaxy.psu.edu/

More Related