280 likes | 382 Views
Anotaci ón Automática. Dante Travisany. Temas. Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl. Identificaci ón del Problema. Virus : 15 – 20 Bacteria 3000 - 5000 Eucariontes : sobre los 10000. Pipeline. Pipeline. Unix S ímbolo : | Segmentaci ón. Tools. BLAST
E N D
AnotaciónAutomática Dante Travisany
Temas • Pipeline • Tools • Bases de Datos • Conceptos • Ejemplos • Ensembl
Identificación del Problema • Virus : 15 – 20 • Bacteria 3000 - 5000 • Eucariontes: sobre los 10000
Pipeline Pipeline Unix Símbolo: | Segmentación
Tools • BLAST • InterProScan • AmiGO • Pathway Tools • Infernal • Glimmer • Critica • GeneMark • GeneWise • BedTools • Samtools • GenomicTools • KEGG-API
Base de Datos BLAST DB Protein BLAST DB Nucleotide - NT - REFSEQ - RDP -KEGG -PRIAM -SWISSPROT-UNIPROT -NR InterProScan - Databases • Pfam • SSF • Gene3D • TIGRfam
Nuevo Problema • Gran cantidad de bases de datos. • Errores en Anotación, dobleanotación. • Necesidad de Crear un vocabularioControlado • Gene Ontology, UniPROT, SwissPROT, InterProScan. • Capacidad de realizarreferenciascruzadas en las bases de datos.
AlgunosConceptosImportantes • Gene Name • VocabularioControlado • IFAA
GeneName:Para cadaOrganismoexisten gene names particulares, según la base de datos de Referencia. HUGO: www.genenames.org
Gene Ontology Consortium Gene Ontology: Proyectocolaborativo entre variadasinstituciones. Vocabulario: Estructurado Preciso Común Controlado Permitedescribir los roles de los genes y los productosgénicos en cualquierorganismo.
División Gene Ontology • ProcesoBiológico • Función Molecular • ComponenteCelular
Idea • Filtrarpor bases de datos • Generarunarutinaautomáticacapaz de iterar el proceso, paracada set de genes.
Resumen • Hasta ahora, se hanvisto: NGS sequencing. Assembly.Gene Prediction.Annotation (Databases).Automatic Annotation
GenDB • Automatic Annotation System for Prokaryotic genomes • Development for the University of Bielefeld since 2002. • Modular system developed using an OOP and a relational database (O2DBI). • Provide an Application program Interface (API).
GenDB • Folker Meyer et all. GenDB an open source genome annotation system for prokaryote genomes. Nucleic Acids Research,2003
Ensembl • Inicio:1999 • Objetivo: generarherramientas de anotaciónautomática. Ensembl Pipeline. • Website: http://www.ensembl.org/
Galaxy • Workflows, para NGS sequence, web based.http://galaxy.psu.edu/