310 likes | 424 Views
UNIVERSIDADE FEDERAL DE VIÇOSA BIO 796 – Bioinformática. Montagem e análise de genomas Janaina O. Melo. Sequenciamento de genomas. Genoma: conjunto de toda informação hereditária de um organismo codificada no DNA (ou RNA, em alguns vírus). Inclui tanto genes como seqüências não codificantes
E N D
UNIVERSIDADE FEDERAL DE VIÇOSA BIO 796 – Bioinformática Montagem e análise de genomas Janaina O. Melo
Sequenciamento de genomas • Genoma: conjunto de toda informação hereditária de um organismo codificada no DNA (ou RNA, em alguns vírus). Inclui tanto genes como seqüências não codificantes • Sequenciamento de genomas: • geralmente feito utilizando a estratégia de shotgun • Montagem “in silico’’ das seqüências • Identificação de genes, ORFs, análises filogenéticas, etc • Construção de bibliotecas genômicas: • Vetores que propagam grandes insertos, como BACs, por exemplo • Esses insertos precisam ser fragmentados, pois os métodos de sequenciamento geram leituras de aproximadamente 500-800 pb.
Fragmentação Inserção em vetores de alta capacidade Cosmídeo, BAC, plasmídeo, etc. Nova fragmentação actgactgactgactgactgactactgactgactgactgactgactactgactgactgactgactgactgactgact actgactgactgactgactgact actgactgactgactgactgact actgactgactgactgactgact actgactgactgactgactgact actgactgactgactgactgact actgactgactgactgactgact actgactgactgactgactgact actgactgactgactgactgact actgactgactgactgactgact Clonagem em plasmídeos e sequenciamento C A A T T G G G Montagem dos contigs plasmídeo genoma
Cluster 1 Cluster 2 Cluster 3 Montagem de “contigs” de seqüências (clusters) :
Estratégias de bioinformática para montagem (assembly) dos contigs • VNTI ContigExpress (http://www.invitrogen.com/content.cfm?pageid=10209) • TIGR • DNAMAN • SeqMan • CAP3 - Web Contig Assembly Program (http://pbil.univ-lyon1.fr/cap3.php) • Phred/Phrap/Consed
CAP3 - Web Contig Assembly Program • Copiar as seqüências em formato fasta para o programa CAP3 • CAP3: visualizar os contigs e as seqüências únicas, ver detalhes dos contigs e obter suas seqüências • Pode-se fazer uma busca no banco de dados utilizando o BLAST
Phred/Phrap/Consed Pacote de programas para: • Leitura de cromatogramas • Atribuição de qualidade a cada base • Mascaramento de vetores • Montagem de seqüências • Visualização e edição dos contigs
Phred: Programa que lê os arquivos dos cromatogramas, atribui uma base a cada pico e valores de qualidade às bases. A qualidade Phred corresponde a um inteiro entre 0 e 99 e está associada à probabilidade de erro de leitura. Uma base com qualidade 40 indica que o erro é 10-4, ou seja 1 erro a cada 10.000 bases. Desse modo, quanto maior o Phred maior a qualidade do sequenciamento.
Phrap: É um programa para montagem das seqüências. • Gera várias informações sobre os contigs, contidas em path/edit_dir: phrap.out, *.ace and *.screen.contigs.qual files • Uma quantidade enorme de seqüências podem ser manipuladas • Gera dados importantes e permite a visualização gráfica por outros programas.
Consed: Programa para visualização e edição dos alinhamentos produzidos pelo Phrap.
Selecionar um contig (não há diferença entre letras maiúsculas e minúsculas na busca)
Menu Navigate: • Regiões de baixa qualidade • Discrepância na qualidade das seqüências • Regiões cobertas por somente uma fita • Pesquisa por ORFs
Menu Misc: Tradução da seqüência consenso em aminoácidos
Busca de ORFs na sequência • ORF Finder: http://bioinformatics.org/sms/orf_find.html • GENSCAN: http://genes.mit.edu/GENSCAN.html