560 likes | 734 Views
TGTGAACACACGTGTGGATTGG. Sequenciamento de DNA em MegaBACE DNA Analysis Systems. Prof. Dr. Luciano da Silva Pinto. ls_pinto@hotmail.com. Sequenciamento do DNA. Definição Identificação da ordem exata dos pares de bases (A, T, G e C) em um segmento de DNA. Importância
E N D
TGTGAACACACGTGTGGATTGG... Sequenciamento de DNA em MegaBACE DNA Analysis Systems • Prof. Dr. Luciano da Silva Pinto ls_pinto@hotmail.com
Sequenciamento do DNA • Definição • Identificação da ordem exata dos pares de bases (A, T, G e C) em um segmento de DNA. • Importância • O conhecimento da seqüência de bases de um gene fornece importantes informações sobre sua estrutura, função e relação evolutiva com outros genes (de um mesmo organismo ou de organismos diferentes).
Análise do fluxo da informação celular pela pesquisa genômica
Histórico – O sequenciamento de DNA no tempo Watson & Crick Nobel 1962
Histórico – O sequenciamento de DNA no tempo Frederick Sanger Prêmio Nobel de medicina e fisiologia em 1980 J. Mol. Biol. v.94, p. 441-448, 1975 Walter Gilbert Prêmio Nobel de medicina e fisiologia em 1980 PNAS, vol. 74 No. 2 p. 560-564, 1977
Seqüenciamento de DNA Projeto Genoma Humano
Tecnologias de sequenciamento • Maxam & Gilbert, método químico- 1972 • Sanger sequencing • PNAS 74 (1977), n. 12, 5463-5467 • Sequenciador MegaBACE (1Mpb/24 horas) • Pirosequenciamento • Science 281 (1998), n. 5375, 363-365 • Nature 437 (2005), 362-7 • Sequenciador 454 (150Mpb/24 horas)
Método de Sanger • Reação de seqüenciamento • amplificação linear • Eletroforese em gel de acrilamida • em placa • capilar • Leitura da seqüencia • manual • automática
OH H Reação de seqüenciamento • fragmento de DNA (fita simples) • 1 primer • DNA polimerase • dNTPs • ddNTPs
Eletroforese • em placa • capilar
Reação de sequenciamento e marcação do DNA Leitura das sequências -Automática Leitura das sequências -Manual Radioisótopos Fluoresceínas
G A T C Leitura da seqüência de DNA • Manual
Leitura da seqüência de DNA • Automática
Reação de sequenciamento e leitura automatizada anelamento dos primers denaturação
5’ 3’ ATGCTTCTGGCAGATCTGAACAGTGTTACTGAT ATGCTTCTGGCAGATCTGAACAGTGT ATGCTTCTGGCAGATCTGAACAGTGTTACTGATATTGCTT ATGCTTCTGGCAGATCTGAACAGTGTTACTGATAT ATGCTTCTGGCAGATCTGAACAGTGTTACT ATGCTTCTGGCAGATCTGAACAGT ATGCTTCTGGCAGATCTGAACAGTGTTACTGATATTGCT ATGCTTCTGGCAGATCTGAACAGTGTTACTGATATT ATGCTTCT ATGCTTCTGGCAGATCT Organizando as Seqüências de DNA ATGCTTCTGGCAGATCTGAACAGTGTTACTGATATTGCTT ATGCTTCTGGCAGATCTGAACAGTGTT ATGCTTCTGGCAGAT |||||||||||||||||||||||||||||||||||||||| TACGAAGACCGTCTAGACTTGTCACAATGACTATAACGAA
Exemplo de gel utilizado nos seqüenciadores de gel (ex.: 377). A diferença de tamanho permite a separação dos grupos de fragmentos, e esta “distribuição normal” da passagem dos fragmentos é representada pelo eletroferograma (ou cromatograma) de cada seqüência (read).
Generic Sequencing Instrument Electrical Field - Laser + GCTATAGTTGATTCCT
DYEnamic ET Terminators – Pré Mix • Energy Transfer Dyes • Fluorescein Donor Dye • Standard Rhodamine Acceptor Dyes • Fluorescein-R110-ddGTP • Fluorescein-R6G-ddTTP • Fluorescein-TAMRA-ddATP • Fluorescein-ROX-ddCTP
+ N N O - CO 2 ddNTP + Ar Laser Radiationless + N N O OH O O - CO EnergyTransfer - 2 CO 2 ddNTP Transferência de energia aumenta a fluorescência
Fluorescein-TAMRA-ddATP Fluorescein-R110-ddGTP Fluorescein-R6G-ddTTP Fluorescein-ROX-ddCTP 100% 90% 80% 70% 60% Normalized Fluorescence Emission (Excitation at 488 nm) 50% 40% 30% 20% 10% 0% 500 550 600 650 700 Wavelength (nm) DYEnamic ET terminator - espectro de emissão
Montagem Limpeza das seqüências: remoção de seqüências ribossômicas remoção de seqüências de vetor remoção da região de poliA corte por qualidade eliminação das derrapagens
reads clonar em vetor sequenciamento Shotgun do genoma inteiro DNA genômico Quebrar em pedaços aleatórios ~2000pb (shotgun)
Reconstrução do DNA original a partir do fragmentos (clusterização) reads Sequência consenso (DNA original) A reconstrução é feita a partir de sobreposição dos fragmentos
Shotgun de pedaços do genoma Clonar em BAC’s e sequenciar apenas as pontas de cada fragmento Quebrar em pedaços de 2000pb clonar em vetor e sequenciar os fragmentos Quebrar em pedaços aleatoriamente desde 50Kpb até 300Kpb DNA genômico ~800 bp ~800 bp
O programa PHRED lê o chromatograma identificando e dando uma nota para cada base que forma a sequência : 0 0 5 6 7 10 10 9 12 15 20 20 30 30 35 40 41 45 50 56 56 50 40 ... Genome Research 8 (3) (1998), 175-185
background • A identificação dos picos é feita através de uma transformada de fourier do sinal • A nota é ligada com a resolução entre os picos vizinhos e a altura do background
Analisando o cromatograma Região de qualidade alta • Picos bem definidos e grandes. • Linha de base boa. • Distância entre picos anterior e posterior constante.
Região de qualidade média – poucas ambigüidades • Picos razoavelmente bem definidos e de tamanho médio. • Linha de base boa a razoável. • Distância entre picos anterior e posterior razoável.
Região de qualidade baixa – baixa confiabilidade • Picos mal definidos e de tamanho pequeno. • Linha de base confusa. • Distância entre picos anterior e posterior inconstante.
- Sequenciamento produz seqüências da ordem de 500 pb Onde q é a nota phred e P é a probabilidade encontrar uma base errada : - Nota phred = 20 => 1 base errada a cada 100 (99%) - Nota phred = 30 => 1 base errada a cada 1000 (99.9%)
Pirosequenciamento Science 281 (1998), n. 5375, 363-365
Ligação do adaptador e separação em fita simples Shotgun do genoma inteiro DNA genômico Quebrar em pedaços aleatórios ~2000pb (shotgun)
Pirosequenciamento • O adaptador permite que o DNA se ligue em grânulos minúsculos (diâmetro de 28 mm). Apenas um DNA é ligado em cada grânulo • Os grânulos são envolvidos em gotas de óleo que contêm todos os reagentes necessários para amplificar o DNA • Cada gota contendo o grânulo é mantida isolada para evitar contaminação e consegue produzir 10 milhões de cópias numa reação de pirosequenciamento • Um pmol de DNA numa reação de pirosequenciamento produz 1011 moléculas de ATP gerando mais de 109 fótons, num comprimento de onda de 560 nm, e num período de 3-4 segundos. Facilmente detectado por uma câmera de CCD Nature 437 (2005), 326-327
O sequenciador 454 Câmera de CCD Câmara de fluxo contendo as amostras e as fibras ópticas (1,6 milhões/slide) Bombeamento de fluídos Computador Nature 437 (2005), 376-380
Pirograma Linearidade é mantida até homopolímeros de 8 nt
Sanger vs Pirosequenciamento • Depende de clonagem em bactéria (2 semanas de trabalho) • Não há clonagem • 1 milhão de pb em 24 horas • 25 milhões de bp em 4 horas (100x mais rápido) • Reads de ~700 bp • Reads de ~100 bp • 6 meses de sequenciamento, 24 horas por dia, para sequenciar o genoma de um fungo • 24 horas para sequenciar o genoma de um fungo • Clones de fita dupla permitem seqüenciamento em ambas direções (facilita orientação e montagem) • Fragmentos fita simples não permitem seqüenciamento em ambas direções Conclusão : a união faz a força PNAS 103 (2006), 11240 SANGER Pirosequenciamento