230 likes | 356 Views
Sequencing by Hybridization. Aluno: Ennio Baptista ( esb@cin.ufpe.br ) Orientadora: Kátia Guimarães ( katia@cin.ufpe.br ). Sequenciamento de DNA. Objetivo : determinar a estrutura de uma molécula de DNA, identificando A SEQÜÊNCIA DE nucleotídeos componentes.
E N D
Sequencing by Hybridization Aluno:Ennio Baptista (esb@cin.ufpe.br) Orientadora:Kátia Guimarães (katia@cin.ufpe.br)
Sequenciamento de DNA • Objetivo : determinar a estrutura de uma molécula de DNA, identificando A SEQÜÊNCIA DE nucleotídeos componentes. • É o primeiro passo para a interpretação das informações genéticas codificadas no DNA, as quais determinam as características estruturais e funcionais de cada ser vivo
Técnicas de Seqüenciamento • Overlap-layout-consensus : nos últimos 20 anos apresentou melhor resultado (CAP3, Phrap,TIGR) • é difícil obter as informações corretas sobre a sobreposição dos fragmentos • é difícil encontrar o caminho correto num grafo de overlap com muitas arestas falsas
Técnicas de Seqüenciamento • Abordagem Alternativa : Em 1988, 4 grupos de pesquisas propuseram como alternativa uma nova técnica de seqüenciamento de DNA denominada Sequencing by Hybridization(SBH) • Bains and Smith (1988) • Drmanac et al., 1989 • Lysov et al., 1988 • Southern, 1988 • Custo, velocidade, automação e eficiência
SBH : Princípios • Duas etapas complementares bem definidas : • Etapa Bioquímica : • Etapa Computacional :
SBH : Etapa Bioquímica • Etapa experimental em que o spectrum da seqüência é identificado : • Todos os probes de tamanho ℓ são fixados em posições conhecidas na superfície do DNA chipou microarray : C(ℓ) 4ℓprobes • O DNA chip é colocado em contato com uma solução contendo cópias da cadeia de DNA marcadas por fluorescência
SBH : Etapa Bioquímica • O DNA chip é lavado e as cópias que tiverem hibridizado com algum de seus probes permanecem ligadas à sua superfície. • Um procedimento de leitura revela as posições onde ocorreram as hibridizações o spectrum é determinado
SBH : Etapa Bioquímica • EXEMPLO – DNA Chip C (4) • DNA target : TATCCGTTT Spectrum = {ATAG, AGGC, TAGG, GGCA, CAAA, GCAA}
SBH : Etapa Combinatorial • Etapa computacional para descobrir o posicionamento de cada um dos probes • A reconstrução de uma cadeia original, a partir do seu spectrum, só é possível graças a uma característica peculiar de formação do spectrum, que garante que todos os ℓ-1 nucleotídeos finais de uma ℓ-tupla se sobrepõem aos ℓ-1 nucleotídeos iniciais da ℓ-tupla seguinte.
SBH : Etapa Combinatorial • EXEMPLO – Sequenciamento • DNA target : TATCCGTTT Spectrum = {ATAG, AGGC, TAGG, GGCA, CAAA , GCAA} TATCCGTTT ||||||||| ATAGGCAAA ATAG TAGG AGGC GGCA GCAA CAAA
SBH : Etapa Combinatorial • SBH Shortest Superstring Problem (SSP) • SSP Traveling Salesman Problem • Grafo dirigido completo tendo os Vértices associados às ℓ-tuplas, e as arestas, às sobreposições • SpectrumS grafo G(V,A)
SBH : Etapa Combinatorial • SpectrumS grafo G(V,A) • S: resultado do experimento bioquímico • G : grafo dirigido completo • V = {ℓ-tuplas do spectrum S} • A = {(p,q) : p e q se sobrepõem por ℓ-1 caracteres}
SBH : Etapa Combinatorial • EXEMPLO • SBH e o Caminho Hamiltoniano S = {ATG, AGG, TGC, TCC, GTC, GGT, GCA, CAG} G ATGTGCGCACAGAGGGGTGTCTCC
SBH : Etapa Combinatorial • “Existe uma correspondência de um para um entre caminhos que visitam cada vértice de G e fragmentos de DNA com o spectrum S” • O Caminho Hamiltoniano dá a seqüência, mas nenhum algoritmo eficiente é conhecido (NP-completo)
SBH : Outras Abordagens • Em 1989, Pevzner propõe uma solução de tempo linear. • Um grafo em que cada aresta representa uma ℓ-tupla, e cada vértice uma (ℓ-1)-tupla, sendo que cada (ℓ-1)-tupla v é incidente a uma (ℓ-1)-tupla w, se existir no spectrum uma ℓ-tupla com seus ℓ-1 nucleotídeos iniciais coincidindo com v, e seus ℓ-1 nucleotídeos finais coincidem com w
SBH : Outras Abordagens • EXEMPLO – Grafo proposto por Pevzner • S = {ATG,TGG,TGC,GTG,GGC,GCA,GCG,CGT} • GT CG • AT TG GC CA • GG
SBH : Outras Abordagens • O Caminho Euleriano dá a seqüência em tempo polinomial, mas tem limitações : • Erros de experimentação • Repetições de ℓ-tuplas • Branching Vertex Construções Ambíguas
SBH : Outras Abordagens Construções Ambíguas : Erros • S = {ATG,TGG,***,GTG,GGC,GCA,GCG,***} • GT CG • AT TG GC CA • GG
SBH : Outras Abordagens Construções Ambíguas : Erros • S = {ATG,TGG,***,GTG,GGC,GCA,GCG,***} • GT CG • AT TG GC CA • GG
SBH : Outras Abordagens Construções Ambíguas : Branching Vertex • S = {ATG,TGG,TGC,GTG,GGC,GCA,GCG,CGT} • GT CG • AT TG GC CA • GG • S = {ATG,TGG,TGC,GTG,GGC,GCA,GCG,CGT} • GT CG • AT TG GC CA • GG
SBH : Outras Abordagens Construções Ambíguas : Branching Vertex • S = {ATG,TGG,TGC,GTG,GGC,GCA,GCG,CGT} • GT CG • AT TG GC CA • GG • S = {ATG,TGG,TGC,GTG,GGC,GCA,GCG,CGT} • GT CG • AT TG GC CA • GG
SBH : Ficam algumas perguntas • “Qual a probabilidade de um fragmento de DNA de tamanho n ser reconstruído, sem ambigüidade, por um DNA array C(ℓ) ?” • “Qual deve ser o tamanho de ℓ para reconstruir , sem ambigüidade, uma seqüência de tamanho n a partir de seu spectrum ?”
SBH : Outras Abordagens • Como superar o problema da reconstrução de seqüências ambíguas ? • projetos de chips alternativos (alternative chip designs) • protocolos interativos (interative protocols) • usar informação de localização (using location information) • usar uma seqüência homóloga conhecida (using a known homologus sequence). • (Pe’er, 2000:260)