1 / 61

Métodos geométricos (baseados em distância)

Métodos geométricos (baseados em distância). Cálculo de Distâncias. As distâncias evolutivas são calculadas para todos os pares de taxa (ou OTUs) e a árvore é construída considerando as relações entre estes valores. www.megasofware.net. Estatísticas das Seqüências. Conteúdo de bases

stu
Download Presentation

Métodos geométricos (baseados em distância)

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Métodos geométricos(baseados em distância)

  2. Cálculo de Distâncias • As distâncias evolutivas são calculadas para todos os pares de taxa (ou OTUs) e a árvore é construída considerando as relações entre estes valores

  3. www.megasofware.net

  4. Estatísticas das Seqüências • Conteúdo de bases • Distância das sequências par a par • transiçoes/transversões (0,5) • Ou 2x trans/transv (1,0) • Todas estas estatísticas são levadas em conta na escolha do modelo de substituição a ser utilizado

  5. Cálculo de Distâncias • Distância p

  6. Distância p • Se as seqüências forem muito distintas, p pode ser subestimado por homoplasias • Com isso, algumas correções são necessárias • Como regra geral: • se p > 0,3 a distância calculada por p é uma subestimativa • Se p > 0,5 – metade dos aa são diferentes... • Se p > 0,15 – utilizar algum modelo de substituição para corrigir a estimativa

  7. Jukes-Cantor (d) - JC • Correção que leva em conta a possibilidade de substituições de bases A T C G A - α α α T α - α α C α α - α G α α α -

  8. Jukes-Cantor (d) - JC • Substituições ocorrem com igual frequência em todos os nn, e que cada nn muda para qualquer outro com uma probabilidade α por ano (r = 3 α) • r é a taxa de substituição por sítio e por ano. • Considere duas sequencias, X e Y que divergiram de um ancestral há t anos • Seja qt a proporção de sítios idênticos e pt a proporção de sítios diferentes (1 – qt)

  9. Jukes-Cantor (d) - JC • Proporção de sítios idênticos em t+1: • Probabilidade de que um sítio idêntico em t continue idêntico em t+1: • (1 – r)2 = 1 – 2r + r2 1 – 2r • probabilidade de que um sítio diferente em t se torne idêntico em t+1 • 2r/3

  10. Seja Xi e Yjem t: Para que sejam idênticos em t+1: Xi Xje Yj Yj ; • α (1 – r) ou Xi Xie Yj Yi ; • (1 – r) α 2 . α (1 – r) = 2 . r/3 (1-r) = 2r/3 – 2r2/3 2r/3

  11. Jukes-Cantor (d) - JC • Então: • Ou:

  12. Jukes-Cantor (d) - JC • Então: • Ou: Sítio idêntico em t que continua idêntico

  13. Jukes-Cantor (d) - JC • Então: • Ou: Sítio idêntico em t que continua idêntico Sítio não idêntico em t que passou a ser idêntico

  14. Jukes-Cantor (d) - JC • Representando qt+1 – qt por dq/dt: • Em condições iniciais q = 1 em t = 0:

  15. Jukes-Cantor (d) - JC • Se p = (1 - q) • Sendo d a proporção de nn que se modificaram com o tempo: d = 2r . t

  16. Jukes-Cantor (d) - JC

  17. Kimura 2 parâmetros – K80 • Correção que leva em conta probabilidades diferentes de transições e transversões A T C G A - ββ α T β - α β C β α - β G α β β -

  18. Kimura 2 parâmetros – K80 • r = α + 2β • Transições • As transversões

  19. Tamura • Leva em conta as diferenças em transições e transversões (α e β), além da frequência diferencial de CG. A T C G A - βθ2βθ1 αθ1 T βθ2 - αθ1βθ1 C βθ2αθ2 - βθ1 G αθ2βθ2βθ1 - θ1 = frequência de CG θ2 = freqüência de AT

  20. Tamura-Nei (TrN) • Leva em conta as diferenças em transições e transversões (α e β), além da frequência diferencial de bases (g). A T C G A - βgTβgCα1gG T βgA - α2gCβgG C βgAα2gT - βgG G α1gAβgTβgC - gA,gT,gC,gG = frequência de cada uma das bases

  21. Tajima-Nei (F81) • Leva em conta apenas as diferentes freqüências das bases: A T C G A - αgTαgCα1gG T αgA - αgCα1gG C αgAαgT - α1gG G αgAαgTαgC - gA,gT,gC,gG = frequência de cada uma das bases

  22. General Time Reversible (GTR) • Leva em conta diferentes freqüências de bases e de substituições A T C G A - agTbgCcgG T agA - dgC egG C bgAdgT - fgG G cgA egTfgC - gA,gT,gC,gG = frequência de cada uma das bases a, b, c, d, e, f = probabilidade de substituição

  23. Distâncias Gamma • Nas distâncias consideradas anteriormente, assume-se que a taxa de substituições nucleotídicas é a mesma para todos os sítios... • Na verdade, isso dificilmente é assim, e esta taxa varia de sítio para sítio.

  24. Distâncias Gamma • Parâmetro a ser ajustado = α α=0,2 α=5 α=1 α=2 α=10

  25. A F B G I C H D E Tempo UPGMA (Unweighted Pair-Group Method with Arithmetic Mean) • É o mais simples e intuitivo dos métodos • Se baseia nas médias das distâncias entre as OTUs • Parte do princípio de que o relógio molecular está “funcionando”

  26. Exemplo numérico • Localizar a menor distância:

  27. Exemplo numérico • Localizar a menor distância:

  28. Exemplo numérico • Localizar a menor distância:

  29. Calcular médias

  30. (dAC+dAE+dBC=dBE)/4

  31. (dAC+dAE+dBC=dBE)/4

  32. Repetindo a matriz anterior

  33. (dCD+dED)/2

  34. (dCD+dED)/2

  35. (dCF+dEF)/2

  36. Calcular as médias • (dAC+dAE+dAF+dBC+dBE+dBF)/6; (dCD+dED+dFD)/3

  37. Calcular a média • (dAC+dAD+dAE+dAF+dBC+dBD+dBE+dBF)/8

  38. Matriz cofenética

  39. Comparação entre matrizes... Original Cofenética

More Related