610 likes | 740 Views
Métodos geométricos (baseados em distância). Cálculo de Distâncias. As distâncias evolutivas são calculadas para todos os pares de taxa (ou OTUs) e a árvore é construÃda considerando as relações entre estes valores. www.megasofware.net. EstatÃsticas das Seqüências. Conteúdo de bases
E N D
Cálculo de Distâncias • As distâncias evolutivas são calculadas para todos os pares de taxa (ou OTUs) e a árvore é construída considerando as relações entre estes valores
Estatísticas das Seqüências • Conteúdo de bases • Distância das sequências par a par • transiçoes/transversões (0,5) • Ou 2x trans/transv (1,0) • Todas estas estatísticas são levadas em conta na escolha do modelo de substituição a ser utilizado
Cálculo de Distâncias • Distância p
Distância p • Se as seqüências forem muito distintas, p pode ser subestimado por homoplasias • Com isso, algumas correções são necessárias • Como regra geral: • se p > 0,3 a distância calculada por p é uma subestimativa • Se p > 0,5 – metade dos aa são diferentes... • Se p > 0,15 – utilizar algum modelo de substituição para corrigir a estimativa
Jukes-Cantor (d) - JC • Correção que leva em conta a possibilidade de substituições de bases A T C G A - α α α T α - α α C α α - α G α α α -
Jukes-Cantor (d) - JC • Substituições ocorrem com igual frequência em todos os nn, e que cada nn muda para qualquer outro com uma probabilidade α por ano (r = 3 α) • r é a taxa de substituição por sítio e por ano. • Considere duas sequencias, X e Y que divergiram de um ancestral há t anos • Seja qt a proporção de sítios idênticos e pt a proporção de sítios diferentes (1 – qt)
Jukes-Cantor (d) - JC • Proporção de sítios idênticos em t+1: • Probabilidade de que um sítio idêntico em t continue idêntico em t+1: • (1 – r)2 = 1 – 2r + r2 1 – 2r • probabilidade de que um sítio diferente em t se torne idêntico em t+1 • 2r/3
Seja Xi e Yjem t: Para que sejam idênticos em t+1: Xi Xje Yj Yj ; • α (1 – r) ou Xi Xie Yj Yi ; • (1 – r) α 2 . α (1 – r) = 2 . r/3 (1-r) = 2r/3 – 2r2/3 2r/3
Jukes-Cantor (d) - JC • Então: • Ou:
Jukes-Cantor (d) - JC • Então: • Ou: Sítio idêntico em t que continua idêntico
Jukes-Cantor (d) - JC • Então: • Ou: Sítio idêntico em t que continua idêntico Sítio não idêntico em t que passou a ser idêntico
Jukes-Cantor (d) - JC • Representando qt+1 – qt por dq/dt: • Em condições iniciais q = 1 em t = 0:
Jukes-Cantor (d) - JC • Se p = (1 - q) • Sendo d a proporção de nn que se modificaram com o tempo: d = 2r . t
Kimura 2 parâmetros – K80 • Correção que leva em conta probabilidades diferentes de transições e transversões A T C G A - ββ α T β - α β C β α - β G α β β -
Kimura 2 parâmetros – K80 • r = α + 2β • Transições • As transversões
Tamura • Leva em conta as diferenças em transições e transversões (α e β), além da frequência diferencial de CG. A T C G A - βθ2βθ1 αθ1 T βθ2 - αθ1βθ1 C βθ2αθ2 - βθ1 G αθ2βθ2βθ1 - θ1 = frequência de CG θ2 = freqüência de AT
Tamura-Nei (TrN) • Leva em conta as diferenças em transições e transversões (α e β), além da frequência diferencial de bases (g). A T C G A - βgTβgCα1gG T βgA - α2gCβgG C βgAα2gT - βgG G α1gAβgTβgC - gA,gT,gC,gG = frequência de cada uma das bases
Tajima-Nei (F81) • Leva em conta apenas as diferentes freqüências das bases: A T C G A - αgTαgCα1gG T αgA - αgCα1gG C αgAαgT - α1gG G αgAαgTαgC - gA,gT,gC,gG = frequência de cada uma das bases
General Time Reversible (GTR) • Leva em conta diferentes freqüências de bases e de substituições A T C G A - agTbgCcgG T agA - dgC egG C bgAdgT - fgG G cgA egTfgC - gA,gT,gC,gG = frequência de cada uma das bases a, b, c, d, e, f = probabilidade de substituição
Distâncias Gamma • Nas distâncias consideradas anteriormente, assume-se que a taxa de substituições nucleotídicas é a mesma para todos os sítios... • Na verdade, isso dificilmente é assim, e esta taxa varia de sítio para sítio.
Distâncias Gamma • Parâmetro a ser ajustado = α α=0,2 α=5 α=1 α=2 α=10
A F B G I C H D E Tempo UPGMA (Unweighted Pair-Group Method with Arithmetic Mean) • É o mais simples e intuitivo dos métodos • Se baseia nas médias das distâncias entre as OTUs • Parte do princípio de que o relógio molecular está “funcionando”
Exemplo numérico • Localizar a menor distância:
Exemplo numérico • Localizar a menor distância:
Exemplo numérico • Localizar a menor distância:
Calcular as médias • (dAC+dAE+dAF+dBC+dBE+dBF)/6; (dCD+dED+dFD)/3
Calcular a média • (dAC+dAD+dAE+dAF+dBC+dBD+dBE+dBF)/8
Comparação entre matrizes... Original Cofenética