1 / 45

Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados

Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados. Almir R. Pepato. O problema. Para cada conjunto de terminais podemos imaginar um número de hipóteses filogenéticas expressas por árvores não-enraizadas, definido pela fórmula:.

tuyet
Download Presentation

Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados Almir R. Pepato

  2. O problema Para cada conjunto de terminais podemos imaginar um número de hipóteses filogenéticas expressas por árvores não-enraizadas, definido pela fórmula: Os métodos de inferência filogenéticas são os que permitem a escolha, dentre todas essas hipóteses, daquela que consideramos a que melhor representa as relações de ancestralidade dentre os terminais em consideração.

  3. Representando filogenias Ramos: N= (2i-3)= 7 Árvore não enraizada Número de árvores não enraizadas: Cada árvore que antecede a árvore com i terminais possui 2i-5 ramos, assim ela produz : Árvores. Exemplo:

  4. Representando filogenias Árvores enraizadas: Apresentam informação temporal. Há muito mais, já que podemos inserir a raiz em qualquer nó. No exemplo:

  5. Representando filogenias (((A, B), (C, D)), E); Bipartições ou splits

  6. Representando filogenias L5 L3 L6 L1 L7 L2 L7 L4 L2 L6 L5 L8 L3 L4 L1 Árvore aditiva: A distância entre qualquer par de OTUs é a soma dos comprimentos de ramo que as separam. Comprimentos de ramos estimados de maneira independente. Portanto devem ser calculados N= (2i-3)= 7 Ramos. Árvore ultramétrica: Todas as OTU equidistantes da raiz. Ramos a serem calculados: (i-1)=4 Pois: L1=L2+L4+L8 L4+L8 = L3+L5 L5 = L6 L7=L8

  7. O problema

  8. Métodos de inferência A- Algoritmos- Uma série de passos que conduzem à árvore filogenética. A1-Análises de agrupamento (UPGMA) A2- NeighbourJoining B- Critérios de Otimização – Emprega uma função objetiva para comparar as hipóteses filogenéticas. B1- Máxima Parcimônia B2- Máxima Verossimilhança B3- Evolução Mínima B4- Mínimos Quadrados C- Inferência Bayesiana - Avalia a probabilidade posterior dos clados formados pelos terminais sob consideração.

  9. Parcimônia De forma independente, Luca Cavalli-Sforza e Anthony Edwards em 1963 e Camin e Sokal em 1965 chegaram a parcimônia como critério para otimização de cladogramas em caso de conflito entre caracteres (homoplasia) William de Ockham (1288-1347 ou 1348) “entia non sunt multiplicanda praeter necessitatem”

  10. Parcimônia Função objetiva da parcimônia:

  11. Parcimônia

  12. Parcimônia de Fitch G C Premissas: Caracteres não polarizados e não ordenados. Todas as mudanças de caráter com o mesmo custo. 1- Para cada terminal atribua um estado de caráter conforme a matriz à sua disposição. Estabeleça arbitrariamente uma raiz (ela não muda o comprimento da árvore). A A C

  13. Parcimônia de Fitch Visite um nó interno para o qual se conhece o conjunto de caracteres Sk para os dois descendentes (Si, Sj) imediatos. Assinale a ele um conjunto de valores Sk conforme as regras: A- Se então , nesse caso deve-se acrescentar 1 ao comprimento da árvore; B- Se então nesse caso não se acrescenta nada ao comprimento da árvore. Comprimento: 3 A C C G Y 1 X 1 A Z 0 W 1

  14. Generalizando... Parcimônia de Sankoff Parcimônia de Fitch Parcimônia de Dollo, caracteres ordenados: A-B-C-D As matrizes de Sankoff permitem que o procedimento apresentado para a parcimônia de Fitch seja generalizado para outras situações. Parcimônia de Wagner, caracteres ordenados: A-B-C-D

  15. Generalizando... Parcimônia de Sankoff

  16. Métodos de distância Algorítmos de agrupamento (não otimizam uma função): 1-UPGMA (Árvores ultramétricas) 2-NeighbourJoining 3- Neighbourliness 4- “Transformeddistancemethod” Evolução Mínima: Otimiza a função (busca a árvore que oferece a melhor nota):

  17. UPGMA A raiz é posta em:

  18. Transformeddistancemethod

  19. “Relação de vizinhança” Dada uma árvore aditiva, vale a condição dos quatro pontos: d(a,c) + d(b,d) < d(a,b) + d(c,d) = d(a,d) + d(b,c) 3.7+3.2 < 2.9+5.6 = 3.9+4.6 6.9 < 8.5 = 8.5

  20. Neighbor-Joining Passo a passo: 1- Começamos com uma matriz de distância relacionando n OTUs. 2- Uma nova matriz é calculada (Matriz Q). Nessa matriz a separação de cada par de terminais é ajustada com base na sua divergência média desde todos os outros terminais. 3- Agrupe dois terminais ao acaso:

  21. Neighbor-Joining 4- Calcule o comprimento da árvore sabendo que: Distância do par de membros ao novo nó: Distância dos demais OTUs ao novo nó:

  22. Neighbor-Joining 5- Determine o comprimento para todas as combinações de duas OTUs. Escolha a que minimiza o comprimento da árvore. 6- Recalcule a matriz de distâncias de considerando os dois terminais escolhidos como um único táxon. 7- Repita o processo até obter uma árvore completamente resolvida.

  23. Neighbor-Joining

  24. Mínimos Quadrados

  25. Mínimos Quadrados

  26. Algoritmos de busca B Árvore inicial, três espécies ao acaso. C 1 A Adiciona-se o próximo táxon (D) (três árvores): Impraticável para um número maior de terminais!!!!! E E E E B D C C E E D B E E B D C 2a 2b 2c E E E A A A E E E E E E Adiciona-se o quinto táxon(E) (15 árvores)....

  27. Stepwiseaddition B Árvore inicial, três espécies ao acaso. C 1 A Adiciona-se o próximo táxon (D) (três árvores): E E A ordem em que são acrescidos os terminais determina o resultado da busca. B D C C E D B B D C 2a 2b 2c A A A E E Escolhe-se a melhor árvore e adiciona-se o quinto táxon(E) (5 árvores)....

  28. Star-treedecomposition A ordem em que são agrupados os terminais determina o resultado da busca. Mais lento que o anterior: as árvores tem sempre o mesmo número de terminais.

  29. Nearest-neighborinterchanges (NNI)

  30. Subtreepruningandregrafting (SPR)

  31. Tree bisection and reconnection (TBR)

  32. Algoritmos de Busca

  33. Novas Tecnologias Ratchet: Desenhado para maximizar o número de pontos iniciais e reduzir o tempo gasto na procura a partir de cada ponto inicial e assim examinar mais ilhas de árvores. Perturba os dados mudando o peso a eles atribuído. Treefusing(TF): Troca de sub-grupos idênticos entre árvores diferentes. SectorialSeaches (SS): Tipo especial de avaliação de rearranjo, que necessita de uma árvore como ponto inicial. Seleciona diferentes setores da árvore e os re-analisa separadamente. Se uma configuração melhor é encontrada, ela é substituída na árvore inicial.

  34. Novas Tecnologias TreeDrifting (DFT): Soluções sub-ótimas são aceitas durante o rearranjo, com uma certa probabilidade. A probabilidade de aceitar uma solução sub-ótima depende da RelativeFitDifference (RFD) e a diferença de comprimento entre a nova e a velha solução. RFDAB = (F–C)/F F = Soma das diferenças de passos nas duas árvores (A e B) que melhor ajusta (fit) a árvore A C = Soma dos caracteres que melhor ajustam (fit) a árvore B

  35. Índices Índice de consistência (CI)- É a medida de quão bem um caráter ajusta-se a uma topologia. É calculado dividindo-se o menor número possível de passos do caráter pelo número de passos observados ao longo da topologia. Ou então é uma medida de homoplasia de uma árvore, sendo dado por: CI = Número total de mudanças de estado esperado dada a matriz de dados X 100/ Número de passos na árvore CI= 6*100/7 = 85,7

  36. Índices

  37. Índices Índice de retenção (RI): RI = Número máximo de passos na árvore – número de mudanças de estado na árvore X 100/número máximo de passos na árvore – número de mudanças de estado nos dados

  38. Suporte Bootstrap

  39. Suporte Bootstrap

  40. Suporte Suporte de Bremer: Quanta homoplasia é necessária para derrubar um clado? Ex: A menor árvore que NÃO tem o clado (A C) é dois passos mais longa que a árvore apresentada.

  41. Problemas com a Parcimônia

  42. Qual método empregar? Huelsenbecket al., 1996

  43. Qual método empregar? Huelsenbecket al., 1996

  44. O uso da distância para inferência filogenética 1- Há perda de informação com a conversão da matriz de caracteres em matriz de distâncias. 2- O comprimento dos ramos de uma árvore de distância não são independentes, mas calculados em relação aos demais. Assim mesmo que as distâncias sejam corrigidas com o emprego de modelos estocásticos, elas serão sub-estimativas. Qualquer “problema” relacionado a um dos ramos (mudança na frequência das bases, ramo especialmente longo) será propagado ao longo de toda a filogenia.

  45. Substituições multiplas Distância genética p difere da distância aparente D, devido às substituições múltiplas.

More Related