310 likes | 617 Views
Máxima Verossimilhança. Almir R. Pepato. O velho problema. Máxima Verossimilhança. O conceito de verossimilhança refere-se a situações em que a partir de um conjunto de dados D , uma decisão deve ser tomada a respeito de explicações alternativas a seu respeito.
E N D
Máxima Verossimilhança Almir R. Pepato
Máxima Verossimilhança • O conceito de verossimilhança refere-se a situações em que a partir de um conjunto de dados D, uma decisão deve ser tomada a respeito de explicações alternativas a seu respeito. • No caso das inferências filogenéticas temos um modelo composto pela topologia, comprimento de ramos e parâmetros do modelo de substituição. • Assinalando valores a esses elementos do modelo podemos computar a probabilidade dos dados sob cada um desses valores eescolher os valores mais plausíveis. • REPARE QUE EM NENHUM MOMENTO A VALIDADE DO MODELO É QUESTIONADA. Ronald Fisher
A história começa com o Teorema de Bayes... Isso incomodava Fisher!
A história começa com o Teorema de Bayes... Como funciona: Há dois sapos de origami, Joe e Herman. Por experiências anteriores sabe-se que Joe cai 60% das vezes em pé, enquanto Herman cai apenas 20% das vezes. O nome dos sapos foi apagado. Como podemos inferir qual é Joe apenas fazendo-os saltar? Primeiro lançamento, caiu em pé:
A história começa com o Teorema de Bayes... Segundo lançamento, caiu em pé: Terceiro lançamento, caiu de costas:
A história começa com o Teorema de Bayes... Isso incomodava Fisher! Se os dados forem robustos isso... Para eliminar esse incômodo: É muito maior que isso!
Máxima Verossimilhança Exemplo simples: N=100; Caras=21 ; Coroas= 79. O modelo estabelece apenas que com alguma probabilidade , caras aparecem quando a moeda é lançada e que cada resultado é independente dos demais. A probabilidade de obtermos exatamente H =h caras a partir de n lançamentos é de: Isso pode ser lido de duas maneiras: A- Se é conhecido, então podemos computar a probabilidade de que h= 0, 1, 2, ...n. B- Caso contrário a PROBABILIDADE em questão pode ser tratada como uma função de n e h!
Máxima Verossimilhança Obviamente o valor é 21/100. Mas podemos calcular isso analiticamente! Só para mostrar que sabemos cálculo! Para facilitar vamos transformar tudo em logaritmos, assim ao invés multiplicações teremos somas. Só para lembrar : Como sabemos, temos que calcular a derivada da função acima:
Máxima Verossimilhança Mas o que nos interessa mesmo é poder comparar duas hipóteses. Por exemplo: segundo a nossa função, a verossimilhança de que a moeda seja não-viciada é de: Comparado à nosso valor máximo (0,21) temos que é 6 x 107 mais verossímil que a probabilidade que produziu os dados seja θ= 0,21 que θ= 0,5. X
Recordando: Modelos de substituição Para os JC69, temos:
Máxima Verossimilhança 1- Cada posição no alinhamento evolui de maneira independente: 2- Cada ramo de uma filogenia evolui de maneira independente dos demais:
Máxima Verossimilhança Muita conta! 22n-2 cenários
Máxima Verossimilhança Se o modelo é reversível podemos enraizar em qualquer lugar.
Máxima Verossimilhança Essa expressão terá 256 termos (22(5)-2 ) O que pode ser rearranjado como: HÁ! ISSO É O MESMO QUE SEGUIR A ÁRVORE DAS FOLHAS PARA A RAIZ!
Máxima Verossimilhança Verossimilhança da árvore:
Resolução do exemplo numérico 0 1 0 0 0 0 1 0 0 1 0 0 0 1 0 0
Resolução do exemplo numérico 0 1 0 0 0 0 1 0 0 1 0 0 0 1 0 0 0.00097 0.02828 0.02828 0.00097
Resolução do exemplo numérico 0 1 0 0 0 0 1 0 0 1 0 0 0 1 0 0 0.00097 0.02828 0.02828 0.00097 0.0000026
Resolução do exemplo numérico 0 1 0 0 0 0 1 0 0 1 0 0 0 1 0 0 0.00097 0.02828 0.02828 0.00097 0.0000026 0.0218338
Resolução do exemplo numérico 0 1 0 0 0 0 1 0 0 1 0 0 0 1 0 0 0.00097 0.02828 0.02828 0.00097 0.0000026 0.0218338 0.0000259
Resolução do exemplo numérico 0 1 0 0 0 0 1 0 0 1 0 0 0 1 0 0 0.00097 0.02828 0.02828 0.00097 0.0000026 0.0218338 0.0000259 0.0000026
Resolução do exemplo numérico 0 1 0 0 0 0 1 0 0 1 0 0 0 1 0 0 0.00097 0.02828 0.02828 0.00097 0.0000026 0.0218338 0.0000259 0.0000026
Os dados são informativos? “Likelihood-mappingAnalysis” Sinal em forma de árvore: 1,2,3 Sinal em forma de rede (parcialmente resolvido): 4,5,6. Sinal em estrela: 7
Os dados são informativos? No estudo citado, a maior parte dos pontos está próximo ao centro dos triângulos, mostrando que os dados são incapazes de resolver o problema.