790 likes | 957 Views
Bayesian Inference of Phylogeny. T. Bayes, Phil. Trans. Roy. Soc. , 330 (1763). p ( Ti | S ) probability of the tree Ti given the sequence data S p ( S | Ti ) probability or likelihood of the data S given tree Ti p ( Ti) prior probability of Ti
E N D
Bayesian Inference of Phylogeny T. Bayes, Phil. Trans. Roy. Soc., 330 (1763). p(Ti|S) probability of the tree Tigiven the sequence data S p(S|Ti) probability or likelihood of the data S given tree Ti p(Ti)prior probability of Ti “The denominator sums the probabilities over all possible trees”
ESTIMACION BAYESIANA • Inferencias están basadas en la probabilidad de distribución posterior de un parámetro. • La unión de las probabilidades de todos los parámetros son calculados. • Las probabilidades están basadas en algún modelo (esperado a priori), luego de aprender algo de los datos.
ESTIMACION BAYESIANA • ¿Cuál es la probabilidad de tomar un dado trucado? • Respuesta :1/10. • Esta número representa la probabilidad a priori de tomar un dado sesgado.
ESTIMACION BAYESIANA Supongamos ahora que otra persona toma un par de dados de la caja y los tira. Resultando: ¿Podemos creer que este resultado esta sesgado? Dos aproximaciones: Maximum Likelihood e Inferencia Bayesiana.
PROBABILIDADES OBSERVACION NORMALES SESGADOS
PROBABILIDADES PR NORM PR SESG
Pr [Sesgados INFERENCIA BAYESIANA
11 44
posterior a priori
Likelihood Probabilidad a priori Probabilidad a posteriori Σ de todas las probabilidades a posteriori Integración de todas las posibles combinaciones de largo de ramas y modelos de sustitución nucleotídica.
Arboles equiprobables Proporcional a observaciones: supuestos ej. alineamiento Combinación: probabilidades a priori y Likelihood
Estimación de las probabilidades a posteriori : ¿Cómo aproximarse? • Calcular esta probabilidad implica: involucrar todos los árboles posibles….para cada árbol se debe integrar sobre todas las combinaciones de largo de rama y modelos de sustitución nucleotídica. (IMPOSIBLE ANALÍTICAMENTE!!!) • Por necesidad la solución debe ser aproximada • Método de Montecarlo
Monte Carlo y cadenas Markovianas (MCMC) • MCMC trabaja del siguiente modo: • a) Comienza una cadena markoviana con un árbol ya sea 1) elegido al azar o 2) elegido por el investigador. • b) Un nuevo árbol es propuesto….el proceso de cambio del arbol 1 al 2 debe satisfacer las siguientes condiciones: 1) El mecanismo debe ser estocástico; 2) cada arbol posible debe ser obtenido por aplicaciones repetidas del mismo mecanismo y 3) la cadena debe ser aperiodica.