130 likes | 313 Views
BEST. Bayesian Estimation of Species Trees (Liang Liu). (Species tree z BESTu horsi rozliseni (pokud je signal slaby nebo odlisny u jednotlivých genů)). Species tree : all divergences of species pairs must occur after the respective gene divergences occur. Multilokusový dataset v BESTU.
E N D
BEST Bayesian Estimation of Species Trees (Liang Liu)
(Species tree z BESTu horsi rozliseni (pokud je signal slaby nebo odlisny u jednotlivých genů)) • Species tree: all divergences of species pairs must occur after the respective gene divergences occur
Multilokusový dataset v BESTU • Každý gen jede svoje vlastní Bayesovské hledání • Pro každé zaznamenávané generace jsou i zapisovány species trees – jakýsi konsensus z dosažených…
Zdroj – volný freeware • http://www.stat.osu.edu/~dkp/BEST/ • exe prográmek, který je vlastně mírně upravený MrBayes (přidané funkce)
Vstupní soubor: Nutné: Definovat outgroup Definovat jednotlivé geny Definovat model pro každý gen Definovat skupiny taxonů (tj. je-li více sekvencí z jednoho druhu…) Klasický nexus file, příkazy jako pro MrBayes. Pro mitochondrii napsat „ploidy = haploid“!!!
Vstupní soubor II: Nastavení priors pro Bayesovskou analýzu: Thetapr = parametr theta (velikost populace) pro výpočy z populační genetiky GeneMuPr = interval rozdílné mutační rychlosti použitých genů = je nutné, máme-li nejvíce mutující gen 10x rychlejší než nejméně mutující, aby interval byl takový, že větší číslo bude alespoň 10x násobek menšího (absolutní hodnoty jsou doporučené cca takto: Mitochondrie třikrát menší Nezávislé počítání pro každý gen: topologie, délek větví, mutační rychlosti a ostatních parametrů Klasické parametry pro Bayesovskou analýzu: 120 milionů generací, 2 runy po 3 řetězcích, frekvence ukládání stromů
Výstupní soubor: Species trees navržené během Bayesovské analýzy, mohou být dále hodnoceny jako klasické .t files z MrBayes (příkazem sumt) Soubory ovzorkovaných stromů pro jednotlivé geny (4 geny, 2 runy pro každý) Program mbbest.exe – musí být ve stejné složce…
Výstup – četnost species tree • Ukázka dřívějších postupů při hledání species trees (zde výběr nejčetnějšího stromu ze všech nalezených pro 106 kvasinkových genů; Edwards, et al., 2006, PNAS)
Hodnocení stability větví v průběhu runu • Mělo by být více generací než u konkatenátu v MrBayesovi (Edwards – 80 miliónů) Toto je stabilita jednotlivých kládů během runu BESTu, jde o dataset antarktických ryb, které ovšem nejsou příliš variabilní a geny nenesou příliš silný fylogenetický signál; zde run do 110 miliónů generací. Burnin byl 10 miliónů.
Pro porovnání stejný dataset jako konkatenát v MrBayesovi:
(Species tree z BESTu horsi rozliseni (pokud je signal slaby nebo odlisny u jednotlivých genů)) Konkatenát MrBayes BEST