1 / 40

Metodologie molekulární fylogeneze a taxonomie hmyzu Bi7770 Andrea T óthová

Metodologie molekulární fylogeneze a taxonomie hmyzu Bi7770 Andrea T óthová. MODULARIZACE VÝUKY EVOLUČNÍ A EKOLOGICKÉ BIOLOGIE CZ.1.07/2.2.00/15.0204. Dva pohledy genomiky. Verti k ální : kompletné genomy, hluboké, ale omezené informace několik druhů a jedinců

keiko-gill
Download Presentation

Metodologie molekulární fylogeneze a taxonomie hmyzu Bi7770 Andrea T óthová

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Metodologie molekulární fylogeneze a taxonomie hmyzu Bi7770 Andrea Tóthová MODULARIZACE VÝUKY EVOLUČNÍ A EKOLOGICKÉ BIOLOGIE CZ.1.07/2.2.00/15.0204

  2. Dva pohledy genomiky • Vertikální: kompletné genomy, hluboké, ale omezené informace • několik druhů a jedinců • úspěšně ukončeno u člověka, Drosophily a některých plodin • Horizontální: krátké cílené sekvence, plytké, ale široké informace • mnoho druhů a jedinců • např. DNA barcoding

  3. Historické výzvy • Problémy s konceptem druhu a jeho aplikacemi • Problémy s druhovou identifikací • Systém znaků – morfologie, genetika, atd. • Přístup k existujícím informacím • Snižování odbornosti • Snižování dostupných služeb • Genomika a Internet nabízí nové možnosti

  4. Asociace vývojových stádií, zpracovaných částí a dimorfických pohlaví

  5. DNA barcode je krátká genová sekvence standardizované části genomu použitá k druhové identifikaci Systém čárového kódu

  6. Interné ID pro všechny organizmy na Zemi

  7. Příklad: Afričtí motýli Tvoří species komplexy Jejich parazitoidi (Tachinidae) také (Dittrich et al 2006) Leguminivora ptychora na luštěninách je také species komplex Ale někteří škůdci jsou široko rozšíření, např. Spoladea recurvalis a Maruca vitrata

  8. Rychlé a efektivní • Čeleď Sphingidae – vzorky 49 druhů za 6 měsíců (téměř kompletní lokální fauna) • DNA barcoding rozlišil druhy jak v lokálním, tak v globálním měřítku • Místní knihovny můžou být rychle srovnány a přispět ke globálním knihovnám

  9. Jak Barcoding funguje Tvorba referenční knihovny: • Správně určený jedinec (vouchers) • Vzorek tkáně • DNA extrakce, PCR amplifikace • DNA sekvenování • Odeslání dat do GenBanku Použití referenční knihovny : • Neurčené druhy • Tkáň, DNA, sekvenování • Srovnání s referenčními sekvencemi

  10. Jak se to vše děje od jedince přes sekvenci po druh?

  11. Produkce dat v r. 2007 PCR amplifikační jednotka ABI 3100 sekvenátor Stovky vzorků denně, cena od několika centů po dolary

  12. Produkce dat v r. 2008 Rychlejší a přenosnější systém – stovky vzorků za hodinu Stolní mikrofluidné systémy Integrované DNA mikročipy

  13. Produkce dat v budoucnosti? • Získání dat kdekoli, hned • Cena několik haléřů • Link do referenční databáze • Taxonomická GPS • Použitelné nespecialisty

  14. CBOL – organizace členů od r. 2008 Více než 170 organizací z více než 50 zemí (z toho 54 organizací z 20 rozvojových zemí)

  15. Mise CBOLu: uvést DNA Barcoding jako globální standard 1. Vyvinout a zvednout standardy komunity 2. Barcode projekty plnit databáze 3. Globalní participace a koordinace 4. Přijetí taxonomickou komunitou 5. Koordinace s jinými oblastmi vědy 6. Přijetí regulačními agenturami 7. Vyvíjení produktů soukromými společnostmi

  16. Propojení GenBanku s vouchery

  17. Ceratopogonidae – 105 barcoding sekvencí

  18. Globální projekty CBOL • Fish Barcode of Life (FISH-BOL) - 30 000 mořských/sladkovodných druhů do r. 2010 • All Birds Barcoding Initiative (ABBI) - 10 000 druhů do r. 2010 • Tephritidae – 2 000 škůdců/prospěšných druhů do r. 2008 • Komáry - 3 300 druhů do r. 2008 • Ohrožené druhy • Trees of the world

  19. Staré a nové techniky • CBOL staví na současných taxonomických poznatcích • Sequence knihovny založeny na voucher jedincích, co dělá vědu opakovatelnou a testovatelnou • Voucher jedince propojují historické, současné a budoucí výzkumy • Příklad: CSIRO studie na bzučivkách mapující rezistence na insekticidy a zjišťování historie pomocí DNA z muzejních jedinců (PNAS 103: 8757)

  20. DNA Taxonomie – pomoc při řešení problému nebo vnášení chaosu? První záznamy COI do GenBanku – 1996, od té doby ca. 1000 sekvencí dvoukřídlých V současnosti – ca. 153 000 popsaných druhů dipter – méně než 1% je zařazeno do „Barcoding procesu“ COI nevhodný pro odlišení blízkých druhů Stanovení hranic druhu – podobnost sekvencí (pairwise distances) - PROBLÉM Fylogenetická rekonstrukce příbuzenských vztahů – možné řešení – multigenový přístup Světové sbírky hmyzu – nemožnost použít materiál pro analýzy - PROBLÉM Taxonomie založená výlučně/převážně na DNA analýze – zkreslený pohled Potřeba propojit s ostatními přístupy – INTEGRATIVNÍ TAXONOMIE

  21. GenBank • http://www.ncbi.nlm.nih.gov/genbank/ • Několik databází – Nucleotide, Protein, PubMed, CoreNucleotide, Structure, Genome, etc. • Věrohodnost sekvencí vyšší než v databázích CBOLu • Součástí je BLAST - „multialign tool“

  22. Po zadání hesla – Insect…

  23. BLAST http://blast.ncbi.nlm.nih.gov/Blast.cgi

  24. FLY TREE 2004-2008, 30 mil. USD, 649 taxonů, desítky tisíc bp

  25. OUTPUTS

  26. MEGA v. 5 – úprava sekvencí (alignment)

  27. Fylogenetické analýzy Fylogenetický strom – hypotéza, která vznikla co nejlepším odhadem na základe omezeného zdroje informací Metody FA – dva přístupy 1. Algoritmus – jde přímo k výsledku, co je jediný strom (odpadá srovnání vzájemně si konkurujících stromů) – metody shlukové analýzy (UPGMA), Neighbour-joining (NJ) – obě využívají data vzdáleností (distance) 2. Kritérium optimálnosti – dva kroky – definování kritéria, podle kterého je hodnocen každý strom určitým skóre, které se použije k následnému srovnání všech stromů - použití specifického algoritmu pro výpočet funkce (kritérium optimálnosti) a pro získání stromu s nejlepší hodnotou této funkce

  28. Jaká by měla vybraná metoda být? Výkonnost – „tempus fugit“ nebo „time is money“ pomoc – heuristické metody hledání v případe vyššího počtu taxonů či znaků Síla – kolik dat musíme shromáždit, aby byly výsledky správné Konzistence – s pridáváním dalších znaků spějeme k správnému výsledku Robustnost – do jakej míry vedou drobné odchýlky od vstupných předpokladů k nesprávným závěrům Falzifikovatelnost – určení nevhodnosti modelu na základě odchýlky od předpokladu IDEÁLNÍ METODA NEEXISTUJE…

  29. Metoda maximální parsimonie – úspornosti (MP) Jedna z nejpoužívanějších metod - rychlá, jednoduchá preferuje jednoduší hypotézy před složitějšími (široká filozofická platnost), tzn. vybere možnost (strom) s minimálním počtem evolučních kroků nutných k vysvětlení vstupních dat Ne všechny znaky jsou použitelné, parsimony - informative + Dobrá pochopitelnost, jednoduchost, rychlost, nízký počet předpokladů (předpokládá, že jakákoli evoluční změna je vzácná, takže MP strom se dá považovat za nejlepší odhad skutečné evoluce) - Nekonzistentnost, přitažlivost dlouhých větví (LBA)

  30. Metoda maximální pravděpodobnosti (Maximum likelihood, ML) - posuzují se jednotlivé hypotézy o evoluční historii zkoumaných taxonů z hlediska pravděpodobnosti, že jsou v souladu se získanými daty, výsledek – maximálně pravděpodobný odhad Tři součásti - vstupné data evoluční model fylogenetický strom s topologií i délkou větví + Nízka náchylnosť k chybě, robustnost vůči odchýlkám - Vysoká výpočetní náročnost

  31. Bayesian inference Výpočet pravděpodobnosti na základě specifikovaného modelu a na základě toho, co jsme o charakteru dat zjistili Základ – strom s danou topologií a délkami větví, model nukleotidových substitucí a rozložení substitučních frekvencí mezi jednotlivými nukleotidy Princip přístupu jako u ML VÝHODY – menší časová náročnost, strom zohledňující fylogenetický signál v datasetu, možnost použít i pro smíšený dataset

  32. Distanční metody Založené na podobnostech (vzdálenostech, rozdílech) Poznání skutečné evoluční vzdálenosti mezi všemi členy studovaného souboru taxonů umožňuje velmi lehkou rekonstrukci evoluční historie těchto taxonů Opakované změny jednoho znaku – korigované distance (jako u pravděpodobnosti) Nekorigovaná vzdálenost – p-distance Korekce: JC, F81, K2P, F84, GTR

  33. Předpříprava • Úprava sekvencí (Sequencher) • Vytvoření alignmentu (MEGA) - .fas, .nex • Analýza MP (Paup) • Analýza NJ (Paup, MEGA) • Vytvoření souboru pro MrModeltest (PAUP) • MrModeltest • Příprava souboru pro MrBayes • Ukázka práce s SequenceMatrix pro velké datasety

More Related