420 likes | 561 Views
Molekul ární ekologie. Molekulární data. Molekulární data. "Genetic yardstick". Molekulární data. Molekulární data. Molekulární data. Jaké množství a variabilitu znaků poskytuje genetická informace?. Molekulární data. Jaké množství a variabilitu znaků poskytuje genetická informace?.
E N D
Molekulární ekologie Molekulární data
Molekulární data "Genetic yardstick"
Molekulární data Jaké množství a variabilitu znaků poskytuje genetická informace?
Molekulární data Jaké množství a variabilitu znaků poskytuje genetická informace?
Molekulární data Jaké množství a variabilitu znaků poskytuje genetická informace? Debata mezi „classical and balanced schools“ dospěla k potvrzení vysoké úrovně polymorfismu a následně formulování neutrální teorie – dobrá zpráva, bude dost znaků…
Molekulární data Jaké množství a variabilitu znaků poskytuje genetická informace? Debata mezi „classical and balanced schools“ dospěla k potvrzení vysoké úrovně polymorfismu a následně formulování neutrální teorie – dobrá zpráva, bude dost znaků… ….ještě bude zajímavé, jaké množství variability bude ukryto na další úrovni, tedy v DNA…
Molekulární data Jaké množství a variabilitu znaků poskytuje genetická informace?
Molekulární data Lidský genom: cca 3,4 Gb např. 30 bialelických markerů = 330 možných genotypů Jaké množství a variabilitu znaků poskytuje genetická informace?
Molekulární data Prokaryotický genom
Molekulární data Prokaryotický genom - 16S rRNA
Molekulární data unikátní „idiosynkratické“ znaky multigenové a multilokusové informace sekvence celých genů, velké množství kompletních mt genomů Eukaryotický genom
Molekulární data Eukaryotický genom mtDNA • jediný matrilineárně předávaný lokus • Nerekombinující - ??? • Rychlá molekulární evoluce • Nejčastěji využívané sekvence: • 16S rDNA • gen pro COI • gen pro cytochrom b • control region (D-loop) • Velké množství kompletních sekvencí v Genbank NCBI - mitogenomika
Molekulární ekologie Eukaryotický genom mtDNA Microcebus murinus (Maki trpasličí) D-loop sekvence 47 odlišných haplotypů
Molekulární data Eukaryotický genom mtDNA • Heteroplasmy • Paternal leakage • Recombination
Molekulární data Mitochondriální dědičnost mitochondriální bottleneck heteroplasmie důsledek vysoké mutační rychlosti, ve velkých populacích a parental leakage.
Molekulární data Mitochondriální dědičnost Rekombinace ve 14% z 279 testovaných souborů mtDNA u živočichů
Molekulární data Mitochondriální dědičnost heteroplasmie
Molekulární data Mitochondriální dědičnost A co mitochondriální Eva?
Molekulární data Eukaryotický genom jaderná DNA Potenciálně obrovské množství informace. Jak vybrat tu správnou a jak ji získat?
Molekulární data Eukaryotický genom jaderná DNA • Nejdříve trochu terminologie • Kódující vs. nekódující DNA • Bialelické vs. multialelické znaky (markery) • Dominantní vs. kodominantní markery • Ortologní vs. paralogní geny • Exon vs. intron • Haplotypy
Molekulární data Markery • Ideální marker: • Početný a rozšířený přes celý genom • S dobře prostudovanými vlastnostmi molekulární evoluce • Data přenosná a porovnatelná mezi a studiemi (laboratořemi) • Technicky (a finančně) dostupný i pro velké vzorky (populace). • ……a musejí být selekčně neutrální?? • Problém modelový vs. nemodelový organismus
Molekulární data Markery Vznik nových mutací, gene trees (μ) změny frekvencí alel (drift, Ne)
Molekulární data Markery Vznik nových mutací, gene trees (μ) gene trees vs. organism tree Potřeba většího množství informace z různých částí genomu
Molekulární data orthology paralogy „proužkové“ homologie Markery problém homologie alignment (matice)
Molekulární data TGTTAATTACACGGCG forward 5’ 3’ 3’ 5’ reverse PCR 5’ – GAATCATCCGGACCAGGCTTA---------AAGATTTCGCCGTGTAATTAACA– 3’ 3’- CTTAGTAGGCCTGGTCCGAAT --------- TTCTAAAGCGGCACATTAATTGT - 5’ Většina současných metod získávání molekulárních dat je nějakým způsobem závislá na PCR a tedy kvalitě primerů.
Molekulární data RFLP
Molekulární data RAPD
Molekulární data Nové a výkonné technologie sekvenování umožňují vývoj markerů z celých genomů. 3.0 Gb 35mer 500Mb 300-500bp higher error rate for homopolymers >2.0 Gb 35 bp reads S rostoucím počtem markerů se zvyšuje přesnost analýz. Ale! : zároveň klesá míra jejich nezávislosti….!
Molekulární data Typy genomických dat a jejich využití • Nuclear Protein Coding Loci (NPCL) • Vysoce konzervované v důsledku funkčního konstraintu. • Obvykle je k dispozici kompletní anotace umožňující identifikovat paralogy a ortology, popřípadě repetitivní elementy. • Vzácné ztráty a získávání těchto genů v genomech. • Při vzrůstajícím počtu kompletních genomů se zjednodušuje příprava a testování primerů. • Ale mohou být pod silnou selekcí. • Exon-primed Intron-crossing (EPIC) Markers • Dostatečně variablní avšak umožňující postavení konzervativních („univerzálních“) primerů. • Typicky introny s přilehlými konzervativními sekvencemi exonů. • Markery nazývané Comparative anchor tagged sequences (CATS), Traced orthologous amplified sequence tags (TOASTs) a sequence-tagged sites (STS). • Anonymous Nuclear Markers (ANMs) • Obvykle náhodné úseky genomu, většinou nekódující. • Vysoká substituční rychlost a tedy většinou značná variabilita. • Ale obvykle nedostatečně anotované – nejistota z hlediska paralogů, množství kopií, atd. Často se také „trefí“ do různých repetitivních sekvencí, například SINE, LINE.
Molekulární data Anonymous Nuclear Markers Exon-primed Intron-crossing nuclear protein coding Typy genomických dat a jejich využití
Molekulární data Typy genomických dat a jejich využití
Molekulární data ESTs - expressed sequence tags
Molekulární data ESTs - expressed sequence tags
Molekulární data ESTs - expressed sequence tags
Molekulární data Nejčastější zdroje populačních multilokusvých dat Mikrosatelity AFLP SNP
Molekulární data Mikrosatelity nebo také simple sequence repeats (SSR), variable number tandem repeats (VNTR), short tandem repeats (STR). flanking region opakování 1-6 bp motivu (v kódujících sekvencích nejčastěji 3 a 6) není náhodným seskupením nukleotidů – příliš frekventované obvykle považované za neutrální markery multialelické, kodominantní – vysoká rozlišovací schopnost • Obtížná detekce a příprava primerů (druhově specifické) – pro některé taxony velmi obtížná • Problém nulových alel • Mutační rychlost – homoplasie • Druhově specifické – nehrozí kontaminace jinou DNA • Krátké – lze využít i degradovanou DNA popřípadě DNA ze srsti apod. (neinvazivní metoda)
Molekulární data Mikrosatelity homoplasy detectable undetectable ATA TATATATATAT
Molekulární data Existují mikrosatelity pro blízký druh? (obvykle ale dojde ke snížení diverzity a problémům s „ascertainment bias“ • Izolace DNA • Vytvoření knihovny • Separace fragmentů s repeat sequences • Sekvenování fragmentů, identifikace • a statistické vyhodnocení mikrosatelitů linker PCR s primery speciickými pro linker komerční služba linker ATATATAT – magnetická sonda ATATATAT Mikrosatelity Detekce a izolace mikrosatelitů pro nový druh
Molekulární data Mikrosatelity Detekce a izolace mikrosatelitů pro nový druh Existují mikrosatelity pro blízký druh? (obvykle ale dojde ke snížení diverzity a problémům s „ascertainment bias“ komerční služba
Molekulární data • Není příliš znám mutační proces – problém s některými typy statistického zpracování: • Obdoba FST pro mikrosatelity, RST, je parametr závislý na modelu Mikrosatelity Detekce a izolace mikrosatelitů pro nový druh S přibývajícím množstvím dat v GenBank se objevila možnost vyhledávání vhodných mikrosatelitů in silico (EST databáze)