380 likes | 571 Views
Metody molekulární biologie v ekologii a systematice rostlin 8 . Mikrosatelity. Petr Koutecký & Jiří Košnar, 2011. Mikrosatelity - úvod. Mikrosatelity (SSR = S imple S equence R epeat; STR = S hort T andem R epeat; SRS = S imple R epetitive S equence)
E N D
Metody molekulární biologie v ekologii a systematice rostlin 8. Mikrosatelity Petr Koutecký & Jiří Košnar, 2011
Mikrosatelity - úvod Mikrosatelity (SSR = Simple Sequence Repeat; STR = Short Tandem Repeat; SRS = Simple Repetitive Sequence) • jeden z typů tzv. variabilních repetitivních DNA sekvencí (VNTR = Variable Number Tandem Repeat) • jednotkou je opakující se sekvenční motiv = repetice, např. (CA)n: CTTGGCGAGCACACACACACACACACACACGGTGACATCTCC • motivem mono-, di- (AT, AG), tri- (GAA, AGT),... až hexanukleotidy • variabilní počet opakování motivu: ~3-100 • motivy >10 repetic obvykle vysoce variabilní
Mikrosatelity - úvod Další typy repetitivních sekvencí: satelity – dlouhé motivy (2-)100-300(-několik tisíc) bp, velký počet opakování motivu (1000-100000 a více); okolí centromér chromozomů, tvoří heterochromatin minisatelity – středně dlouhé motivy ~10-60bp, menší počet opakování než satelity (~20-50); subtelomerní (koncové) části chromozomů nebo centromery; využití - RFLP genomové DNA a hybridizace s minisatelitní sondou, nebo arbitrární PCR s primery s minisatelitním motivem – obdoba ISSR) mikrosatelit minisatelit
Mikrosatelity - úvod Charakteristika • u rostlin jsou nejčastější motivy (A)n, (AT)n, (GA)n, (GAA)n • převážně jaderné, A/T motivy i v chloroplastu (ale nižší variabilita) • klasifikace repeats: • simple perfect – čisté opakování motivu, ideální případ (viz výše uvedené příklady) • imperfect (interrupted) – např. (GT)3A(GT)6 • compound– např. (GA)4N12(CA)8
Mikrosatelity - úvod Charakteristika • vysoce variabilní → populační genetika, studie blízce příbuzných taxonů • jaderné SSR jsou kodominantní • specifický marker pro určitý druh nebo skupinu druhů • vysoce reprodukovatelné
Mikrosatelity – princip metody Provedení metody • PCR amplifikace konkrétního SSR lokusu: nutné znát primery z okolí SSR – tzv. flanking regionu: forward primer ► ◄ reverse primer • možnost tzv. multiplex PCR: do jedné reakce namíchány primerové páry pro více lokusů (každý pár naamplifikuje specificky svůj lokus) • primerové páry se ale nesmí příliš lišit parametry PCR amplifikace (teplota nasedání primerů, délka elongace apod.)
Mikrosatelity – princip metody Provedení metody • délková variabilita výsledného PCR produktu odráží počet opakování motivu (repetic) • je hodnocena pomocí fragmentační analýzy (FA, jeden z primerů daného lokusu značen fluorescenční barvou), případně denaturačním PAA elektroforézou FA - 3 barevně odlišené lokusy + size standard (červeně) PAA(data z 1 lokusu)
Mikrosatelity – princip metody Odečítání SSR alel: • u diploidů (nebo haploidní fáze živ. cyklu) lze přesně odečíst, které alely (=délkové varianty) jsou v genomu přítomny • nutné znát délku repetice (mono-, di-, tri- atd. nukleotid) • zohlednit tzv. stutter bands: artefakty PCR, sklouzáváním polymerázy (polymeráza ale nejčastěji tvoří fragmenty správné délky → převládají nad artefakty); ztěžují interpretaci lokusů s >~20 repeticemi homozygot je, když: nápadně nejvyšší pík je napravo, reálná alela = nejvyšší pík alely: 161+161 (stutter bands) (vzdálenost stutter bands = délka repetice, např. 2bp) ostatní patterny → heterozygot!
Mikrosatelity – princip metody Odečítání SSR alel: heterozygot: reálné alely jsou dva nejvyšší píky alely: 152+160 ! heterozygot: reálné alely jsou dva nejvyšší píky vpravo(alely se liší o délku depetice – 161 a 163; delší 163 svými stuttery navyšuje píky směrem nalevo) alely: 161+163
Mikrosatelity – princip metody Odečítání SSR alel: • u některých lokusů mohou být A-produkty: terminální transferázová aktivita Taq polymerázy → na konec PCR produktu přidává A 152 nemůže být druhou alelou heterozygota: nesedělo by násobkům dinukleotidové repetice!!! homozygot (A-produkty) alely: 151+151 (vzdálenost A-produktů od alely příp. klasických stutter bands = 1bp) alely: 161+163 (pro srovnání - heterozygot bez A-produktů) (2bp)
Mikrosatelity – princip metody Odečítání SSR alel: • u vyšších ploidií často nemožné přesně odečíst konstituci alel např. když u tetraploida vidíme 2 alely - 160 a 162, tak může být: 2x(160)+2x(162) 3x(160)+162 160+3x(162) • skóruje se např. jako dominantní (absence/presence, matice 0/1)
Jak získat sekvence mikrosatelitních primerů? • z publikací nebo databází: x předpokladem je, že někdo už s daným organismem pracoval • pokud není dostupné přímo pro náš cílový organismus, můžeme zkusit primery navržené pro příbuzné druhy = cross-species amplification • pokusit se vyvinout vlastní, tzv. izolace SSR
Jak získat sekvence mikrosatelitních primerů? Cross-species amplification: • s rostoucí evol. vzdáleností klesá úspěšnost • obvykle nutná optimalizace podmínek PCR, ne všechny lokusy se podaří naamplifikovat, případně neamplifikují všechny vzorky = tvoří tzv. nulové alely (mutací v místě nasedání primerů) • i pokud primery amplifikují, může mít lokus např. sníženou variabilitu: primery izolované z mechu Scorpidium cossonii –např. lokus (GT)16: testován u Hamatocaulis vernicosus – nedostatečná variabilita, pouze 5 repetic:
Jak získat sekvence mikrosatelitních primerů? Izolace SSR: • několik různých protokolů • tvorba SSR-enriched genomic library (obohacené knihovny) • pomocí AFLP markerů • pomocí ISSR markerů • z EST library – expressed sequence tag: total mRNA → cDNA → hledání SSR a design primerů SSR z okolí kódujících oblastí → větší šance na úspěšnou cross-species amplification • možné využít i komerční služby • vše většinou relativně finančně náročné (~40 tis. Kč a více)
Jak získat sekvence mikrosatelitních primerů? Příprava SSR-enriched genomic library Izolace většího množství (~10-20 µg) kvalitní genomové DNA Restrikce genomové DNA na fragmenty které lze sekvenovat (~500-1000 bp) + restr. enzym Na konce fragmentů navázány ligací krátké dsDNA fragmenty (linkery) s arbitrární sekvencí - umožní pozdější PCR amplifikaci a ligaci při klonování + T4 ligáza, linkery
Jak získat sekvence mikrosatelitních primerů? Příprava SSR-enriched genomic library K fragmentům přidána biotinylovaná sonda nesoucí určitý SSR motiv → naváže se (hybridizuje) na fragmenty s daným SSR motivem teplotní denaturace + sonda Magnetické mikročástice (beads) pokryté streptavidinem → vazbou streptavidin-biotin vychytají fragmenty se SSR → vlastní SSR-enriched library (obohacená knihovna) + roztok streptavidin-coated beads separace magnetem odsátí roztoku
Jak získat sekvence mikrosatelitních primerů? Zpracování SSR-enriched genomic library Fragmenty z enriched library se namnoží PCR (sekvence linkerů slouží jako PCR primery) a zaklonují → separace jednotlivých molekul Klony screenovány sekvenací (případně předběžné ověření Southern blotting s příslušnou SSR sondou) Design primerů, jejich PCR testování - zda netvoří nulové alely, zda jsou dostatečně variabilní…
Jak získat sekvence mikrosatelitních primerů? Vypadá to (relativně) snadně, ale: • ne všechny SSR sondy na daný organismus fungují... • jen zlomek (~5-15%) fragmentů obohacené knihovny nese skutečně SSR... • část SSR nepoužitelných - příliš krátké nebo naopak příliš dlouhé, případně složité compound motivy... • ne pro všechny fragmenty se podaří nadesignovat primery... • ne všechny navržené primery skutečně fungují na vzorcích ...
Jak získat sekvence mikrosatelitních primerů? Komerční služby: • např. osekvenování celého cílového genomu pomocí 454-pyrosekvenování (~45 tis. Kč, ale cena 1 sekvence je ~200x nižší než při klasickém sekvenování Sangerovou metodou): • získá se velké množství (desítky tisíc) sekvencí o délce ~550 bp, zlomek z nich obsahuje SSR • nebo stejným způsobem osekvenovat vlastní SSR-enriched library (efektivnější než sekvenace genomu - vyšší výtěžek SSR fragmentů) • firmy často poskytnou i navržené primerové kombinace
Vyhodnocení mikrosatelitových dat • Kodominantní • základní statistiky viz přednáška allozymy • počet alel, polymorfní lokusy,… • podíl heterozygotů, He, HW rovnováha,… • Nulové alely • mutace v místě nasedání primerů • nevzniká žádný produkt, jedinec hodnocen jako homozygot • podhodnocení počtu heterozygotů • lze odhalit jen při křížení / analýze potomstva
Vyhodnocení mikrosatelitových dat • U vyšších ploidií problém s určením počtu alel heterozygotů • AAAB vs. AABB vs. ABBB • prakticky nelze z intenzit píků / proužků! • Co s tím? • kódovat přítomnost / nepřítomnost alely = binární data • ztráta informace • za předpokladu allotetraploidie a pokud převažují vzorky s 1-2 alelami kódovat jako diploida • automaticky předpokládá AABB • problém, pokud jsou 3- nebo 4-alelické vzorky • možné zkreslení výsledků • pravděpodobnostní výpočty, odhady frekvence alel • např. program ATETRA
Mutační modely • Diferenciace mezi populacemi – analogie FST, výpočet gene- tických vzdáleností,… • Infinite alleles model (IAM) • všechny alely rovnocenné, stejná rychlost jejich tvorby • stejně dlouhé alely jsou homologické • toto se používá pro isozymy, ISSR, AFLP,… • Stepwise mutation model (SMM) – nejčastěji používaný • alely vznikají postupně mutacemi o 1 krok (repetici), stejná rychlost v obou směrech (prodloužení × zkrácení) • alely s podobnou délkou jsou si příbuznější • možná homoplazie (alela vzniká přidáním nebo zkrácením) • koeficient RST, resp. jeho odhad ρST,distance D1, Da, (δμ)2 • Two-phase model (TPM) • změna o jednotku rychlostí p, o více jednotek rychlostí 1-p
dvě populace Cymodoce nodosa Arnaud-Haond et al. 2005J. Heredity 96: 434-440 Identifikace klonů • Multilokusové genotypy, shoda = klon (?) • výpočet pravděpodobnosti, že stejný genotyp vznikle nezávisle pohlavním rozmnožováním • statistika PSEX (PGEN) (Parks & Werth 1993, Am. J. Bot.) • počítáno z frekvence alel a polymorfních lokusů a počtu vzorků • klony = pouze pokud PSEX < 0.05 (nebo jiná hranice) • clonal diversity: R = (G – 1) / (N – 1) (pro 1 klon pak vyjde 0) • Různá rozlišovací síla • počet lokusů • jejich variabilita (počet a frekvence alel)
Populační studie – ochranářská Betty & Provan 2011, Ann. Bot. 107: 663–670 • Monotropa hypopitis v Sev. Irsku • 8 lokusů, průměr 14 alel / lokus • F-statist., AMOVA, určení klonů • překvapivě velký počet klonů, malý podíl vegetativního rozmn. • FIS: v některých populacích hodně autogamie • He: ochuzení proti střední Evropě • mírná diferenciace mezi populacemi → nemíchat materiál, outbreeding depression struktura populace, pole = 10 cm
Populační studie - invazní Huotari et al. 2011, Plant Syst. Evol. 294: 27-37 • Elodea canadensis ve Finsku • předpoklad: klonální (dvojdomý, vv Evropě chybí ♂), 1 zavlečení • 7 popul., 10 lokusů, 2-5 alel / lokus • zákl. statistiky, RST, pairwaise FST,AMOVA, STRUCTURE • 181 vzorků / 80 multi-locus genotypes • skoro 80% variability uvnitř populací, diferenciace mezi pop., potvrzuje i STRUCTURE (2 hlavní skupiny) • rozdíly proti americkým populacím (někt. lokusy se ani neamplifikují) → možná relativně rychlá evoluce • vícenásobné zavlečení × evoluce somatickými mutacemi ?
Rozmnožovací systém – šíření pylu Kettle et al. 2011, Persp Plant Ecol. Evol. Syst. 13: 45–51 • tři různé Dipterocarpaceae na Borneu na ploše řádu km2 • liší se velikostí květů → velikost opylovačů → vzdálenost roznosu pylu; očekávána korelace genetické struktury a roznosu pylu (roznos semen nehraje roli, těžká) • 6 lokusů, 5-17 alel / lokus • klasické statistiky; BAPS+STRUCTURE; prostor. autokorelace; kinship coefficient kinship coefficient pravděpodobnost, že alela v daném páru vzorků má stejný původ (rodiče) sourozenci 0.25, nevlastní s. 0.125 Loiselle et al. 1995, Am. J. Bot. 82: 1420-1425 počítán z frekvencí alel a počtu jedinců přes všechny páry jedinců a všechny lokusy, korekce na konečnou velikost populace permutační test
Rozmnožovací systémy – šíření pylu Kettle et al. 2011, Persp Plant Ecol. Evol. Syst. 13: 45–51 • převažuje cizosprášení, FIS ~ 0 • zřetelná autokorelace u 2 druhů s menšími květy → vysvětlitelné doletem opylovačů • pouze u Parashorella tomentella detekována gen. struktura -klíčí v porostních mezerách, zdroj semen omezený na okolní porost → shluky podobných jedinců
Klonalita + rozmnožovací systém Zipperle et al. 2011, Ann. Bot. 107: 127–134 • porost Zostera noltii na pří-livových plošinách v Baltu • trvalka, ale velký obrat ramet a náhrada ze semen • hermafrodit, hydrogamní, předpokládáno opylovánív rámci „fleku“ (klonu) → inbreeding • plocha 100m2, 256 plodných lodyh, analýza dosp. + semena • 9 lokusů, klonální struktura, F-statist., hetero-zygozita, původ semen (MLTR, Cervus)
Klonalita + rozmnožovací systém Zipperle et al. 2011, Ann. Bot. 107: 127–134 • vysoká míra cizosprášení (~ 90%), zbytek převážně auto- a geitonogamie, velmi málo biparental imbreeding (opylení od jiného, ale příbuzného jedince) • semena v rámci květenství většinou mají různé otce • ale jen 50% vajíček je oplodněno – vysvětlováno obecně nedostatkem pylu (třeba 104-105 zrn na jedno vajíčko) • efektivní vzdálenost šíření pylu je pouze několik m • dále je v článku diskutován vliv režimu disturbancí na rozmnožování a přežívání populace…
Hybridizace Snow et al. 2010, Am. J. Bot. 97: 2061–2067 • Typha latifolia (pův.), T. angustifolia (pův?, zavlečená), T. ×glauca (invaz) v Americe • kříženec údajně sterilní, silně klonální • starší studie 30 druhově specifických RAPD,nyní 9 SSR primerů, 7 druhově (±) specifické • FST, STRUCTURE, morfometika • F1 hybridi kombinují alely od obou rodičů • existují zpětní hybridi (→ není to sterilní) • potvrzuje i morfologie
Vývoj areálu / fylogeografie Kuss et al. 2011, Persp Plant Ecol. Evol. Syst. 13: 101–110 • Campanula thyrsoides v Alpách, 2 poddruhyJV Alpy × zbytek (S obvod Alp) • 51 populací, 5 lokusů • populační variabilita, STRUCTURE, AMOVA,výpočet hranic v programu Barriershttp://www.mnhn.fr/mnhn/ecoanthropologie/software/barrier.html • zjištěny 3 významnější zlomy v geneticképodobnosti namapování gen. nepo-dobností sousedů výběr nejvyšší hodnoty,protažení hranice kokrajům; další kolo,… bootstrap (100 matic)
Vývoj areálu / fylogeografie Kuss et al. 2011, Persp. Plant Ecol. Evol. Syst. 13: 101–110 • 4 genetické skupiny, 1výrazně jiná (JV poddruh) • hranice skupin souhlasís programem Barriers • asi alopatricky se vyvíje-jící skupiny + pozdějšíkontakt a tok genů • souvislost s přežitím zalednění (2 poddruhy, v severním asi více refugií) • …ale populace z potenciálně refugiálních míst (stanovených podle jiných prací) nejsou geneticky bohatší, rozdíly možná později setřeny genovým tokem
Fylogeneze, vymezení taxonů • pro fylogenezi používat mikrosatelity opatrně: • relativně málo znaků • homoplazie • neznáme rozmístění lokusů v genomu, lokus je „bodová“ informace (i méně než 1 sekvenovaný úsek!) • podmínky použití • velké množství lokusů (→ šance pokrýt různá místa genomu) • ideálně fyzická mapa (většinou nemáme) • hlavně u blízkých druhů a na nižších úrovních • použití pro vymezení (kryptických) druhů / linií: Ramaiya et al. 2010, Am. J. Bot. 97: 1707–1718 • játrovka Frullania asagrayana, sekvenčně zcela uniformní, ale SSR ukazují na přítomnost 2 linií
Fylogeneze Bowles et al. 2011, Plant Syst. Evol. 287: 85–97 • rod Carthamus, hrubá fylogeneze a identifikace příbuzných užitkového druhu C. tinctorius • ITS a 11 nekódujících úseků cpDNA – z těch jen 2 variabilní • rozlišeny 2 hlavní sekce rodu, vztahy uvnitř nich nejasné • některé druhy nejsou podlesekvencí monofyletické – asi důsledek hybridizace / introgrese • někt. druhy také allopolyplodi C. lanatus
Fylogeneze Bowles et al. 2011, Plant Syst. Evol. 287: 85–97
Fylogeneze Bowles et al. 2011, Plant Syst. Evol. 287: 85–97 • celkově nedostatečná variabilita sekvencí • vyvinuto 23 mikrosatelitových lokusů • analýza sekce Carthamus, druh z druhésekce jako outgroup • výpočet distanční matice, NJ strom • druh C. oxyacanthus (jeden zmožných předků) jasně odlišený • předkem C. tinctorius asi C. palaestinus • pozice C. persicus nejasná (jen 1 vzorek) C. tinctorius
Fylogeneze Bowles et al. 2011, Plant Syst. Evol. 287: 85–97
Software • MSA (Microsatellite Analyzer) http://i122server.vu-wien.ac.at/MSA/MSA_download.html • MICROSAT http://hpgl.stanford.edu/projects/microsat/ • The Excel Microsatellite Toolkithttp://www.animalgenomics.ucd.ie/sdepark/ms-toolkit/ kontrola dat, převod do formátů pro Arlequin, Microsat, Fstat,… • ATETRA http://www.vub.ac.be/APNA/ATetra.html odhad frekvencí alel a genotypů u tetraploidů • Cervus http://www.animalgenomics.ucd.ie/sdepark/ms-toolkit/ frekvence alel, parentage analysis (kodominantní data, diploidi) • Genclone http://www.ccmar.ualg.pt/maree/software.php?soft=genclon identifikace multilokusových genotypů, výpočet Psex, kinship coefficient,…