240 likes | 384 Views
Stanovení genetické vzdálenosti. ( Na základě molekulárně biologických dat ). Obsah. Metody výpočtu genetických vzdáleností na základě sekvenačních dat Nepřímé metody výpočtu genetických vzdáleností ze sekvencí Výpočty genetických vzdáleností na podkladě jiných typů znakových dat
E N D
Stanovení genetické vzdálenosti (Na základě molekulárně biologických dat)
Obsah • Metody výpočtu genetických vzdáleností na základě sekvenačních dat • Nepřímé metody výpočtu genetických vzdáleností ze sekvencí • Výpočty genetických vzdáleností na podkladě jiných typů znakových dat • Měření genetických vzdáleností experimentálními metodami 2
Obsah • Metody výpočtu genetických vzdáleností na základě sekvenačních dat • Nepřímé metody výpočtu genetických vzdáleností ze sekvencí • Výpočty genetických vzdáleností na podkladě jiných typů znakových dat • Měření genetických vzdáleností experimentálními metodami 3
Dvě základní metody: • Měření vzdálenosti mezi dvojicemi OTU • Hybridizace DNA • Imunologické metody • Výpočtem z dat znakového charakteru • Sekvence DNA • DNA fingerprinting metody ( RAPD, RFLP) • Restrikční mapování • Isoenzymy
Vzdálenosti ze sekvencí DNA • Provedeme alignment sekvencí • Spočteme podíl neshodných míst • p = počet neshodných míst / délka sekvence • Provedeme korekci na vícenásobné mutace • Jukes Cantorova metoda (jednoparametrová) • K = -3/4 ln(1 - 4/3p) • Kimurova metoda (dvouparametrová) • K = ln (1/(1 -2P -Q)) + 1/4 ln(1/(1 - 2Q)) • P -proporce transicí, Q -proporce transverzí
Odhad počtu mutací od okamžiku divergence ACTGAACGTAACGC C T G C T T T C Koincidence Zpětná substituce Jednoduchá substituce Vícenásobná substituce K = 12, p = 3 6
Jukes-Cantorův jednoparametrový model Jukes,T.H. Cantor, C.R. (1969) In: Mammalian protein metabolism. Munro,H.N. (Ed.) Acad.Press, New York α A G α α α α C α T Odhad podílu substitucí od okamžiku divergence K = -3/4 ln(1 - 4/3 p) Odhad rozptylu K V(K) = (p(1 -p))/(L(1 - 4/3 p)2) 7
Dvouparametrový Kimurův model: Kimura,M. (1980) J.Mol.Evol. 16: 111-120. α A G β β β β C T α Odhad podílu substitucí od okamžiku divergence K = 0,5 ln(a) + 1/4 ln(b) a = 1/(1 - 2P - Q) b = 1/(1 -2Q) Odhad rozptylu K V(K) = [a2P + c2Q -(aP +cQ)2]/L c = (a + b)/2 L= délka sekvence P - transice, Q -transverse
Další metody výpočtu genetických distancí • Tajima-Nei 1984 (bere v úvahu nestejné frekvence jednotlivých nukleotidů) • Gojobori 1982 (šestiparametrový model) • Tamura-Nei 1993 (šestiparametrový model) • Lanave 1984 (devítiparametrový (12?) model) • Lake 1994 (aditivnost distancí -paralineární d.) • Lockhart 1994 (LogDet) (paralineární)
Porovnání jednotlivých metod Modely s větším počtem parametrů jsou flexibilnější a většinou přesnější než metody jednoduché. Obsahují však často větší množství předpokladů a pro kratší úseky dávají horší výsledky. Někdy je nelze použít (např kvůli dělení nulou či logaritmování nuly). Simulace ukázala, že pro K< 0,5 dávají poměrně přesné výsledky i nejjednoduší metody (Jukes-Cantor, Kimura). Pro větší distance (a dostatečně dlouhé sekvence) je lépe použít Lanave, Gojobori či Tamura-Nei. Pro K > 1 však tyto metody často nelze použít, v takovém případě lze doporučit Tajima-Nei.
Výpočet distancí pro úseky kódující proteiny Používané algoritmy berou v úvahu, že nesynonymní mutace bývají fixovány jinak často, než mutace synonymní (pro většinu genů méně často). Nejčastěji se využívá metoda, kterou vyvinul Li v roce 1985 a modifikoval v roce 1993. Je třeba vždy brát v úvahu, jaký genetický kód daný organismus používá (universální x mitochondriální x jiné kódy). Výsledkem výpočtu je Ks a Ka (frekvence synonymních a nesynonymních mutací).
Vzdálenost na podkladě sekvencí proteinů Při výpočtu se bere v úvahu podobnost či odlišnost zaměněných aminokyselin. Většinou se vychází z empiricky sestavených tabulek frekvencí jednotlivých typů záměn (20 x 20). Odhady genetické vzdálenosti jsou podstatně přesnější. Porovnáváme-li kódující úseky DNA je vždy výhodné přeložit je do sekvence proteinu a počítat podobnosti proteinů. Nutno využívat specielní programy (např. MEGA).
Obsah • Metody výpočtu genetických vzdáleností na základě sekvenačních dat • Nepřímé metody výpočtu genetických vzdáleností ze sekvencí • Výpočty genetických vzdáleností na podkladě jiných typů znakových dat • Měření genetických vzdáleností experimentálními metodami
Z počtu shodných restrikčních míst 1. Sestavíme restrikční mapy pro každou OTU 2. Pro každou dvojici sekvencí (x, y) spočteme všechna restrikční místa (Mx, My) a dále místa vyskytující se v obou sekvencích ( Mxy) 3. Vypočteme podíl shodných restrikčních míst S = 2Mxy/(Mx + My) 4. Vypočteme odhad podílu nukleotidů, ve kterých se sekvence neshodují p = 1 - S1/r r -délka restrikčního místa 5. Vypočteme odhad počtu mutací z počtu neshodných nukleotidů, (např. J-C metodou) K = -3/4 ln(1 - 4/3p)
Z podobnosti RFLP (RAPD) vzoru 1. Pro každou dvojici sekvencí (x, y) spočteme všechny fragmenty (Mx, My) a dále fragmenty vyskytující se v obou elektroforetogramech (Mxy) 2. Vypočteme podíl shodných fragmentů S = 2Mxy/(Mx + My) 3.Vypočteme odhad pravděpodobnosti, že fragment zůstane od okamžiku divergence obou sekvencí nezměněn (G) metodou postupných iterací G = (S (3 - 2G))1/4 G0 = S1/4, obvykle stačí 5-7 iterací 4. Vypočteme odhad podílu substitucí z G K = (2/r)ln(G)
Z podobnosti RAPD vzoru Koeficient genetické vzdálenosti dle. Nei a Li 1979, PNAS 76, 1979 Pro každou dvojici sekvencí (x, y) spočteme všechny fragmenty (Mx, My) a dále fragmenty vyskytující se v obou elektroforetogramech ( Mxy) Vypočteme podíl shodných fragmentů I = 2Mxy/(Mx + My) a z něj distanci NLD= 1- I Jiné možnosti: Jednoduchý koeficient shody SMC nebo Jaccardův koeficient (teoreticky méně vhodné ale...).
Příklad na výpočet vzdálenosti z podobnosti RFLP vzorů DNA štěpena BamHI, EcoRI, HindIII(r = 6) Aegilops sharonensis -čtyři fragmenty(Ms=4) Aegilops bicornis -pět fragmentů(Mb=5) Počet společných fragmentů - jeden(Msb=1) S = 2Mxy/(Mx + My) = 2/9 = 0,222 G0 = S1/4 = 0,2221/4 = 0,687 G = (S (3 - 2G))1/4 : G = 0,687, 0,775, 0,753, ... 0,758 K = (2/r)ln(G) = (2/6)ln(0,758) = 0,092
Příklad výpočtu počtu substitucí Délka sekvence200 bp, transicí:20, transversí4 L=200, P=20/200=0,1, Q=4/200=0,02 Kimura: K= 0,5 ln (1/(1 -2P -Q)) + 1/4 ln(1/(1 - 2Q)) = = 0,5 ln(1/(1-0,2 -0,02)) + 1/4 ln(1/(1-0,04)) = 0,13 Jukes-Cantor: p=24/200=0,12 K = -3/4 ln(1 - 4/3p)=0,13 L=200, transice:50, transverse:16 KimuraK=0,48, Jukes-CantorK=0,43
Obsah • Metody výpočtu genetických vzdáleností na základě sekvenačních dat • Nepřímé metody výpočtu genetických vzdáleností ze sekvencí • Výpočty genetických vzdáleností na podkladě jiných typů znakových dat • Měření genetických vzdáleností experimentálními metodami
Genetická vzdálenost dvou populací vypočtená z frekvence alel Rogersova vzdálenost (pro alely 1..i) R= (0,5 Σ(xAi - xBi)2)0,5(1 lokus) Pro víc lokusů -aritm. průměr z R Neiovská vzdálenost D= -ln I , I= Σ xiyi/(Σ xi2 Σyi2)0,5) Pro víc lokusů:I=Jxy /(JxJy)0,5Jxy, Jxa Jy jsou postupně aritm. průměry zΣxiyi, Σ xi2 a Σ yi2pro všechny lokusy
Obsah • Metody výpočtu genetických vzdáleností na základě sekvenačních dat • Nepřímé metody výpočtu genetických vzdáleností ze sekvencí • Výpočty genetických vzdáleností na podkladě jiných typů znakových dat • Měření genetických vzdáleností experimentálními metodami
Přímé metody zjišťování genetických vzdáleností Imunologické Zkřížené imunologické reakce Metody kvantifikace (KFR, ELISA, precipitační techniky, RIA) DNA hybridizace Na membráně V roztoku
DNA hybridizace Výpočet rozdílu středních teplot tání homoduplexů a heteroduplexu ∆Tm=((TmA + TmB)/2) - Tms Výpočet odhadu podílu neshodných pozic p = c ∆ Tm c = 0,01 - 0,015 Výpočet odhadu podílu substitucí od okamžiku divergence obou OTU K = -3/4 ln(1 - 4/3 p)
Závěry 1. Existuje řada metod pro určení genetických vzdáleností na základě znakových dat, ať již přímých, nebo nepřímých (přepočtem) 2. Volba určitého koeficientu genetické vzdálenosti může podstatně ovlivnit přesnost našich výsledků, zejména při výpočtu délky větví, topologie stromu často správná i při použití nejjednodušších metod 3. Ne vždy je nejsložitější metoda i tou nejlepší, vzhledem k ceně je však obvykle účelné vyzkoušet více možností