280 likes | 426 Views
Gena- og gagnas öfn (GEG1103). Fyrirlestrar 7 & 8 Einföld pörun, dýnamísk forrit. Lesefni. Gibson & Muse: kafli 2 (einkum Box 2.1) Krane & Raymer: kafli 2. Hvernig bestum við pörun?. Tvær raðir: X og Y |X| = m; |Y| = n ef göt eru meðtalin, |X| = |Y| m+n
E N D
Gena- og gagnasöfn (GEG1103) Fyrirlestrar 7 & 8 Einföld pörun, dýnamísk forrit
Lesefni • Gibson & Muse: kafli 2 (einkum Box 2.1) • Krane & Raymer: kafli 2
Hvernig bestum við pörun? • Tvær raðir: X og Y • |X| = m; |Y| = n • ef göt eru meðtalin, |X| = |Y| m+n • „Brute Force“:2m+n mögulegar raðir X, 2m+n Y! 2m+n * 2m+n = 2(2(m+n)) = 4m+n samanburðir • Ópraktískt!
„Dynamic Programming“ • Aðferð tölvunarfræðinnar til bestunar • Verkefnið er brotið upp í smærri „undirverkefni“ sem leyst eru hvert um sig (divide&conquer!) • Recursive algorithm (rakning?)
„Dynamic Programming“ • KS/AS raðir henta vel fyrir DP • „Undirverkefni“: pörun raðarbútanna á undan (5´ / N við) • Hvert undirverkefni er leyst einu sinni og skor þess geymt í matrixu • Skor í hverjum punkti byggist á besta skori þangað til • Þrjú skref: • uppsetning • skorun • rakning (pörun)
Dæmi1: „Needleman-Wunsch algoriþmi“ Röð #1: GAATTCAGTTA; m = 11 Röð #2: GGATCGA; n = 7 s(aibj) = +5 ef ai = bj (match-skor) s(aibj) = -3 ef aibj (mismatch-skor) w = -4 (gap penalty)
Dæmi1: „Needleman-Wunsch algoriþmi“ Þrep 1: uppsetning Si,0 = w * i S0,j = w * j s(aibj) = +5 ef ai = bj (match-skor) s(aibj) = -3 ef aibj (mismatch-skor) w = -4 (gap penalty)
Dæmi1: „Needleman-Wunsch algoriþmi“ Þrep 2: skorun Si,j = MAX[ Si-1, j-1 + s(ai,bj) Si,j-1 + w Si-1,j + w ] s(aibj) = +5 ef ai = bj (match-skor) s(aibj) = -3 ef aibj (mismatch-skor) w = -4 (gap penalty)
Dæmi1: „Needleman-Wunsch algoriþmi“ Þrep 2: skorun Si,j = MAX[ Si-1, j-1 + s(ai,bj) Si,j-1 + w Si-1,j + w ] s(aibj) = +5 ef ai = bj (match-skor) s(aibj) = -3 ef aibj (mismatch-skor) w = -4 (gap penalty)
Dæmi1: „Needleman-Wunsch algoriþmi“ Þrep 2: skorun Si,j = MAX[ Si-1, j-1 + s(ai,bj) Si,j-1 + w Si-1,j + w ] s(aibj) = +5 ef ai = bj (match-skor) s(aibj) = -3 ef aibj (mismatch-skor) w = -4 (gap penalty)
Dæmi1: „Needleman-Wunsch algoriþmi“ Þrep 2: skorun Si,j = MAX[ Si-1, j-1 + s(ai,bj) Si,j-1 + w Si-1,j + w ] s(aibj) = +5 ef ai = bj (match-skor) s(aibj) = -3 ef aibj (mismatch-skor) w = -4 (gap penalty)
Dæmi1: „Needleman-Wunsch algoriþmi“ • Þrep 3: Rakning (traceback) pörun (alignment) • Rakið til baka frá endareit, sem inniheldur SM,N (maximum global alignment score), hér = 11 • Elta örvarnar
Dæmi1: „Needleman-Wunsch algoriþmi“ G A A T T C A G T T A | | | | | | G G A – T C – G - — A • Þrep 3: Rakning (traceback) pörun (alignment) • Rakið til baka frá endareit, sem inniheldur SM,N (maximum global alignment score), hér = 11 • Elta örvarnar
Passar skorið? G A A T T C A G T T A | | | | | | G G A – T C – G - — A + - + - + + - + - - + 5 3 5 4 5 5 4 5 4 4 5 5 – 3 + 5 – 4 + 5 + 5 – 4 + 5 – 4 – 4 + 5 = 11 s(aibj) = +5 ef ai = bj (match-skor) s(aibj) = -3 ef aibj (mismatch-skor) w = -4 (gap penalty)
Dæmi 2: „Smith-Waterman algoriþmi“ • • „Local“ pörun - gerir kleyft að finna einnig stutta búta sem matcha innan lengri raða • • Getum notað sömu skorunartöflu • Notum ekki negatívar tölur í matrixunni (breytum í 0)
Dæmi 2: „Smith-Waterman algoriþmi“ Þrep 1: uppstilling
Dæmi 2: „Smith-Waterman algoriþmi“ Þrep 2: skorun S1,1 = MAX[S0,0 + 5, S1,0 - 4, S0,1 – 4,0] = MAX[5, -4, -4, 0] = 5
Dæmi 2: „Smith-Waterman algoriþmi“ • S1,2 = MAX[S0,1 -3, S1,1 - 4, S0,2 – 4, 0] = MAX[0 - 3, 5 – 4, 0 – 4, 0] = MAX[-3, 1, -4, 0] = 1 Þrep 2: skorun
Dæmi 2: „Smith-Waterman algoriþmi“ S1,3 = MAX[S0,2 -3, S1,2 - 4, S0,3 – 4, 0] = MAX[0 - 3, 1 – 4, 0 – 4, 0] = MAX[-3, -3, -4, 0] = 0 Þrep 2: skorun
Dæmi 2: „Smith-Waterman algoriþmi“ Þrep 3: rakning Finnum hæsta skorið í töflunni =maximum local alignment score Ef > 1 reitur með hæsta skor fleiri en ein „besta röðun“
Dæmi 2: „Smith-Waterman algoriþmi“ Þrep 3: rakning Rekjum frá besta skori
Dæmi 2: „Smith-Waterman algoriþmi“ Þrep 3: rakning
Dæmi 2: „Smith-Waterman algoriþmi“ Þrep 3: rakning
G A A T T C - A | | | | | G G A T – C G A + - + + - + - + 5 3 5 5 4 5 4 5 G A A T T C - A | | | | | G G A – T C G A + - + - + + - + 5 3 5 4 5 5 4 5 Dæmi 2: „Smith-Waterman algoriþmi“
Affine Gap Penalty • Í raun er líklegra aðgöt séu stærri og færri heldur en fleiri og minni • wx = g + r(x-1) • wx : total gap penalty; g: gap open penalty; r: gap extend penalty; x: lengd gats • gap penalty valin með skorunarmatrixu að viðmiði • Dæmigerð gildi: g=-12; r = -4
Hvað er svo að marka þetta? • Finna út líkur á að ttk. pörun verði fyrir tilviljun • # parana sem skora a.m.k. S: E = Kmn e-lS • m,n: lengd raðanna • K ,l: tölfr.l. parametrar sem ráðast af skorunarkerfi. Fyrir PAM250: K = 0.09; = 0.229
P-gildi • Líkindi þess að ttk. S-skor fáist fyrir tilviljun P = 1 – e-E
Sumarverkefni • Umsóknarfrestur í Nýsköpunarsjóð Námsmanna er 10. mars • Verkefni á sviði sameindalíffræði og örveruvistfræði (með Náttúrufræðistofnun Íslands), 1 – 2 nemendur + rannsóknamaður (Jenny Coe). • Bakteríusamfélög á fléttum, fjölbreytni og hlutverk. • Vettvangsvinna: söfnun og greining fléttusýna • Rannsóknastofuvinna: PCR + DGGE eða SSCP (hugsanlega klónun og raðgreining) • Heimildavinna: örveruvistfræði, sambýli baktería og sveppa/þörunga, sameindalíffræðileg þýðisgreining • Önnur verkefni?