330 likes | 612 Views
GEG1103 Bioinformatics (Gena- og gagnasöfn). Fyrirlestur 1: Kynning á námskeiðinu og faginu Stakrænt eðli erfðagagna. Oddur Þ. Vilhelmsson stofu 248 í Borgum oddurv @unak.is s ími: 460 8503. Námskeiðslýsing. GEG1103 Gena- og gagnasöfn 3 ein. (6 ECTS) Umsjón: Oddur Vilhelmsson
E N D
GEG1103Bioinformatics (Gena- og gagnasöfn) • Fyrirlestur 1: • Kynning á námskeiðinu og faginu • Stakrænt eðli erfðagagna Oddur Þ. Vilhelmsson stofu 248 í Borgum oddurv@unak.is sími: 460 8503
Námskeiðslýsing GEG1103 Gena- og gagnasöfn 3 ein. (6 ECTS) Umsjón: Oddur Vilhelmsson Kennarar: Oddur Vilhelmsson, Nikolai Gagunashvili, Starri Heiðmarsson Forkröfur: ERF1103 Erfðafræði og TFR 2103 Tölfræði, eða sambærileg námskeið. Lýsing: Kirna- og amínósýruraðir: eiginleikar þeirra og tölfræðileg úrvinnsla. Breytileiki, samsætutíðni og stofnasamsetning. Tengslagreining og kortlagning genamegja. Einföld og margföld pörun raða. Pörunarskorun og gæði pörunar. BLAST algoriþminn: notkun hans og túlkun niðurstaðna. Upprunaflokkun og gerð skyldleikatrjáa. Raðgreining heilla genamengja. Notkun genasafna og genamengjasafna. ENSEMBL genamengjasafnið. Námskeiðið er kennt á ensku. Námsmarkmið: Nemandinn mun í skriflegu prófi og verklegum æfingum sýna fram á greinagóðan skilning á undirstöðuatriðum lífgagnavinnslu, þ.m.t. eðli og eiginleikum lífgagna og notkun þeirra til að vinna líffræðilegar upplýsingar upp úr lífgagnasöfnum. Að nemandinn verði fær um að skilja eðli og uppbyggingu hinna ýmsu gerða lífgagna og lífgagnasafna og öðlast færni í notkun þeirra við skyldleika-, byggingar- og kennigreiningu. Kennslufyrirkomulag: Námskeiðið er kennt á formi fyrirlestra og dæma-/æfingatíma. Allir fyrirlestrar og dæma-/æfingatímar eru teknir upp í Windows Media Encoder og verða aðgengilegir nemendum í gegn um heimasíðu námskeiðsins, http://staff.unak.is/not/oddurv/GEG1103/ . Til verkefnaúrlausna munu nemendur þurfa að verða sér úti um forritið Staden Package, sem nálgast má hér: http://staden.sourceforge.net/
Námsmat • Verklegar æfingar og heimadæmi: 20% • Sjálfstætt Verkefni: 10% • Skriflegt próf: 70%
Lesefni „Kennslubók“: Gibson & Muse: A Primer of Genome Science. Sinauer. Sunderland. 2004. ISBN 0878932321. Genamengi, gagnasöfn, raðgreining, breytileiki, tjáningamengi. Vefsíða: http://www.sinauer.com/genomics/ Aðrar bækur (á bókasafni): Mewes et al.: Bioinformatics and genome analysis. Springer Verlag. Berlín. 2002. Kafli um stýrlaleit. Kafli um „metabolic networks“ (hvarfefnamengi). Salemi & Vandamme: The phylogenetic handbook. Cambridge University Press. Cambridge. 2003. Ítarleg bók um upprunaflokkun. Krane & Raymer: Fundamental concepts of bioinformatics. Benjamin Cummings. San Francisco. 2002. Kaflar um upprunaflokkun og kynning á prótínmengjagreiningu. Appendix 1 gefur inngang að PERL. Campbell & Heyer: Discovering genomics, proteomics, & bioinformatics. Benjamin Cummings. San Francisco. 2003. Umritamengjagreining. Kynning á klínískri lífgagnavinnslu. Greinar ...........verða aðgengilegar á WebCT heimasvæðinu.
Raðavinnsluforrit http://staden.sourceforge.net/
Raðavinnsluforrit Ef Staden Package líkar ekki, má reyna: http://www.mbio.ncsu.edu/BioEdit/bioedit.html
Námsefni • Almennt um genagögn, erfðamengi og gagnasöfn • Raðavinnsla • Tölfræðilegar aðferðir og stofnerfðafræði • Einföld / margföld pörun raða (pairwise / multiple sequence alignment) • Upprunaflokkun (phylogeny) • Shotgun-raðgreining og greining erfðamengja dreif- og heilkjörnunga • Kerfalíffræði (systems biology) ef tími leyfir Nánar:http://staff.unak.is/not/oddurv/GEG1103/
Verklegt • Æfingar og heimadæmi (20%): • Raðavinnsla í tölvu (Staden Package) • Þáttapörunaræfingar með BLAST og öðrum aðferðum • Æfingar í stofnerfðafræði og upprunaflokkun?? • Niðurstöður skilist á formi heimadæmis/einfaldrar „skýrslu“ • Verkefni (10%): • Sjálfstætt gagnavinnsluverkefni • Fáið eða útvegið gögn sem mega vera: • MALDI-TOF MS peptíðmassaróf á trypsínrofsafurðum • N-enda amínósýruraðarbúta úr Edman raðgreiningu • DNA röð úr genomic raðgreiningu • cDNA röð úr transcriptomic raðgreiningu • Skilist á formi skýrslu sem uppfyllir kröfur og reglur auðlindasviðs (sbr. reglur um frágang lokaverkefna)
Hvað er bioinformatics? • Bioinformatics = lífupplýsingatækni? lífgagnavinnsla? • Bioinformatics computational biology? • sjá t.d. skilgreiningu Wikipediu • Söfnun, geymsla ogúrvinnsla stakrænna (discrete) líf(efna)fræðilegra gagna • Kirnaraðir, amínósýruraðir, MS-róf, GC-róf, NMR-róf, XRD-gögn, ...
Hvað er bioinformatics? Tekið af vef Washington University in St. Louis
Til hvers læra bioinformatics? • Mikilvæg tækni • við bæði • hagnýtar og • grunn-rannsóknir • Mörg störf í boði • í líftækni- og • lyfjaiðnaði • Efst á lista yfir • “Hot Jobs” hjá • SmartMoney.com http://smartmoney.com/consumer/index.cfm?story=working-june02
Af hverju er bioinformatics „Hot“? • Ttl. fáir hafa góð tök á bæði líffræði og tölvunarfræði • Á umliðnum árum hafa mörg genóm verið raðgreind: Mikið magn upplýsinga sem eftir er að vinna úr • Öflugt rannsóknatæki sem skilar verðmætum upplýsingum með ttl. litlum tilkostnaði
Hvað þarf að kunna? Hafa sérfræðiþekkingu í einu af eftirfarandi fögum: • Sameindalíffræði • Tölvunarfræði • Tölfræði ... og góðan grunn í hinum
Hvar má komast í framhaldsnám í bioinformatics? • Hér má sjá lista yfir háskóla sem bjóða ýmsar gráður í Bioinformatics: http://www.iscb.org/univ_programs/program_board.php • Háskólinn á Akureyri???
Upplýsingaflæði í lífverum • Grunn-kennisetning sameindalíffræðanna: • Upplýsingar flæða frá genum til umrita til prótína til vinnu • Stjórnað af hormónum, stýrlum, o.m.fl. • Að skilja stjórnunarferlin er eitt helsta viðfangsefni sameindalíffræðanna
3 mengi stórsameinda • Genamengi (genome) • óbreytilegt (statískt) í hverri lífveru • hentar við t.d. skyldleikagreiningu • Umritamengi (transcriptome) • Prótínmengi (proteome) • breytileg milli vefja og með tíma • sýna hvað lífveran er að gera
Stjórnun lífefnaræðilegra ferla getur átt sér stað á stigi • Umritunar • Þýðingar • Prótínummyndana • Komplexsmíðar • Ensímvirkni • Prótínniðurbrots
Framtíðarsýn: Hagnýt erfðamengjagreining • Genamengi lífshættulegrar, áður óþekktrar veiru er einangrað og raðgreint • Gagnabankar eru skannaðir gegn genamenginu og veiran kennigreind • Genamengið er þýtt yfir í tjáðar AS raðir og borin kennsl á mikilvægt prótín • Þrívíð bygging prótínsins er afleidd (með samanburði við þekktar prótínbyggingar eða ab initio) og virkniset fundin • Fundnir líklegir kandidatar sem lyf sem unnið geta á prótíninu og þar með veirunni úr Lesk, 1. kafla
Gagnavinnsla • Raðgreining gefur gögn sem eru nákvæm, magnbundin og stakræn(discrete) • „teljanleg“ gögn • henta vel í tölulega vinnslu • tölvur „hugsa“ stakrænt • Gríðarlega mikið magn! 1 huge (HUman Genome Equivalent) er 3,2 X 109 basapör • verður að nota skilvirka algóriþma
Erfðafræði - upprifjun • Genasamsæta (allele) - gen í sama gensæti á samsvarandi (homologous) litningi • eru samsvarandi (homologous) en ekki einsleitar (identical) • tjá sömu virkni (en e.t.v. mis-vel) • Ef bæði genin eru einsleit (þ.e. sama samsæta), þá er lífveran arfhrein (homozygous) gagnvart því geni. • Ef lífveran hefur mismunandi samsætu í samsvarandi gensætum er hún arfblendin (heterozygous) gagnvart því geni blendingur (hybrid) • Kynfrumur (gametes) innihalda aðeins aðra samsætuna blendingurinn skilar aðeins annarri samsætunni til afkvæmis
Erfðafræði - upprifjun • Gregor Johann Mendel (1822-1884): munkur í Tómasarklaustrinu í Brno á Mæri • Baunagrasið (Pisum sativum) er sjálffrjóvgandi planta - hvert blóm hefur bæði frævil (stamen) og fræblað (carpel) • Víxlfrjóvgun (cross-fertilization): fræflar fjarlægðir og frjóum úr annarri plöntu stráð yfir fræblaðið • Mendel valdi tvo stofna baunagrass - annar gaf alltaf fjólublá blóm, hinn alltaf hvít - og víxlfrjóvgaði • Köllum þetta kynslóð P • Öll afkvæmin (í fyrstu afkvæmiskynslóð, F1) báru fjólublá blóm
Erfðafræði - upprifjun • F1 sjálffrjóvguð: • 3/4 (705) afkvæma (kynslóð F2) fjólublá, 1/4 (224) hvít • Í F3 voru öll afkvæmi hvítra blóma hvít, sömuleiðis öll þeirra afkvæmi • 1/3 fjólubláu blómanna, gáfu einnig alltaf af sér fjólublá blóm í eftirfarandi kynslóðum, en 2/3 gáfu af sér aftur 3/4 fjólublá og 1/4 hvít • Hvernig má skýra þessar niðurstöður?
Erfðafræði - upprifjun • Segjum að til sé gen sem eitt ræður lit blómsins • Tvær samsætur (allele) • Önnur, P, gefur fjólublá blóm sé hún til staðar í a.m.k. einu eintaki. Hún er ríkjandi (dominant) • Hin, p, gefur hvít blóm, en aðeins ef plantan er arfhrein fyrir p. Hún er víkjandi (recessive) • Gefur rétt hlutföll ef eiginleikinn (trait) stjórnast af aðeins einu geni. • Arfgerð (genotype) samsætusamsetning lífverunnar (t.d. Pp) • Svipgerð (phenotype) eiginleikinn sem arfgerðin stjórnar (t.d. fjólublátt blóm)
Erfðafræði - upprifjun • Punnett ferningur (Punnett square): hentug aðferð til að spá fyrir um hlutföll arfgerða og svipgerða • Röðum kynfrumum við lárétta og lóðrétta ás ferningsins (t.d. egg lárétt og sæði lóðrétt) • Fyllum inn arfgerðir • Teljum svipgerðir
Punnett ferningur • Virkar einnig með fleiri gen ef þau erfast óháð hvort öðru (þ.e. eru á mism. litningum) • Lögmál Mendels um óháða samröðun (independent assortment)
„Klassísk“ (Mendelsk) erfðagögn • Svipgerðargögn (phenotypic data). Lýsing á lífverunni. Sjaldnast stakrænt, en leiða má út arfgerð (genotype) Samsætusamsetning er stakræn. • Stakrænir eiginleikar forsenda tölfræðilegrar úrvinnslu í erfðafræði • Ríkjandi og víkjandi samsætur. Stakrænt ... en galli að ekki er hægt að þekkja í sundur arfblendna (heterozygous) og ríkjandi arfhreina (dominant homozygous) einstaklinga • Ekki alltaf vandamál, t.d. ef jafnríki (codominance) Tafla úr Weir, B. S. (1996) Genetic Data Analysis 2.
Jafnríki (codominance) Tíðni á Íslandi • Í þýði finnast margar samsætur af hverju geni • Mögulegt að einstaklingur hafi tvær ríkjandi samsætur (dæmi: fólk í AB blóðflokki) 32% 11% 2% 55%
Allózím (ísózím) • Afurðir mismunandi samsæta sama gens geta haft mismunandi hleðslu • getum aðgreint með rafdrætti (IEF) • Getum ákvarðað beint samsætuhlutfall í stofni A. Differential mobility of Glu1 allozymes in 6% native gel. B. Mobility of Glu2 allozymes in 6% native gel. Mynd frá www.agron.missouri.edu
Um skerðiensím • Skerðiensím (restriction enzymes): sértækir núkleasar sem klippa DNA við ákveðnar kenniraðir (restriction sites) sem oftast eru samhverfur (palindrome) • Bakteríur vernda eigið DNA gegn niðurbroti af völdum eigin skerðiensíma með metýlun • Mörg mismunandi (>2000) skerðiensím þekkt • Ef kirnaröð plasmíðs er þekkt, má lesa nákvæmlega stærð þeirra búta sem myndast þegar það er melt með ttk. skerðiensími EcoRI
RFLP • DNA klippt með skerðiensímum og rafdregið • Restriction Fragment Length Polymorphism • Teljum bútana stakræn gögn • Getum notað við kortlagningu gena, kennigreiningu lífvera o.fl. Mynd frá www.bioteach.ubc.ca
Polymerase Chain Reaction • Kary Mullis – Nóbelsverðlaun 1993 • Viljum milljónir kópía af DNA röðinni sem verið er að klóna • Smíðaðir prímerar (vísar) • DNA hitað þar til það “bráðnar” (ca. 95°C) • Við kælingu (oftast 50-60°C) bindast prímerar • DNA polymerasi afritar (við 72°C ef Taq er notaður) frá prímernum • Endurtekið ca. 30 – 40 sinnum
Polymerase Chain Reaction • Fáum endanlegan fjölda PCR afurða • Lengd í „skömmtum“ (kirnum) • Stakrænt Mynd frá www.biotech.sfasu.edu
Raðgreining og raðagögn • Megin-viðfangsefnið í þessum kúrsi • Allar stökkbreytingar (nema stökkbr. + afturbreyting) sjást í röðinni • Stakræn gögn: öll gen samsett úr margfeldum af 4 stökum: C, G, A og T (eða U) • Gögn: gerð (C, G, A eða T) og sæti í geni/litningi (stundum einnig röð [hver er gerð staka á undan/eftir staki n])