370 likes | 519 Views
BIOINFORMATIKA. Bevezetés Biológiai alapok. Bioinformatika: Biológiai adatok (adathalmazok) kezelése, rendezése Célja: Új következtetések levonása a biológiai rendszerek (élőlények) működésére vonatkozóan (és ezek gyakorlati hasznosítása/ ipar, orvoslás).
E N D
BIOINFORMATIKA Bevezetés Biológiai alapok
Bioinformatika: Biológiai adatok (adathalmazok) kezelése, rendezése Célja: Új következtetések levonása a biológiai rendszerek (élőlények) működésére vonatkozóan (és ezek gyakorlati hasznosítása/ ipar, orvoslás) Tudomány (alap és alkalmazott kutatás) Bioinformatika Üzlet (biotechnológiai ipar, gyógyszeripar) $$$
A kísérleti módszerek fejlődése a biológiai információhalmazok exponenciális növekedéséhez vezetett 1972: A Nature című tudományos folyóirat címlapján egy 174 bp hosszúságú DNS molekula szekvenciája (bázissorrendje) látható. Több éves kutatómunka eredménye. Ma: Egy modern automatizált szekvenáló központban (pl. Sanger Centre) naponta akár több millió bázis sorrendjét is meghatározzák. Ilyen mennyiségű információ nyilván csak informatikai eszközökkel kezelhető. HTS = High Throughput Screening (nagy áteresztőképességű) módszerek. Óriási információtömeget generálnak viszonylag rövid idő alatt. A XXI. században a biológia módszertana alapvetően megváltozott: Informatika nélkül nem lehet a kísérleti eredményeket tárolni, feldolgozni, kiértékelni, értelmezni.
Az élő sejt (szervezet) mint információ forrás „Statikus” információk: információhordozó makromolekulák leltára Pl. DNS, RNS, Fehérje szekvenciák, fehérje térszerkezetek (koordináták) „Dinamikus” információk: génkifejeződési mintázatok Kölcsönhatási hálózatok (microarray, 2D elektroforézis, yeast-two hybrid, egyéb high throughput módszerek)
Információáramlás a makromolekulák között Centrális dogma transzkripció replikáció transzláció fehérje prionok DNS RNS reverz transzkripció genom transzkriptóma proteóma
Systems biology: Rendszer-szemléletű biológia Integráció: Egyedi komponensek (pl. fehérjék) egyedi tulajdonságainak vizsgálata helyett a biológiai rendszer (pl. élő sejt) összes komponensét és azok összes kölcsönhatását tekinti egyszerre. Az ismert egyedi kölcsönhatásokat mintegy „puzzle”-szerűen térbeli és időbeli hálózattá integrálni. Ez pont a fordítottja annak, mint amit a biológusok eddig egy évszázadon keresztül csináltak. Metabolikus útvonalak Szabályozási útvonalak Kölcsönhatási hálózatok
Genom Egy élőlény teljes genetikai állománya (össz. DNS tartalom) Pl. ember: 23 (22+2) kromoszóma + mitokondriális DNS A különböző élőlények genomjai szerkezetükben és információtartalmukban jelentősen eltérhetnek egymástól. 1.) Méret (kbp=1000bp, Mbp=106bp) 2.) Gének száma (génsűrűség= gének száma/genom mérete) 3.) Génszerkezet (intron-exon) 4.) Topológia (lineáris vs. cirkuláris)
C-érték paradoxon A genom mérete önmagában nem fokmérője a biológiai rendszerek fejlettségének (összetettségének)
A gének számától függ egy élőlény komplexitása? G-érték paradoxon *TIME = the amount of time to read the entire genome, at a rate of 1 bp per second.
A GÉN FOGALMA Morgan, XX. század eleje: A gén a kromoszóma egy része (darabja), amely meghatározza az élőlény egy tulajdonságát (fenotípus). Beadle és Tatum, 1940: egy gén - egy enzim hipotézis egy gén – egy fehérje hipotézis egy gén – egy polipeptid Avery, 1944: A gének anyaga DNS. Mai definíció: A gén egy olyan DNS szakasz, amely egy géntermék (polipeptid vagy RNS) szintéziséhez szükséges információt tárolja. A szűken vett definíció csak a struktúrgént jelenti (polipeptid vagy RNS elsődleges szekvenciáját kódoló DNS), a tágabb definícióba beleértjük a regulátor szekvenciákat (promóterek, enhancerek, stb.) is.
A gén Stop kodon TAA, TAG, TGA Start kodon ATG (Met) 5’ „nemkódoló” szakasz promóter, enhancer, riboszómakötőhely, stb Srtuktúrgén ORF: open reading frame Eukarióták esetén intronokat is tartalmaz 3’ „nemkódoló” szakasz poliadeniláció, transzkripciós terminátor, stb.
RNS gének Vannak gének, amelyek olyan RNS-ek szekvenciáját kódolják, amelyek nem fordítódnak le fehérjévé. Riboszómális RNS (rRNS): A legintenzívebben átíródó gének közé tartoznak minden szervezetben (nucleolus = sejtmagvacska). Transzfer RNS (tRNS): A fehérjeszintézishez (transzláció) nélkülözhetetlenek. Kis nukleáris RNS (snRNS): RNS molekulák „érése” (splicing) Kis nukleoláris RNS (snoRNS): 60-300 nt, rRNS processzálás, alternatív splicing, telomeráz RNS, stb. Mikro RNS (miRNS): ~22 nt, Hosszabb prekurzorokból keletkeznek, génkifejeződést szabályozzák: RNS interferencia (Orvosi Nóbel díj, 2006) Ezeknek a géneknek a felépítése jelentősen eltér a fehérjét kódoló gének felépítésétől, ezért sokkal nehezebb őket megtalálni a genomban. Pl. az miRNS géneket csak néhány éve fedezték fel!
A DNS-ben 4 bázis (A,T,G,C) kódolja az információt. Az RNS-ben szintén (A,U,G.C). Három bázis (kódon) felel meg egy aminosavnak a fehérjeszintézis során. Genetikai kód A fehérjéket 20-féle aminosav alkotja. A fehérjék elsődleges szerkezetében (szekvenciájában) kódolva van a háromdimenziós szerkezetük. A kód mibenléte nagyrészt ismeretlen.
Az információáramlás a makromolekulák között (különösen eukarióták esetén) nagyfokú diverzitás forrása Ember: kb. 21000 gén genom transzkripció alternatív splicing mRNS RNS editing transzláció Fehérje poszttranszlációs módosítás Bonyolult anyagcsere hálózat Több mint egymillió különböző géntermék proteóma
RNS szerkesztés / RNA editing Apolipoprotein B 100 (513 kDa) Apolipoprotein B 48 (250 kDa) Az mRNS közepén egy stop kódon keletkezik. A transzláció félúton leáll. citozin dezamináz CAA UAA Gln Stop
Az eukarióta genom felépítése 1.) Gének és szabályozó elemek: exonok és intronok transzkripciós szabályozó elemek (promóter, enhancer, terminátor, stb.) replikációt szabályozó elemek (replikációs kezdőpont) transzlációt szabályozó elemek (start, stop kodon) rekombinációs szekvenciák 2.) Ismétlődő (repetitív szekvenciák): highly repetitive sequences simple sequence DNA centroméra, teloméra satellite DNA Az egér kromoszóma 10%-a. Kevesebb mint 10 bp ismétlődik több milliószor. moderately repetitive transzpozonok (Alu repeat) Az egér kromoszóma 20%-a. Néhány száz bázispár, néhány ezerszer ismétlődik.
Szekvenálási stratégiák 1.) Szisztematikus stratégia: Térképezés restrikciós endonukleázokkal Kis darabok szekvenálása Sanger módszerrel. A teljes DNS molekula összeállítása a térkép alapján. (Lassú de biztos módszer.) 2.) Sörétes puska (shotgun) stratégia: A nagy DNS molekulák összetörése (mechanikai stressz, ultrahang) véletlenszerűen kis darabokra. Kis darabok szekvenálása. Kis darabokból az átfedések felhasználásával a teljes DNS molekula összeállítása (puzzle). Problémák: Minimum 10-szer annyi nukleotidot kell leolvasni, mint a DNS mérete. (Még így is maradnak gap-ek.) Az ismétlődő (repetitív) szekvenciák az összeállítást bizonytalanná teszik.
A DNS klónozása Génsebészet (genetic engineering): a DNS manipulálása (vágás/illesztés) speciális enzimekkel. Restrikciós endonukleázok: Bakteriális eredetű enzimek. Egy adott DNS szekvenciát – ált. 4-6 bázis hosszúságú – ismernek fel a kettősszálú DNS molekulán belül és elhasítják azt. Több száz különböző restrikciós endonukleázt ismerünk. Elkészíthetjük a DNS restrikciós (fizikai) térképét. A restrikciós fragmentumokat mesterséges hordozó (vektor) DNS-be ültetjük (ligáz enzim). Rekombináns DNS A rekombináns DNS-t megfelelő gazdaszervezetben (pl. E. coli baktérium) több millió kópiában megsokszorozhatjuk. Klón A rekombináns klón elegendő mennyiségű anyagot szolgáltat a DNS analízisére (pl. szekvenálás).
Polimeráz láncreakció (PCR) Vektor és gazdatörzs (baktérium) használata nélkül megsokszorozhatjuk (amplifikálhatjuk) a DNS-t. A sejtmagban végbemenő DNS replikáció in vitro imitálása. Tetszés szerinti DNS szakasz megsokszorozható. A megsokszorozandó DNS-t határoló rövid szakaszok szekvenciáját ismerni kell.
A szekvencia adatbázisok rohamosan növekednek Genom szekvenciák gének keresése/azonosítása (annotálás) Géntermékek funkciójának jóslása/azonosítása (funkcionális genomika) Hálózatok modellezése (systems biology) Probléma: A szekvencia adatbázisok sokkal gyorsabban növekednek, mint az újonnan azonosított gének funkciójára vonatkozó adatok. Még egy „egyszerű” élőlény esetén is nagyon sok az ismeretlen génszekvencia/funkció.
Élesztő genom project A legjobban jellemzett eukariótának tartották, amikor 1996-ban meghatározták a genomszekvenciáját. Ekkorra kb. 2000 gén volt kísérletesen jellemezve és még néhány ezer új génre számítottak. Meglepetés: Az élesztő genom több mint 6000 gént tartalmaz és ezek egyharmada nem hasonlít semmilyen eddig ismert szekvenciához (orphans/ árvák).