610 likes | 1.02k Views
STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA. ĮVADAS. G enomi ka y r a rūšies viso genomo molekulinė analizė Genom o analizę sudaro dvi pagrindinės fazės Genolapio sudarymas Se kvenavimas (nukleotidų sekos nustatymas)
E N D
STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA
ĮVADAS • Genomikayra rūšies viso genomo molekulinė analizė • Genomo analizę sudaro dvi pagrindinės fazės • Genolapio sudarymas • Sekvenavimas (nukleotidų sekos nustatymas) • 1995 m. mokslininkai vadovaujami Craigo Venterioir Hamiltono Smithonustatė pirmojo organizmo pilną DNR seką • Tai buvo bakterijaHaemophilus influenzae 10-2
1.83 milijonų bp ~ 1,743 genų Bakterijos Haemophilus influenzae pilnas genolapis 10-3
1996 m. buvo pabaigtas pirmojo eukariotinio organizmo genomo tyrimas. Jį atliko pasaulinis mokslininkų konsorciumas, vadovaujamas Andre Goffeau iš Belgijos • Saccharomyces cerevisiae • Genomą sudaro 16 linijiškų chromosomų • ~ 12 milijonų bp, ~ 6,200 genų • Vėliau buvo sekvenuoti kitų organizmų genomai, įskaitant žmogų • Struktūrinė genomikaprasideda genolapio sudarymu ir baigiasi pilnu genomo sekvenavimu • Funkcinė genomikatiria, kaip genų sąveikos skuria organizmo požymius • Funcinės genomikos pagrindinė paskirtis yra išsiaiškinti genetinių sekų reikšmę organizmo funkcionavimui • Daugeliu atvejų tai leidžia suprasti geno funkciją 10-4
Pilnas rinkinys baltymų, kuriuos gali sintetinti organizmas, yra vadinamas proteomu • Proteomikayra visų genomo koduojamų baltymų ir jų sąveikų tyrimas • Proteomikos tikslas yra išsiaiškinti organizmo baltymų funkcinę paskirtį • Taip pat ji siekia ištirti baltymų sąveikas • Bioinformatikostikslas yra perskaityti informaciją, esančią genetinėse sekose, naudojant matematinius/kompiuterinius metodus 10-5
10.1 STRUKTŪRINĖ GENOMIKA • DNR sričių struktūrinė organizacija paprastai nustatoma trimis būdais • 1. Citogenetinis (geno)kartografavimas • Remiasi mikroskopine analize • Genai siejami su chromosomų ruožais • 2. Sankibos (geno)kartografavimas • Remiasi kryžminimais • Nustatoma genų padėtis vienas kito atžvilgiu • Atstumai matuojami genolapio vienetais (arba centimorganais) • 3. Fizinis (geno)kartografavimas • Remiasi DNR klonavimo metodais • Nustatoma genų padėtis vienas kito atžvilgiu • Atstumai matuojami bazių poromis 10-6
Citogenetinis (geno)kartografavimas • Citogenetinis kartografavimas remiasi mikroskopija • Dažniausiai naudojamas tiriant eukariotus, turinčius dideles chromosomas • Eukariotų chromosomas galima atskirti pagal • Dydį • Centromeros padėtį • Ruožuotumą • Ruožuotumas išryškėja chromosomas nudažius specifiniais dažais • Jis naudojamas genų kartografavimui 10-7
Darant citogenetinį kartografavimą yra bandoma nustatyti genų išsidėstymą specifinių chromosomos ruožų atžvilgiu • Dažniausiai tai yra augalų ir gyvūnų genų lokalizacijos nustatymo pirmasis etapas • Citogenetinis kartografavimas remiasi mikroskopija • Todėl jo skiriamoji geba yra gana limituota • Daugelio rūšių atveju ji yra ~ 5 milijonus bp • Skiriamoji geba daug geresnė toms rūšims, kurios turi politenines chromosomas • Pvz., Drosophila melanogaster 10-8
Hibridizacijain situ • Hibridizacija in situpadeda nustatyti geno padėtį intaktinėse chromosomose • Ji naudojama nustatyti genų ar DNR sekų lokalizaciją didelėse eukariotų chromosomose • Naudojami zondai, padedantys aptikti ieškomas DNR sekas (“taikinį”) • Dažniausiai naudojami fluorescenciniais dažais pažymėti DNR zondai • Šis metodas vadinamas fluorescencine in situ hibridizacija (FISH) 10-9
Ląstelės veikiamos medžiagomis, fiksuojančiomis jas ant stikliuko DNR zondai yra chemiškai modifikuoti taip, kad prie jų gali prisijungti fluorescuojanti žymė Fluorescencinės in situ hibridizacijos (FISH) metodas 10-10
Fluorescencinių zondų skleidžiamai šviesai aptikti yra naudojami fluorescenciniai mikroskopai • Fluorescuojantis zondas yra matomas kaip švytinti sritis nešvytinčiame fone • Zondai prisitvirtina tik prie specifinių sekų • FISH eksperimentų rezultatai yra lyginami su Giemsa dažais nudažytų chromosomų vaizdu • Zondo padėtis gali būti nusakoma G ruožų atžvilgiu 10-11
Sankibos (geno)kartografavimas • Sankibos kartografavimas remiasi rekombinantinių palikuonių dažnio skaičiavimu • Visi genai, esantys vienoje chromosomoje, yra paveldmi kartu sukibę, t.y. sudaro vieną sankibos grupę • Jei įvyksta krosingoveris, gali pasikeisti sukibusių genų seka • Krosingoverio dažnis tuo mažesnis, kuo arčiau vienas kito yra sukibę genai • Gali būti sudaromi ne genų, o genetinių žymenų genolapiai. Molekulinis žymuoyra DNR fragmentas, kuris randamas specifinėje chromosomos vietoje ir gali būti specifiškai atpažintas • Kaip ir alelių atveju, molekulinių žymenų ypatybės gali skirtis tarp skirtingų individų 10-14
Restrikcijos fragmentų ilgio polimorfizmas (RFLP) • Restrikcijos fermentai atpažįsta specifines DNR sekas ir jose kerpa DNR • Ilgose chromosomose gali būti daug vietų, kurias atpažįsta ir kerpa restrikcijos fermentai • Jos yra pasiskirstę atsitiktinai • Lyginant du individus galima aptikti tokių atpažinimo vietų kiekio ir/ar išsidėstymo skirtumus 10-15
Rodyklės rodo restriktazių kirpimo vietas Restrikcijos vieta, randama tik 1-ame individe Populiacijoje stebimas DNR fragmentų ilgio polimorfizmas Ši variacija gali atsirasti dėl delecijų, duplikacijų, genų mutacijų ir t.t. Restrikcijos fragmentų ilgio polimorfizmas (RFLP) 10-18
EcoRIkirpimo vietos yra abiejose chromosomose EcoRIkirpimo vietų nėra abiejose chromosomose Trijų individų chromosominės DNR RFLP analizė 10-19
EcoRIkirpimo vieta yra tik vienoje chromosomoje Trys individai turi daug bendrų vienodo ilgio DNR fragmentų Polimorfinės juostos pažymėtos strėlėmis Jei šie fragmentai randami 99% visų populiacijos individų, jie vadinami monomorfiniais 10-20
RFLP genolapiai • RFLP sankibos analizė gali būti atlikta su daugeliu RFLP žymenų, nustatant jų santykinę padėtį genome • Genolapis, sudarytas iš daugelio RFLP žymenų, vadinamas RFLP genolapiu • RFLP genolapiai naudojami genų padėčiai nustatyti tam tikroje chromosomoje 10-21
Keletas žinomų genų pažymėtiraudonai Dešiniojoje pusėje nurodyti genetiniai atstumai Kairiojoje pusėje nurodyta RFLP žymenų išsidėstymas Supaprastintas augalo Arabidopsis thalianaRFLP genolapis 10-22
Fizinis (geno)kartografavimas • Fiziniam kartografavimui atlikti reikia klonuoti daugelį chromosominės DNR fragmentų • Klonuoti DNR fragmentai yra apibūdinami pagal • 1. Dydį • 2. Turimus genus • 3. Padėtį chromosomoje • Pastaraisiais metais naudojant fizinį kartografavimą sekvenuoti ištisi genomai 10-23
10.2 FUNKCINĖ GENOMIKA • Atliekamas plataus masto genomų sekvenavimas leidžia tyrinėti genų veiklą daug sudėtingesniame lygmenyje • Dabar galima vienu metu tirti daugelio genų grupių veiklą • Vienas iš pagrindinių genominių tyrimų tikslų yra nustatyti tas DNR sritis, kuriose iš tiesų yra genų • Vienas būdų tai padaryti yra parodyti, kad tiriama sritis yra transkribuojama į RNR 10-25
Genų ekspresija gali būti nustatyta cDNR bibliotekoje • Tai padaroma sukuriant cDNA biblioteką • cDNR (copy DNA) yra gaunama atvirkštinės transkriptazės pagalba susintetinus DNR nuo mRNR, išskirtos iš ląstelės • cDNRbiblioteka taip pat vadinama EST biblioteka (expressed sequence tag library) • Šios sekos taip pat gali būti naudojamos kaip žymenys, atliekant fizinį chromosomų kartografimą • EST bibliotekoje esančios sekos gali būti sekvenuotos ir vėliau palygintos su genomo sekomis • Atitikimai rodo, kurios genomo vietos koduoja genus • cDNR bibliotekos sukūrimas padeda tirti genų reguliaciją genomo lygmenyje • Tokių tyrimų strategija yra išskirti mRNR esant skirtingoms ląstelės ar organizmo funkcionavimo sąlygoms • Tada galima nustatyti tas mRNR, kurios yra sintetinamos tik esant vienokioms ar kitokioms sąlygoms 10-26
Mikrogardelės gali nustatyti transkribuojamus genus • Sukurtas naujas tyrimo metodas, vadinamas DNR mikrogardelėmis (taip pat vadinama genųlustais) • Šis naujas metodas leidžia vienu metu tirti tūkstančių genų veiklą • DNR mikrogardelė yra maža silicio, stilo ar plastiko plokštelė, padengta daugelio DNR sekų taškeliais • Kiekviena iš šių sekų atitinka vieną žinomą geną • Šios sekos veikia kaip zondai, aptinkantys transkribuojamus genus 10-27
Šie DNR fragmentai gali būti • Amplifkuoti PGR pagalba ir vėliau pritvirtinti ant mikrogardelės • Tiesiogiai susintetinti ant mikrogardelės • Viena mikrogardelė turi dešimtis tūkstančių skirtingų taškų, o jos dydis neviršia pašto ženklo • Kiekvieno taško (su skirtingo geno DNR) padėtis gardelėje yra tiksliai žinoma • DNR mikrogradelių gamybos technologija yra gana įdomi ir primena technologiją, kuri naudojama rašaliniuose spausdintuvuose • Pagamintos DNR mikrogardelės naudojamos hibridizacijai su cDNR, susintetinta atvirkštinės transkriptazės pagalba nuo iš ląstelės išskirtų mRNR 10-28
Mikrogardelė nuplaunama • Po to ji tiriama skenuojančiu konfokaliniu fluorescenciniu mikroskopu • Tiriama fluorescuojančios vietos, kurios rodo įvykusią hibridizaciją 10-29
10.3 PROTEOMIKA • Proteomikatiria organizmo gaminamų baltymų funkcinę paskirtį • Pilnas rūšies baltymų rinkinys yra vadinamas proteomu • Genomikos duomenys gali suteikti svarbių žinių apie proteomą • 1. DNR mikrogardelės parodo genus, kurie yra transkribuojami esant tam tikroms sąlygoms • 2. Skirtingų rūšių genų homologijos tyrimai gali būti panaudojami baltymų struktūrai ar funkcijai nuspėti • Tačiau genominius tyrimus turi sekti tiesioginiai pačių baltymų tyrimai 10-32
Proteomas yra žymiai didesnis už genomą • Viso genomo sekvenavimas ir analizė gali padėti nustatyti visus rūšies genus • Tačiau proteomas yra didesnis už genomą ir tikrąjį jo dydį sunku nustatyti • Taip įvyksta dėl keletos procesų • 1. Alternatyvaus splaisingo • 2. RNRredagavimo • 3. Potransliacinėskovalentinės modifikacijos 10-33
1. Alternatyvus splaisingas • Svarbiausias pokytis, atsiradęs eukariotuose • Viena pre-mRNRyra pertvarkoma į keletą skirtingų mRNR • Splaisingas dažnai yra specifiškas tam tikroms ląstelėms arba tam tikroms aplinkos sąlygoms • 2. RNRredagavimas • Sutinkamas rečiau už alternatyvų splaisingą • Pakeičia koduojančią mRNR seką • 3. Potransliacinėkovalentinė modifikacija • Funkcionaliam baltymui sukurti gali būti reikalingos negrįžtamos modifikacijos • Proteolitinis procesingas; prostetinių grupių, cukrų ar lipidų prisijungimas • Grįžtami pokyčiai gali trumpam pakeisti baltymo funkcijas • Fosforilinimas; metilinimas • Visi šie procesai padidina potencialių baltymų kiekį proteome 10-34
Baltymų mikrogardelės • Yra kuriamos ir baltymų mikrogardelės • Baltymų mikrogardelių kūrimas yra sudėtingesnis procesas • 1. Baltymus žymiai lengviau pažeisti, atliekant įvairias manipuliacijas, reikalingas mikrogardelei pagaminti • 2. Baltymų sintezė ir išgryninimas reikalauja daug daugiau laiko, lyginant su DNR • Nepaisant to, pastaraisiais metais yra pasiektas tam tikras progresas baltymų mikrogardelių kūrime ir panaudojime proteomikos tyrimuose 10-35
Yra du pagrindiniai baltymų mikrogardelių tipai • 1. Antikūnų mikrogardelės • 2. Funkcinės mikrogardelės • Antikūnų mikrogardelės • Sudarytos iš rinkinio antikūnų, atpažįstančių trumpas peptidų sekas • Naudojamos įvertinti baltymų ekspresijos laipsniui • Funkcinės mikrogardelės • Sudarytos iš daugelio skirtingų ląstelės baltymų • Naudojamos baltymų funkcijoms tirti 10-37
10.4 BIOINFORMATIKA • Kompiuteris tapo svarbiu genetinių tyrimų instrumentu • Genetikos ir informatikos mokslų sandūroje susikūrė nauja mokslo šaka - bioinformatika • Genetinių sekų kompiuterinei analizei paprastai reikia trijų pagrindinių elementų: • Kompiuterio • Kompiuterinių programų • Genetinių duomenų 10-38
Sekos analizuojamos naudojant kompiuterines programas • Kompiuterinė programayra apibrėžta operacijų seka, kuri gali analizuoti duomenis pasirinktu būdu • Pirmasis kompiuterinės genetinių duomenų analizės etapas yra kompiuterinių duomenų bylos sukūrimas • Ši byla yra informacijos rinkinys, tinkamas saugoti ir manipuliuoti kompiuteryje • Pavyzdžiui, bylą gali sudaryti lacY genoiš E. coliDNR seka 10-39
Duomenų suvedimas į kompiuterį atliekamas • Rankiniu būdu • Automatizuotai (tiesiogiai iš sekvenavimo įrenginio) • Genetinės sekos, esančios kompiuterinėse bylose, gali būti analizuojamos daugeliu būdų • Pavyzdžiui, gali būti ieškoma atsakymų į šiuos klausimus • 1. Ar sekoje yra genų? • 2. Ar genai turi reguliuojančias sekas (promotorius, splaisingo vietas ir kt.)? • 3. Ar seka koduoja polipeptidą? • Jei taip,tai kokia šio polipeptido seka? • 4. Ar seka yra homologinė kuriai nors kitai sekai? • 5. Koks yra evoliucinis ryšys tarp dviejų ar daugiau genetinių sekų? 10-41
Kompiuterinės duomenų bazės • Genetinės informacijos kiekis, nustatomas mokslininkų, yra itin didelis • Ši informacija kompiuterinių bylų pavidalu yra kaupiama genetinių duomenų bazėse • Bylos tokiose duomenų bazėse dažniausiai yra anotuotos • Jose yra genetinė seka ir detalus jos aprašymas • Be to, pateikiamos kitos svarbios sekų ypatybės • Pasaulyje egzistuoja keletas didelių genetinių duomenų bazių, turinčių duomenis iš tūkstančių laboratorijų 10-42
Kompiuterinės duomenų bazės • Anksčiau paminėtos genetinių duomenų bazės kaupia informaciją apie daugelį skirtingų biologinių rūšių • Taip pat yra kuriamos genomoduomenų bazės • Tai yra specializuotos duomenų bazės, kuriose kaupiami duomenys apie atskiras rūšis • Jų pagrindinis tikslas yra susisteminti sekvenavimo ir kartografavimo rezultatus • Genomo duomenų bazėse taip pat yra duomenų apie alelius, tyrimus atliekančius mokslininkus ir bibliografinės rodyklės 10-44
Skirtingos analizės strategijos • Kompiuterinės programos gali aptinkti reikšmingas vietas labai ilgose sekose • Jų veikimo principas gali būti pademonstruotas 54 raidžių sekos pavyzdžiu: GJTYLLAMAQLHEOGYLTOBWENTMNMTORXXXTGOODNTHEQALLYTLSTORE • Šią seką galima analizuoti bent trimis būdais 10-45
GJTYLLAMAQLHEOGYLTOBWENTMNMTORXXXTGOODNTHEQALLYTLSTORE • Pirmoji programa gali nustatyti visus anglų kalbos žodžius, esančios šioje sekoje: • Antroji programa nustato žodžių serijas, kurios formuoja gramatiškai teisingą sakinį: GJTYLLAMAQLHEOGYLTOBWENTMNMTORXXXTGOODNTHEQALLYTLSTORE • Trečioji programa aptinka penkių raidžių sekas, kurios randamos orientuotos priešingomis kryptimis: GJTYLLAMAQLHEOGYLTOBWENTMNMTORXXXTGOODNTHEQALLYTLSTORE 10-46
Taigi, kompiuterių programos atpažįsta arba sekas, arba struktūras • Sekų atpažinimas • Programa turi informacijos, kad specifinė seka ar simboliai turi specializuotą reikšmę • Turėdama šią informaciją, pirmoji programagali nustatyti sekas ar raides, kurios sudaro žodžius • Struktūrų atpažinimas • Nėra paremtas specifinių sekų turimos informacijos atpažinimu • Šio tipo programos (pvz., pavyzdžio trečioji programa)ieško tam tikrų dėsningų struktūrų, kurios gali būti bet kurioje sekoje ar sekų grupėje 10-47
Anksčiau paminėtos programos iliustruoja pagrindines sekų identifikavimo strategijas: • 1. Nustatomos prasmingos specializuotos sekos (sekų elementai), esančios labai ilgoje genetinėje sekoje • Kurie sekų elementai prasmingi, yra nustatyta pačioje programoje • Pavyzdys yra pirmoji programa • 2. Nustatoma sekų ar jų elementų organizacija • Pavyzdys yra antroji programa • 3. Nustatoma sekų struktūra • Pavyzdys yra trečioji programa 10-48
Genetinė seka, turinti tam tikrą funkciją, yra vadinama sekos elementu arba sekos motyvu • Taip pat aptikti specifiniai aminorūgščių motyvai, atliekantys baltymuose specializuotas funkcijas • Pvz., asparaginas–X–serinas (kur X yra bet kuri aminorūgštis) yra eukariotų baltymų glikozilinimo vieta • Prosite duomenų bazėje yra kaupiamos žinios apie aminorūgščių motyvus, turinčius funkcinę reikšmę • Tokia duomenų bazė padeda greičiau išsiaiškinti naujai aptiktų baltymų funkcijas 10-49
Trumpi sekų elementai, nustatomi kompiuterinės analizės metu R – bet kuris purinas, Y – bet kuris pirimidinas, N - bet kuri bazė 10-50