360 likes | 878 Views
Organizácia ľudského genómu. Ľudský genóm je súhrn genetickej informácie, obsiahnutý v bunke. Má 2 zložky: Jadrový genóm Mitochondriálny genóm. I. Jadrový genóm. celková dĺžka: 3200 Mb distribúcia: 24 rôznych lineárnych molekúl (22 typov autozómov a chromozómy X a Y)
E N D
Organizácia ľudského genómu Ľudský genóm je súhrn genetickej informácie, obsiahnutý v bunke. Má 2 zložky: • Jadrový genóm • Mitochondriálny genóm
I. Jadrový genóm • celková dĺžka: 3200 Mb • distribúcia: 24 rôznych lineárnych molekúl (22 typov autozómov a chromozómy X a Y) • 3000 Mb euchromatínu a 200 Mb konštitutívneho heterochromatínu (heterochromatín – permanentne kondenzované a transkripčne inaktívne oblasti) • veľká variabilita v distribúcii obsahu DNA v jednotlivých chromozómoch • typy sekvencií • Jednotkové sekvencie (~55%) • Repetitívne sekvencie (~45%)
Gény a súvisiace sekvencie • počet: 25 – 30 tisíc • 90 – 95 % kódujúcich polypeptid • 5 – 10 % kódujúcich netranslatované RNA molekuly • bezstavovce 14 – 20 tisíc, stavovce 25 – 30 tisíc • kódujúca časť predstavuje 1,5 % ľudského genómu • distribúcia génov: nerovnomerná • heterochromatín neobsahuje gény • rozdiely aj vrámci euchromatickej časti genómu a medzi jednotlivými chromozómami • vysoká hustota v subtelomerických obl. • chr. 19 a 22 bohaté na gény • chr. 18, X a Y chudobné na gény
Variabilná hustota génov: HLA oblasť a DMD 1Mb - ~ 70 génov 2,4Mb – 1 gén (dystrofín)
Charakteristika génov kódujúcich polypeptid • výrazná variabilita vo veľkosti: priemer 27 kb • inzulín 1,4 kb vs. dystrofín 2,4 Mb • výrazná variabilita v počte exónov: priemer 9 • 0 (interferón) vs. 363 (titín) • dĺžka exónov: priemer 170 bp • 7,6 kb exón 26 génu ApoB • dĺžka intrónov: enormná variabilta (dlhé gény majú dlhé intróny) • 0,5 kb (β-globín) vs. 800 kb (gén WWOX) • dĺžka polypetidu: priemer 500 – 550 a. k. • najdĺhší: 38 138 (titín) • gény v génoch (3 gény v intr. 26 génu pre NF1) • prekývajúce sa gény
Dĺžka ľudských génov krátke E1 I 1 E2 I 2 E3 1 – 10 kb stredne dlhé 10 – 100 kb dlhé > 100 kb
Variabilita v dĺžke génov a v obsahu exónov 10-100 kb pod 10 kb nad 100 kb
Gény v rámci génu: gén pre NF typu 1 a 3 „vnútorné“ gény v intróne 26
Charakteristika génov kódujúcich polypeptid – pokr. • unikátne gény (single copy) • génové rodiny • vznikli duplikáciou unikátnych génov • často majú rovnakú alebo podobnú funkciu • môžu vytvárať zhluky al. roztrúsené po celom genóme • veľká časť genómu je tvorená génovými rodinami Typy génových rodín: • klasické génové rodiny • vykazujú vysokú sekvenčnú homológiu • evolučná aj funkčná príbuznosť
Charakteristika génov kódujúcich polypeptid – pkr. • génové rodiny s dlhými konzerovanými doménami • gény s dôležitou funkciou vo vývine (PAX-, homeobox-gény) • génové rodiny s krátkymi konzerovanými motívami aminokyselín • nemusia byť homologické na úrovni DNA, ale majú spoločnú všeobecnú funkciu – RNA helikázy, DEAD box a pod. • génové super rodiny • malá sekvenčná homológia • spoločné štrukturálne charakteristiky – HLA gény
Príklady tandemových génových rodín α-globín: 16p13.3 β-globín: 11p15.5 rastový hormón: 17q23 albumín: 4q12
Ľudské RNA gény • ~3000 RNA génov = 10% genómu • Hlavné triedy RNA • rRNA • 18S, 5S a 5,8Sr RNA: súčasť cytopl. ribozómov • tRNA: 22 typov mt tRNA; 49 typov cytoplazm. tRNA (497 génov; väčšina z nich na chromozómoch 1 a 6 v génových rodinách) • snRNA: U1, U2, U4 a i.: súčasti spliceosomov • 16SrRNA, 23SrRNA: súčasť mt ribozómov • snoRNA: asi 100 rôznych typov; účasť na rRNA processingu • Iné RNA triedy • Telomerázové RNA: súčasť telomerázy, • Antisense RNA: mnoho typov, asociované s imprintingom • MicroRNA: krátke (22nt), regulácia translácie, ~200 génov
Pseudogény v ľudskom genóme • nefunkčné kópie génov (neexprimujú sa): „mŕtve konce“ evolúcie génov – ale aj zdroj evolučných inovácií • celkový počet cca 20 000 • Typy: • bežné (konvenčné, neupravené) Ψgény: • väčšinou v tandeme s génom • obsahujú exóny aj intróny • vznik: nehomologický c-o • upravenéΨgény: disperzne v genóme • obsahujú len sekvencie exónov • vznik: reverzná transkripcia
Pseudogény v ľudskom genóme – pokr. • exprimované neupravené • prechodné štádium, gén už nie je funkčný ale exprimuje sa, napr. θ-globin • exprimované upravené • pseudogén sa včlení do blízkosti promótora • pseudogén vzniknutý z génu s vnútorným promótorom • skrátené gény, génové fragmenty • pravdepodobný vznik nehomologický crossing-over al. nehomologická výmena sesterských chromatíd
Vznik upraveného pseudogénu reverznou transkripciou z mRNA transkriptu
Repetitívne sekvencie databáza: www.girinst.org • tvoria 45 % ľudského jadrového genómu Triedy: • nízko repetitívne: do 100 repetícií • stredne repetitívne: 100 – 10 000 • vysoko repetitívne: nad 10 000 Typy: • tandemovo usporiadané • rozptýlené
Repetitívne sekvencie – pokr. Tandemové repetitívne sekvencie • satelitná DNA • minisatelitná DNA • mikrosatelitná DNA Satelitná DNA(nie je totožná so satelitmi chromozómov) • skladá sa z dlhých blokov tandemových opakovaní (100 kb až niekoľko Mb) • tvorí väčšiu časť heterochromatínu v oblasti centromér • hlavné triedy • α-satelitná (alfoidná) DNA • dĺžka opakovania: 171 bp • centromerická oblasť všetkých chromozómov • tvorí 3 – 5 % DNA obsahu chromozómu • má významnú úlohu vo funkcii centroméry
Repetitívne sekvencie – pokr. • β-satelitná DNA • dĺžka opakovania: 68 bp • centromerická oblasť chromozómov 1, 9, 13, 14, 15, 21, 22 a Y • satelitná DNA 1 • dĺžka opakovania: 25 – 48 bp • bohatá na AT • centromerická oblasť chromozómov a iných heterochrom. oblastí • satelitná DNA 2 a 3 • dĺžka opakovania: 5 bp • výskyt pravdepodobne na všetkých chromozómoch
Repetitívne sekvencie – pokr. Minisatelitná DNA • stredne dlhé (0,1 – 20 kb) dlhé bloky tandemových opakovaní • roztrúsené po veľkej časti nukleárneho genómu • známe 2 triedy: • hypervariabilná minisatelitná DNA (VNTR) • dĺžka opakovania: 9 – 24 bp • môžu mať spoločnú základnú („core“) sekvenciu • lokalizácia predovšetkým v blízkosti telomér • telomerická minisatelitná DNA • 3 – 20 kb tandemových opakovaní • dĺžka opakovania 6 bp (TTAGGG) • lokalizácia v teloméroch všetkých chromozómov • priama zodpovednosť za telomerickú funkciu
Repetitívne sekvencie – pokr. Mikrosatelitná DNA (Short Tandem Repeats – STR) alebo aj (Simple Sequence Repeats – SSR) • krátke (do 0,1 kb) bloky tandemových opakovaní • roztrúsené po celom genóme (tvoria asi 2 % genómu) • dĺžka opakovania: menej ako 10 bp • najčastejšie sú dinukleotidové opkovania CA/TG (CG/GC sú zriedkavé) • tri- a tetranukleotidové sú zriedkavejšie ale zato veľmi polymorfné (mapovanie génov, kriminalistika, nepriama dg. a pod.) • vznik: prekĺznutie vlákien pri replikácii • význam: zatiaľ neznámy
Repetitívne sekvencie – pokr. Roztrúsené opakovania – tvoria cca 43 % ľ. g. • takmer všetky r. o. sú odvodené od transpozónov Podľa dĺžky opakovania sa delia • SINE – Short Interspersed Nuclear Elements (100 – 400 bp) • Alu rodina • dĺžka opakovania: 280 bp • je špecifická pre primátov (identifikácia úsekov DNA ľudského pôvodu) • počet kópií 1,2 mil. (1 kópia na 3 kb) • 10,7 % ľudského genómu • ešte známe MIR (450 000 kópií) a MIR3 (85 000 kópií)
Repetitívne sekvencie – pokr. • LINE – Long Interspersed Nuclear Elements (20 % genómu) • LINE1 (L1) – 6,1 kb (600 000 kópií) • kóduje 2 proteíny • 60 – 100 L1 je schopných aktívnej transpozície (a môžu zapríčiniť dedičné ochorenie, napr. HA) • tvorí 17 % ľudského genómu • ešte sú známe LINE2 (370 000 kópií) a LINE3 (44 000) • LTR transpozóny (Long Terminal Repeats) – 8,5 % ľ. g. • ERV (Endogenous Retrivral Sequences) • DNA transpozóny - 3 % ľudského genómu • nie sú aktívne u človeka (transpozónové fosílie)
Ľudský mitochondriálny genóm • počet kópií v bunke: 100 – 100 000 • term. diferencované kožné bunky – bez mtDNA • oocyty – 100 000 (spermie – niekoľko 100) • jedna cirkulára dvojvláknová molekula • dĺžka: 16 569 bp (známa kompletná sekvencia – 1981) • ťažký reťazec (H) – bohatý na G • ľahký reťazec (L) – bohatý na C • D slučka – krátka trojvláknová oblať (7S DNA) • segregácia pri bunkovom delení – náhodná • dedičnosť – matroklinná (matrilineárna) • replikácia: separátna na H a L reťazci • najprv H reťazec (začiatok v D-slučke) • L reťazec – až po replikácii 2/3 H reťazca
Ľudský mitochondriálny genóm – pokr. • transkripcia: • promotor pre obidve vlákna v D slučke • prebieha súčasne na obidvoch vláknach v opačnom smere ako replikácia • je kontinuálna, t.j. vzniká veľký multigénový transkript • mitochondriálny genetický kód: • mierne sa líši od nukleárneho • je 60 kodónov (v nukleárnom genóme 61) • 4 stop kodóny - 2 totožné s nukl. g. UAA, UAG a 2 odlišné AGA a AGG (kódujú arginín v nukl. g.) • UGA kóduje triptofan v mt. – v nukl. g. je to stop k. • mt gény: celkový počet 37 • 28 na H vlákne, 9 na L vlákne • 13 kóduje polypeptid, 22 tRNA a 2 rRNA
Ľudský mitochondriálny genóm – pokr. • väčšina mt polypeptidov je kódovaných nukleárnym g. • mt genóm je extrémne kompaktný (93 % kódujúce sekv.) • len D slučka neobsahuje kódujúce sekv. • gény neobsahujú intróny • vyskytujú sa prekrývajúce sa gény • susediace gény separované väčšinou len 1 – 2 bázami • niektorým génom chýba terminačný kodón
Ľudská mtDNA ND – NADH dehydrogenáza (7) ATP – ATPáza (2, čiast. prekryv) CO – cytochróm c oxidáza (3) CYB – cytochróm B (1) bohatý na G bohatý na C
Všeobecný prehľad genómu 1,5% 3% Jadrový genóm repetitívne sekv. – transpoz. heterochromatín iné nekonzervované vysoko konzervované nekód. kódujúce 45% 44% 6,6% 5% 2% mtDNA 93%
Organizácia ľudského genómu 25-30000 génov