670 likes | 926 Views
HROMOSOMU STRUKTŪRA. TANDĒMISKO ATKĀRTOJUMU NOVIETOJUMS CILVĒKA HROMOSOMĀ. Telomere (tandem repeats of TTAGGG minisatellite). Length - several kb. Alphoid satellite. β satellite. Satellites 2 and 3. plus satellite 1 and other repeats.
E N D
TANDĒMISKO ATKĀRTOJUMU NOVIETOJUMS CILVĒKA HROMOSOMĀ Telomere (tandem repeats of TTAGGG minisatellite). Length - several kb Alphoid satellite β satellite Satellites 2 and 3 plus satellite 1 and other repeats Centromere (various satellite DNA components). Length - several Mb See (B) for examples Microsatellites (widely dispersed over chromosomes) β satellite rDNA β satellite β satellite Satellites 2 and 3 Alphoid satellite Hypervariable minisatellite DNA (preferentially in regions close to telomeres) Jonathan Wolfe, Dell Corp.
telomerāze telomēra telomerāzes RNS telomerāze pagarina telomēras 3’-galu DNS sintēze pagarinātais 3’-gals kalpo kā matrica jaunam Okazaki fragmentam pārvietošanās telomēras pagarinājums (joprojām raksturīgs 3’-vienpavediena rajons) atkārto DNS sintēze Molecular Biology of the Gene, 6th Edition TELOMĒRU PAPILDINĀŠANA HROMOSOMAS GALOS
TELOMĒRU STRUKTŪRA Telomēru rajons iesaistīts īpašā struktūrā, kas satur t.s. D-loop un specifiskus hromosomas galus aizsargājošus proteīnus Science 326,948(2009)
CILVĒKA 14. HROMOSOMAS FRAGMENTS Nature 412, 601 (2003)
CILVĒKA Y HROMOSOMA • Zīdītāju X un Y hromosomas ir radušās no normāla autosomu pāra (S.Ohno), un Y hromosoma uzskatāma par stipri deģenerētu X hromosomu, kas zaudējusi lielāko daļu X sekvenču. X – 160 Mb; Y – 60 Mb • Y hromosomai nav pārinieka mejozē un rekombināciju trūkuma dēļ tā pakļauta redukcijai un iespējamai eliminācijai no genoma Homoloģija starp X un Y hromosomām (neietver garu Yq heterohromatīna rajonu) Nature 434,325(2005)
CILVĒKA Y HROMOSOMA • Tikai chrY gali – t.s. pseidoautosomālie rajoni (PAR1 un PAR2) aktīvi rekombinē ar homologiem chrX rajoniem mejozē • 95% chrY – t.s. MSY ir visai vāja homoloģija ar chrX un nesadarbojas mejozē • MSY eihromatīna daļai ir trīs strukturāli un funkcionāli atšķirīgas struktūras: X-deģenerētie, no X transponētais un duplicētie segmenti Nature 423, 825 (2003) Nature Genetics 34, 246 (2003)
CILVĒKA Y HROMOSOMA • No X transponētais segments ir par 99% homologs X hromosomas Xq21 joslai un radies transpozīcijas rezultātā no X hromosomas pirms 3-4 mlj. gadiem, tātad pēc atšķelšanās no šimpanzes līnijas. Šis chrY segments (kopā 3.4 Mb) tomēr nepiedalās X-Y rekombinācijās, atšķirībā no PAR, un satur tikai 2 gēnus • X-deģenerētie segmenti saglabā ierobežotu homoloģiju ar attiecīgiem rajoniem X hromosomā, tajos ir chrX homologi gēni un pseidogēni, kas kodē dažādus, nesaistītus ar spermatoģenēzi proteīnus • Duplicētiem segmentiem ir palindromu struktūra (P1 – P8) ar augstu homoloģiju (virs 99.9% starp palindromiskām sekvencēm). Šie segmenti satur gēnus, kas saistīti ar dzimuma atšķirībām un ekspresējas testis. Nature 423, 825 (2003) Nature Genetics 34, 246 (2003)
Y HROMOSOMAS EVOLŪCIJA • Augstā homoloģija (virs 99.9%) starp duplicēto segmentu palindromiem nav rezultāts nesen notikušām genoma duplikācijām Y hromosomā, bet palindromisko sekvenču savstarpējām nealēliskām rekombinācijām pēc gēnu konversijas mehānisma. • Gēnu konversija Y-Y starp palindromiem iespējama ne tikai mejozē, bet varbūt arī mitozē. Līdz ar to rekombināciju biežums kļūst ievērojami lielāks. Gēnu konversija novērš Y hromosomas gēnu deģenerāciju, sakarā ar pārinieka trūkumu, kad mejotiskās rekombinācijas kompensē vienā hromosomā radušos defektus ar homologā pārinieka normālo sekvenci Nature 423, 873 (2003)
DELĒCIJAS CHRY ATKĀRTOTĀS SEKVENCĒS Atkārtotās palindromu sekvences veicina delēcijas Y hromosomā, kas noved pie spermatoģenēzes defektiem, jo tiek izgriezts ~50% ar gēniem bagātā AZFc lokusa Nature Genetics 35, 247 (2003)
CHRXUNCHRYHOMOLOĢIJA PAR: pseudoautosomal region XAR: X-added region (X-degenerate) XCR: X-conserved region XTR: X-transposed region Nature 434,325(2005)
XAR SEGMENTAPĀRVĒRTĪBAS CHRXUN CHRYEVOLŪCIJĀ X-Y homology X-Y homology chr X e v o l u t i o n chr Y Nature 434,325(2005) – present PAR – former PAR
CILVĒKA GENOMS UN CITI GENOMI
CILVĒKA HROMOSOMU SINTĒNISKIE RAJONI PELES GENOMĀ Mouse Genome Consortium: 2002 • pagājuši ap 100 mlj. g. kopš nodalījās peles un cilvēka priekšteču līnijas • X hromosomai ir viendabīga sintēnisku bloku struktūra • visa cilvēka 20. hromosoma ietilpst kā viens bloks peles 2. hromosomā • visa cilvēka 17. hromosoma pilnībā ietilpst peles 11. hromosomā Nature 420, 520 (2002) 2009.g. Publicēta pabeigta (finished) peles genoma sekvence. Peles genomā identificēti 20 210 proteīnus kodējoši gēni (par 1000 vairāk kā cilvēkam). PLoS Biology 7,Nr.5,e1000112(2009)
PRIMĀTU GENOMA STRUKTŪRA Genoma sekvencēšanavēl nav pabeigta Nature Biotechnology 29,983(2011)
HOMINIDU EVOLŪCIJAS KOKS Nature 469,529(2011)
Human chromosomes Chimpanzee chromosomes 2005. gada beigās publicēta šimpanzes Pan troglodytes genoma draft struktūra, izmantojot visa genoma shotgun metodi. Projekts uzsākts 2001.g. Salīdzinot ar cilvēka genomu atrod 35 mlj. viena nukleotīda apmaiņu un 5 mlj. inserciju un delēciju arī citus genoma pārkārtojumus.
CILVĒKA UN ŠIMPANZES GENOMU SALĪDZINĀJUMS Uzskata, ka cilvēka genoms gandrīz par 99% līdzīgs šimpanzes genomam, ja ņem vērā atsevišķu nukleotīdu atšķirības. Šādas atšķirības cilvēka genoma struktūrā (jeb viena nukleotīda polimorfisms – SNP) starp atsevišķiem indivīdiem ir daudz mazākas un līdzība nenokrīt zem 99.9%. DNS struktūras dati, ietverot arī delēcijas un insercijas, norāda uz lielākām cilvēka un šimpanzes genoma atšķirībām – ap 97.5%. Taču salīdzinot lielāku genoma rajonu atkārtojumus (t.s. segmentu duplikācijas), konstatē būtiskas atšķirības cilvēka un šimpanzes genomos, kas varētu samazināt genomu līdzību līdz pat 95%. Nature 437, 88 (2005)
RHESUS MACAQUE GENOME Chromosomal breakpoints between rhesus macaque and the human-chimpanzee ancestor Chromosome fusion Science 316,222(2007)
GENOMU HOMOLOĢIJAS SALĪDZINĀJUMS (ortologu sekvenču analīze ar dažādiem filtriem) nav homoloģijas nepilnīga homoloģija atšķiras ar delēcijām/insercijām atšķiras intronu/eksonu struktūrā nesenas gēnu duplikācijas pilnīga homoloģija Maksimālā homoloģija: cilvēks – cilvēks: 99.9% cilvēks – šimpanze: 99% cilvēks – makaks: 94% cilvēks – pele: 90% Science 316, 222 (2007)
CILVĒKA UN ŠIMPANZES GENOMU SALĪDZINĀJUMS Atšķirības abu genomu struktūrā nav vienmērīgi izvietotas, kas norāda uz genomu diverģences dažādību hromosomās. Dzimumhromosomas ieņem galējos stāvokļus: chrX ir viskonservatīvākā, chrY – vismainīgākā. Y hromosomas nukleotidu sekvence atšķiras par 1.78%, pretēji 1.23% visa genoma līmenī, salīdzinot cilvēka un šimpanzes genomus. Vidējā diverģence Diverģences robežas Nature 437, 69 (2005)
CILVĒKA UN ŠIMPANZES GENOMU SALĪDZINĀJUMS Salīdzinot šimpanzes un cilvēka Y hromosomas sekvenču homoloģiju, novēro lielas atšķirības, kas liecina par ievērojamu genoma reorganizāciju Y hromosomās. Chr21 saglabā augstu homoloģiju. Ievērojamas atšķirības ir arī Y hromosomas gēnu skaitā un novietojumā. Šimpanzes ChrY ir tikai 2/3 no gēnu skaita, kāds ir cilvēka ChrY. Citās hromosomās gēnu skaita atšķirības nepārsniedz 1%. Nature 463,536(2010)
CILVĒKA UN ŠIMPANZES Y HROMOSOMA Lielākā struktūras diverģence novērojama starp cilvēka un šimpanzes Y hromosomām Cilvēka genoms ieguvis X → Y transpozīcijas rezultātā ChrX rajonu – X-transponēto rajonu, kas nav šimpanzes genomā un ir radies kaut kad pēc cilvēka līnijas nodalīšanās no šimpanzes līnijas. (nav šimpanzei) Nature Genetics 38,158 (2006) Vislielākā ChrY reorganizācija novērojama t.s. aplikona (duplicētos) rajonos, kuri bagāti ar palindromiskiem atkārtojumiem. Šimpanzei duplicētie rajoni ir par 44% lielāki kā cilvēka ChrY. Daudz mazāk atšķirību ir X-deģenerētos rajonos. (nav šimpanzei) (duplicētie) Nature 463,536(2010)
ATKĀRTOTĀS SEKVENCES AIZŅEM LIELU DAĻU CILVĒKA GENOMA procenti introni retrovīrusiem līdzīgie elementi proteīnus kodējošie rajoni DNS transpozonu ‘fosīlijas’ GĒNI TRANSPOZONI citas DNS sekvences vienkāršie sekvences atkārtojumi segmentu duplikācijas ATKĀRTOTĀS SEKVENCES UNIKĀLAS SEKVENCES
ATKĀRTOTĀS SEKVENCES • Vairāk kā 50% cilvēka genoma pastāv atkārtotu sekvenču veidā • Tandēmiskie atkārtojumi (tandemic repeats): • vienkāršie tandēmiskie atkārtojumi - (A)n; (CA)n vai (CGG)n • tandēmiski atkārtojumi - centromēras, telomēras, ribosomu RNS gēnu klasteri • Izkliedētie atkārtojumi (interspersed repeats): • transpozoni, t.sk. retrotranspozoni • segmentu duplikācijas • procesētie pseidogēni (retropseidogēni) - neaktīvi radušies retrotranspozīcijas ceļā no gēniem
PROCESĒTIE PSEIDOGĒNI Molecular Biology of the Cell, 2008 Līdz šim cilvēka genomā identificēti vairāk kā 8000 procesēto pseidogēnu, kas cēlušies no ~2500 atsevišķiem funkcionāliem gēniem, un 10% cilvēka gēniem ir vismaz viena kopija tam atbilstošā pseidogēna. Kopā tie aizņem ap 0.5% genoma.
TANDĒMISKO ATKĀRTOJUMU NOVIETOJUMS CILVĒKA HROMOSOMĀ Telomere (tandem repeats of TTAGGG minisatellite). Length - several kb Alphoid satellite β satellite Satellites 2 and 3 plus satellite 1 and other repeats Centromere (various satellite DNA components). Length - several Mb See (B) for examples Microsatellites (widely dispersed over chromosomes) β satellite rDNA β satellite β satellite Satellites 2 and 3 Alphoid satellite Hypervariable minisatellite DNA (preferentially in regions close to telomeres) Jonathan Wolfe, Dell Corp.
TRANSPOZONI Transpozīciju aktivitāte vispār var būt liela: 10-3 – 10-5 (uz 1 transpozonu 1 paaudzē), kamēr bāžu apmaiņa tikai: 10-8 – 10-9 (uz 1 bāzi 1 paaudzē). Drozofilās 50–80% visu mutāciju pamatā ir transpozonu aktivitāte, lai gan transpozonu saturs ir tikai 15–22% genoma. Turpretī cilvēka genomā, kurā transpozoni sastāda jau 45% genoma, tikai par 0.1–1% visu mutāciju atbild transpozoni. Iemesls šeit ir milzīgās atšķirības transpozonu aktivitātē stap abiem organismiem. Nature 443,521(2006)
TRANSPOZONU VEIDI Retrotranspozoni
RETROTRANSPOZONU STRUKTŪRA RNA binding protein Reverse transcriptase + endonuclease 13 (2003)
TRANSPOZONU STRUKTŪRA UN KLASIFIKĀCIJA Evolucionārie aspekti (*) Nature 443,521(2006) (*) Miniature inverted-repeat transposable elements (MITEs)
POLI(A) TIPA RETROTRANSPOZONI RNA binding protein Cilvēka genomā šīs klases retrotranspozonus pārstāv: LINE un SINE elementi
IZKLIEDĒTO ATKĀRTOJUMU VEIDI CILVĒKA GENOMĀ P (poli-A elementi) P P LTR LTR (endogēnie retrovīrusi) (LTR elementi) P LTR LTR Nature 409, 860 (2001) LINE – Long Interspersed Nuclear Element SINE – Short Interspersed Nuclear Element LTR – Long Terminal Repeat P – promoters ORF1 (open-reading frame 1) – RNS saistības proteīna gēns ORF2 – reversās transkriptāzes un endonukleāzes gēns gag – strukturālo proteīnu gēns pol – reversās transkriptāzes, RNāzes H un integrāzes gēns (env) – apvalka proteīnu gēns(endogēnajiem retrovīrusiem nav, eksogēnajiem ir)
IZKLIEDĒTIE ATKĀRTOJUMI (IA) CILVĒKA GENOMĀ SVA: SINE+VNTR+Alu Nature Rev.Genetics 10,691(2009)
IZKLIEDĒTIE ATKĀRTOJUMI (IA) CILVĒKA GENOMĀ NatureRev.Genetics 13,36(2012)
LINE UN SINE ELEMENTI Pilna garuma LINE cilvēka genomā ir 6 – 8 kb gari. Satur pol II promoteru un divus ORF, viens no tiem kodē apgriezto transkriptāzi (RT) un endonukleāzi, otrs – RNS saistības proteīnu. Gandrīz visi LINE elementi ir saglabājušies kā īsi delēciju varianti – zem 1 kb un nav aktīvi. Visbiežākais no trim elementiem (LINE1, 2 un 3) ir LINE1, tas irvienīgais joprojām aktīvais LINE cilvēka genomā. No LINE1kopskaita (ap 500 000) aktivitāti saglabājuši tikai kādi 50 – 100 pārstāvji. Peles genomā aktīvi varētu būt ap 3000 LINE1. SINE ir īsi (100 – 400 bp) atkārtojumi ar pol III promoteru, bet bez ORF. To mobilitāti nodrošina LINE sistēma. Galvenais SINE elements cilvēka genomā ir Alu elements (pilns garums ~280 bp), kas vienīgais uzrāda aktivitāti. Pārējie SINE elementi – MIR un MIR3 vairs nav aktīvi. Arī SINE ir delēciju varianti. Alu ir galvenais aktivitāti saglabājušais IA cilvēka genomā. Pēc Genome Res. 19,1516(2009) datiem retrotranspozīcijas biežums ir augsts – pa vienai Alu transpozīcijai uz 21 jaundzimušo, vai attiecīgi uz 212 un 916 jaundzimušajiem Line1 un SVA gadījumā.
JAUNIE Alu ELEMENTI IR AKTĪVĀKIE IA CILVĒKA GENOMĀ Alu aktivitāte Vecākie Alu Jaunākie Alu Tikai jauni Alu cilvēka genomā uzrāda spēju transponēties. Šo aktivitāti varētu būt saglabājuši vairāki tūkstoši Alu elementu. Aktivitāti pārbauda ar spēju pārvietot marķiergēnu neo no klonētas plazmīdas HeLa šūnu genomā. Genome Res. 18,1875(2008)
LINE ELEMENTU INSERCIJAS SHĒMA LINE elementi transponējas tikai kodolā pēc target-priming reversetranscription shēmas. To nodrošina ar LINE RNS saistītā RT. Nature Rev.Genetics 10,691(2009)
IZKLIEDĒTO ATKĀRTOJUMU MOBILITĀTE LINE elementi vieglāk saglabājas genomā, jo tiem ir izteikta cis-priekšrocība LINE proteīniem saistoties ar LINE RNS, resp. proteīni pārsvarā saistās ar to RNS, no kuras tikuši translēti. Tādēļ transponējas gandrīz tikai funkcionāli pilnvērtīgi LINE elementi. Taču dažreiz LINE aktivitātei nav nepieciešams pilna garuma elements. Ar citiem LINE elementiem kā helperiem var aktivēt arī daļu LINE delēciju variantus. Alu transkriptam ir funkcionāla līdzība ar LINE RNS, uz kuras citoplazmā sintezējas LINE proteīni. Rezultātā Alu RNS asociējas ar ribosomu, kas sintezē LINE proteīnus un iegūst sintezēto LINE RT. Saistība ar RT nodrošina Alu RNS apgriezto transkripciju un tam sekojošu integrāciju genomā.
Alu MOBILIZĀCIJA AR LINE ELEMENTU ORF 2 protein CBP – Cap binding protein ORF 1 – RNA binding protein ORF 2 – Reverse transcriptase / endonuclease Nature Genetics 35, 15 (2003)
IZKLIEDĒTO ATKĀRTOJUMU VECUMS Par IA vecumu spriež pēc uzkrāto mutāciju daudzuma tajos (neselektīvos apstākļos) - cik lielā mērā katrs individuāls IA atšķiras no consensus sekvences konkrētai IA klasei. Katra IA kopija izveidojusies no kādreiz aktīvas IA transpozīcijas. Samazinoties transpozīciju aktivitātei, IA kopijas strauji diverģē no sākotnējās IA struktūras, neatkarīgu mutāciju rezultātā.
Human Molecular Genetics, 2nd Edition Alu (un B1) satur iekšēju RNS Pol III promoteru (a un b elementi), pateicoties kuram tiek transkribēti CILVĒKA Alu UN PELES B1 SINE ELEMENTU IZCELŠANĀS MolecularBiologyoftheCell, 2008 Salīdzinot ar peles genomu, cilvēka IA ir veci un funkcionāli aktīvo IA skaits ir niecīgs. Visu veidu IA aktivitāte ir strauji samazinājusies pēdējo 35-50 mlj. gadu laikā, atskaitot LINE1. Izņemot spēcīgu Alu aktivitātes pīķa parādīšanos pirms apm. 40–50 mlj. gadiem, visu citu IA aktivitāte ir samazinājusies kopš zīdītāju līnijas nodalīšanās.
IZKLIEDĒTO ATKĀRTOJUMU VECUMS CILVĒKA GENOMĀ Nature 409, 860 (2001)
IZKLIEDĒTO ATKĀRTOJUMU SALĪDZINĀJUMS • Cilvēka genomā eihromatīnā ir lielākais IA blīvums, salīdzinot ar citiem līdz šim sekvenētiem genomiem (D.melanogaster, C.elegans, A.thaliana) • Cilvēka genoms ir pārpilns ar vecām kādreiz aktīvu IA kopijām. Tam nav efektīva genoma attīrīšanas mehānisma. Zīdītājiem vispār tā ir problēma. • Cilvēka genomā LINE1 + Alu sastāda 60% visu IA. Citiem organismiem nav dominējošas IA klases, nav arī tik maz DNS transpozonu. Nucleotide substitution level from consensus Nature 409, 860 (2001)
IZKLIEDĒTO ATKĀRTOJUMU EVOLŪCIJA PRIMĀTOS Īpaši izceļas Alu atkārtojumi, kuru skaits un tam sekojoši pārkārtojumi dramatiski pieaug šimpanzes un cilvēka genomā. Tieši Alu tiek piedēvēta svarīga loma transpozīcijā un citos genoma pārkārtojumos, lai gan arī LINE1 elementiem tāda pastāv. Nature 469, 529 (2011)
IZKLIEDĒTO ATKĀRTOJUMU NOVIETOJUMS Atkārtojumi nav izvietoti vienmērīgi genomā. Cilvēka genomā ekstrēms ir 525 kb Xp11 rajons, kur IA blīvums ir 89%. Ir rajoni, kas par 60% sastāv no Alu, vai arī par 89% - no LINE1. Ir rajoni brīvi no IA. Tāds ir homeobox gēnu klasters hoxA,B,C,D,kurā 100 kb rajonā IA saturs ir zem 2%. Tas varbūt saistīts ar hox gēnu sarežģīto regulācijas sistēmu, kuru varētu traucēt IA klātbūtne. blue – exons red – interspearsed repeats Nature 409, 860 (2001)
LINE UN Alu INDUCĒTĀS GENOMA PĀRVĒRTĪBAS 13, xxx (2003)
SEGMENTU DUPLIKĀCIJAS Segmentu duplikācijas (SD) atšķirībā no Kopiju skaita variantiem (CNV) jeb t.s. Strukturāliem variantiem (SV) ir nostabilizējušās populācijā un maz atšķiras atsevišķiem indivīdiem. SD tāpat kā CNV radušās atsevišķu genoma rajonu duplikācijas un transpozīcijas rezultātā. Segmentu duplikācijas – SD ir vairāku reižu atkārtoti un izkliedēti pa genomu noteiktas secības DNS rajoni (1 – 200 Kb un lielāki). Sekvences identitāte pārsniedz 90%, ja savstarpēji salīdzina viena tipa duplikonus. Cilvēka genomā SD ir samērā jaunas ar augstu sekvences homoloģiju: 95 – 97%, pat līdz 99%. Nature Rev.Genetics 7,552(2006)