670 likes | 1.14k Views
CILVĒKA GENOMS. STRUKTŪRA, FUNKCIJAS, EVOLŪCIJA, IZMANTOŠANA. 2014. NE VISAI TĀLĀ NĀKOTNE. Indivīdu genoma datu bāze Veselības monitorings Individuālā terapija. Peroxisome proliferator-activated receptor- γ ( PPAR- γ ) Enerģijas kontrole, lipīdu un glikozes metabolisms.
E N D
CILVĒKA GENOMS STRUKTŪRA, FUNKCIJAS, EVOLŪCIJA, IZMANTOŠANA 2014
NE VISAI TĀLĀ NĀKOTNE Indivīdu genoma datu bāze Veselības monitorings Individuālā terapija
Peroxisome proliferator-activated receptor-γ (PPAR-γ ) Enerģijas kontrole, lipīdu un glikozes metabolisms Personas genoma struktūra Personas ģenētiskā informācija Ģenētiskā konsultācija Personas ģenētiskā riska informācija Tiazolidīndions Riska informācija Medicīniskā konsultācija Patoloģija: 2. tipa diabēts Genoma Riska Medicīniskais Citi riski bāze genotips risks vai dati Genoma bāze 3: 12.450.610 Genotips C / T INS rezistence hipertensija Tiazolidīndiona rezistence Aminoskābe Pro / Leu Bioķīmiskais slēdziens Vāji saista tiazolidīndiona rindas preparātus Nedaudz izmanīta polipeptīda skeleta konformācija; palielināta hidrofobitāte Medicīniskais slēdziens Strukturālais slēdziens Izteikta rezistence pret insulīnu Prognoze: cukura diabēts, hipertensija Medicīniskais slēdziens Terapija, profilakse, analīzes u.c. Farmakoloģiskais slēdziens Rezistence pret tiazolidīndioniem D.R. Bentley. Nature 429, 440 (2004)
1953. GADA VAROŅI Six of the Nobel winners of 1962 display their diplomas after formal ceremonies in Stockholm’s Concert Hall. From left to right: Maurice Wilkins (Medicine); Max Perutz (Chemistry); Francis Crick (Medicine); John Steinbeck (Literature); James Watson (Medicine) and John Kendrew (Chemistry)
... UN 2003. GADA VAROŅI Francis Collins National Human Genome Research Institute, NHGRI NIH, USA J. Craig Venter CELERAGenomics Inc. Fred Sanger The Sanger Centre Hinxton, UK Eric S. Lander Whitehead Institute Center for Genome Research, Cambridge Mass. USA
CILVĒKA GENOMA PROJEKTS (HGP) • Projekts uzsākts 1990. gadā • DALĪBNIEKI: • USA - NIH + DOE (Department of Energy) • UK - Medical Research Council + Wellcome Trust • FRANCE • JAPAN • GERMANY • CHINA • EU + HUGO • etc.
CILVĒKA GENOMA PROJEKTS • 1988.g. iniciatīva par cilvēka genoma projekta uzsākšanu • 1990.g. uzsākts cilvēka genoma projekts uz 15 gadiem un finansējumu 200 mlj. USD gadā (kopā 3 mld. USD) Science 300, 286 (2003)
PIRMAIS POSMS – LĪDZ 1995. GADAM • cilvēka un peles ģenētiskās un fiziskās kartes (radiācijas hibrīdi – RH un sequence tagged sites – STS) High-resolution recombination map – sīkākā ģenētiskā karte no DeCode – A.Kong et al. Nature Genetics 31, 241-247 (2002) • genoma sekvencēšanas stratēģija un tehnikas izstrāde • (S. cerevisiae, C. elegans, D. melanogaster uc.) • no 1995. gada – pilotprojekts: • atsevišķu garu hromosomas rajonu pilna DNS sekvence
CILVĒKA GENOMA SEKVENCĒŠANAS SĀKUMS Total amount of human sequence in the High Throughput Genome Sequence (HTGS) division of GenBank. The total is the sum of finished sequence (red) and unfinished (draft plus predraft) sequence (yellow). Nature 409, 860 (2001)
0TRAIS POSMS - LĪDZ 2000. GADAM • 1999.g. martā – 15% cilvēka genoma eihromatīna daļas noteikta sekvence pabeigtā (finished) formā: ar 99,99% precizitāti, bez pārtraukumiem (no gaps) • 1999.g. pavasarī jauni – “top-down” organizācijas principi genoma programmā un lēmums par “working draft” pabeigšanu 2000. gada pavasarī • Līdz 2000. gada jūnijam bija iegūta pilna genoma aptuvenā sekvence (draft genome sequence), kas aptver apm. 90% visa eihromatīna, bet nukleotīdu secībā ir ~150 000 pārtraukumu (gaps) un daudzu segmentu orientācija genoma rajonos nav noteikta, pat to novietojums un atkārtojumu skaits genomā ne reti ir kļūdains. • tikai 35% eihromatīna ir pabeigtā (finished) formā “Draft” sekvence publicēta un analizēta 2001. gada 15. februārī Nature 409, 860-921 (2001)
GENOMS SEKVENCĒTS, KO TĀLĀK ? Fred Sanger: “It is like a book in a foreign language that you don’t understand. That’s the first job, working the language out.“ Sydney Brenner: Fred Sanger “The Human Genome Project is like sending a man to the moon. Sending a man to the moon is easy, it’s getting him back that’s difficult. So I think we now need to get the human genome to return to work.”
DIVU GENOMA PROJEKTU “LOKOMOTĪVES” Eric S. Lander J. Craig Venter Nature 409, 860-921 (2001); Science 291, 1304-1351 (2001)
DIVAS SEKVENCĒŠANAS STRATĒĢIJAS hierarhiskā sekvencēšana un visa genoma “shotgun” PNAS 99, 3712-3716 (2002) Cilvēka genoma hierarhiskai sekvencēšanai pietiek ar ~ 45 000 nokartētiem kloniem (>100 kb), kurus tālāk sekvencē ar “shotgun” metodi. Visa genoma “shotgun” sekvencēšana prasa milzīgu kolekciju – 27 mlj. dažādu klonu.
DNS FRAGMENTU KLONĒŠANA UN HIERARHISKĀS SEKVENCĒŠANAS STRATĒĢIJA VEKTORI UN INSERTI plazmīdas - ap 4 kb kosmīdas - ap 40 kb YAC, PAC - 100-500 kb yeast or P1 derived chromosomes BAC vektori - 100-300kb bacterial artificial chromosomes
VEKTORI UN INSERTI plazmīdas - ap 4 kb kosmīdas - ap 40 kb (no fāgaλ) fosmīdas - ap 40 kb (no F-plazmīdas) (d) infect E.coli (c) packaging assembly
VEKTORI UN INSERTI YAC, PAC - 100-500 kb yeast or P1 derived chromosomes
BACTERIAL ARTIFICIAL CHROMOSOMES AS VECTORS VEKTORI UN INSERTI BAC vektori - 100-300kb bacterial artificial chromosomes
BAC KLONU ANALĪZE 1.BAC KLONU SELEKCIJA UN PĀRKLĀŠANĀS MEKLĒŠANA • BAC fingerprints: ierobežoti šķeļ ar HindIII vai citām restriktāzēm un raksturo ar PAGE • BAC insertu galu sekvencēšana, t.sk. ar “paired-end “ sekvenēšanas metodi • izmanto STS (sequence tagged sites) 2. Izvēlētos BAC klonus sekvencē ar “shotgun” metodi, vismaz ar 99% precizitāti un ar 4-kārtīgu sekvences pārklāšanos 3. DNS sekvences savākšana no fragmentiem (assembly): izkārtošana (layout), sapludināšana (merging)
BAC KLONU FINGERPRINTS Nature Rev.Genet. 5,578(2004)
SEKVENCĒŠANA NO GALIEM (PAIRED-END SEQUENCING) adapters EcoP15I sites adapters Genome Res.19,521(2009)
“PAIRED-END” SEKVENCĒŠANAS STRATĒĢIJA Pielietojot otrās paaudzes tehniku DNS fragmentu galu analīzei, var iegūt labus rezultātus ne tikai genoma “resekvencēšanā”, bet arī vēl nepētīta genoma sekvencēšanā de novo. Paired-ends or mate-pairs technique Nature 463,303(2010)
DIVU SEKVENCĒŠANAS STRATĒĢIJU SALĪDZINĀJUMS PLoS Biology 7,Nr.5,e1000112(2009)
GĒNU SKAITS CILVĒKA GENOMĀ Genome Biol.11,206(2010)
DAŽĀDU GENOMU SALĪDZINĀJUMS Caenorhabditis elegans: Chr. 1, 2, 3, 4, 5, X Genoma lielums: 100 281 416 bp Proteīnu kodējošie gēni: 20 140 Drosophila melanogaster: Chr. 2L, 2R, 3L, 3R, 4, X Genoma lielums: 132 576 936 bp Proteīnu kodējošie gēni: 14 039 Mus musculus: Chr. 1 – 19, X, Y Genoma lielums: 3 420 842 930 bp Proteīnu kodējošie gēni: 23 786 Homo sapiens: Chr. 1 – 22, X, Y Genoma lielums: 3 253 037 807 bp Proteīnu kodējošie gēni: 23 686
HUMAN GENOME DRAFT SEQUENCE – 2001 Kodējošie rajoni (gēni) aizņem tikai nelielu genoma daļu
CILVĒKA GENOMA SASTĀVDAĻU MOZAĪKA (atsevišķu struktūru procentuālais sastāvs genomā nav precīzs)
“DRAFT” GENOMA SEKVENCE VAR BŪTISKI ATŠĶIRTIES NO “FINISHED” SEKVENCES (Draft) (Finished) Cilvēka 20. hromosoma (66 Mb) Pārvietoto rajonu kopējais garums, salīdzinot abas sekvences: zils: zem 3 Mb; zaļš: 3–10 Mb; sarkans: virs 10 Mb Nature 414, 854-855 (2001)
TREŠAIS (PĒDĒJAIS) POSMS – LĪDZ 2003. GADAM, BET GENOMA STRUKTŪRAS PRECIZĒŠANA TURPINĀS • 2002. g. beigās – 98% eihromatīna daļas jau sekvenēti, pie tam 95% jau pabeigtā (finished) formā • 2003. g. 14. aprīlī Cilvēka genoma projekts paziņo, ka gandrīz visa eihromatīna daļa – 2.825 mljd. nukleotīdu secība iegūta pabeigtā (finished) formā • Viena no versijām – “build 35” aptver 99% eihromatīna sekvences (2.85 mljd. bp) ar precizitāti >99.995%: tikai 1 kļūda uz 100 000 bp. Sekvencē ir vairs tikai daži simti pārtraukumu (gap) un tie lokalizējas galvenokārt segmentu duplikāciju rajonos, arī pericentromēras un subtelomēru rajonos, tātad nekodējošajās hromosomu daļās (daļa gap īsti nepieder pie eihromatīna). • Pēc pašreizējām aplēsēm cilvēka genomā ir tikai 20 000 – 25 000 gēnu, taču proteīnu ir daudz vairāk. Apkopojošu rakstu par cilvēka genoma eihromatīna daļas sekvenci IHGSC (International Human Genome Sequencing Consortium) publicēja 2004. oktobrī: Finishing the euhromatic sequence of the human genome. Nature 431, 931-945 (2004) __________________________________________________ Jāievēro, ka genoma sekvencēšanā izmantota daudzu indivīdu DNS, tādēļ iegūtā genoma sekvence atbilst kādai vidējai DNS secībai, t.s. references genomam
VISAS HROMOSOMAS NOSEKVENĒTAS chr 22: 33.5 no 48 Mb – I. Dunham et al. Nature 402, 489-495 (1999) chr 21: 33.5 no 45 Mb – M. Hatori et al. Nature 405, 311-495 (2000) chr 20: 59.2 no 66 Mb –P. Deloukas et al. Nature 414, 865-871 (2001) chr 14: 87.4 no 107 Mb –R. Heilig et al. Nature 421, 601-607 (2003) chr Y: 12.7 no 51 Mb –H. Skaletsky et all. Nature 423, 825-837 (2003) chr 7: 153.8 no 163 Mb –L.W. Hillier et al. Nature 424, 157-164 (2003) chr 6: 166.9 no 176 Mb –A.J. Mungall et al. Nature 425, 805-811 (2003) chr 13: 95.5 no 118 Mb – A. Dunham et al. Nature 428, 522-528 (2004) chr 19: 55.8 no 72 Mb – J. Grimwood et al. Nature 428, 529-535 (2004) chr 9: 109.0 no 140 Mb – S.J. Humphray et al. Nature 429, 369-374 (2004) chr 10: 131.7 no 143 Mb – P. Deloukas et al. Nature 429, 375-381 (2004) chr 5: 177,7 no 198 Mb – J. Schmutz et al. Nature 431,268-274 (2004) chr 16: 78,9 no 104 Mb – J. Martin et al. Nature 432, 988-994 (2004) chr X: 150.4 no 155 Mb – M.T. Ross et al. Nature 434, 325-337 (2005) chr 18: 76.1 no 86 Mb – C. Nusbaum et al. Nature 437, 551-555 (2005) chr 2: 237.0 no 279 Mb – L.W. Hillier et al. Nature 434, 724-731 (2005) chr 4: 186.0 no 197 Mb – L.W. Hillier et al. Nature 434, 724-731 (2005) chr 8: 145.5 no 148 Mb – C. Nusbaum et al. Nature 439, 331-335 (2006) chr 12: 130,7 no 142 Mb – S.E. Scherer et al. Nature 440, 346-351 (2006) chr 11: 131,1 no 148 Mb – T.D. Taylor et al. Nature 440, 497-500 (2006) chr 15: 81,9 no 100 Mb – M.C. Zody et al. Nature 440, 671-675 (2006) chr 17: 78,8 no 88 Mb – M.C. Zody et al. Nature 440, 1045-1049 (2006) chr 3: 194,9 no 221 Mb – D.M. Muzny et al. Nature 440, 1194-1198 (2006) chr 1: 223,9 no 279 Mb – S.G. Gregory et al. Nature 441, 315-321 (2006)
LĪDZ ŠIM SEKVENCĒTĀ CILVĒKA GENOMA DAĻA Genome Res. 15, 1759 (2005)
NESEKVENCĒTIE GENOMA RAJONI (GAPS) 2009. gadā cilvēka genoma sekvencē joprojām ir ap 300 pārtraukumu (gaps) no 700 bp līdz 30 mlj. bp garumā, neskaitot plašus centromēru un telomēru rajonus (zaļš). Dažās vietās ir izteiktas sekvenču alternatīvas. Nature 462,843(2009)
DNS SEKVENCĒŠANAS METODES UN PROGRESS
JAUNAS DNS SEKVENCĒŠANAS METODES Jaunās jeb “otrās paaudzes” DNS sekvencēšanas metodes var iedalīt 2 grupās: • Sekvencēšana ar sintēzi (sequencing-by-synthesis) – jau ir lietošanā Pie tās pieder Sangera didezoksiterminatoru un t.s. pirosekvencēšanas metode mikrorindu (microarrays) vai mikrosfēru (microbeads) variantā. Jaunākais tās variants – Ion Torrent metode neizmanto terminatorus, bet atbrīvotā H+ noteikšanu.Trūkumi – var noteikt tikai īsas DNS sekvences, PCR pavairošanas kļūdas • Sekvencēšana ar ligēšanu (sequencing-by-ligation) – jau ir lietošanā Balstās uz DNS hibridizācijas principu, kas nodrošina ligēšanu. Izstrādāta mikrosfēru (microbeads) variantā. Būtībā tie paši trūkumi kas iepriekšējai metodei. Vēl nepilnīgi izstrādātas t.s. “trešās paaudzes” sekvencēšanas metodes: • vienas DNS molekulas sekvencēšana ar sintēzi – vēl izstrādes līmenī • Nanoporu sekvencēšana (nanopore sequencing) – vēl izstrādes līmenī
DNS SEKVENCĒŠANA PĒC SANGERA METODES neliels daudzums viena terminatora: ddATF DNS polimerāzes normālais substrāts: dATF, dGTF, dTTF, dCTF terminators ieslēdzas augošās ķēdes 3’-galā praimers sekvencējamais DNS pavediens
DNS SEKVENCĒŠANAS PRINCIPI PCR colony (polony) FIRST GENERATION (Sanger) TECHNOLOGY SECOND GENERATION (Clonal Amplification) TECHNOLOGY PCR amplifikācija Nature Biotechnol. 26,1135(2008)
KLONĀLĀS AMPLIFIKĀCIJAS METODES a: lieto 454(Roche) un SOLiD(Applied Biosystems) DNS sekvencēšanas tehnoloģijas b: lieto Solexa(Illumina) DNS sekvencēšanas tehnoloģija Nature Biotechnol. 26,1135(2008)
ION TORRENT SEKVENCĒŠANA Pēdējā laikā sevi pieteikusi jauna DNS sekvencēšanas metode, kas balstās uz jonu sekvencēšanas principa, t.s. Ion Torrent jeb jonu plūsmas metode. Tās pamatā ir labi zināmā DNS polimerāzes izmantošana sekvencējamās daļas papildināšanai (sequencing by synthesis). Taču pievienotā nukleotīda detekcijai izmanto nevis fluorescences tehniku, bet reakcijas laikā atbrīvotā H+ jona elektronisku noteikšanu ar pusvadītāju tehnoloģijas palīdzību. Sekvencējamo DNS pavedienu fiksē un pavairo uz jau iepriekš pazīstamām mikrosfērām. Metode izceļas ar savu lētumu un ātrumu. Nature Biotechnology 29,805(2011)
PERSONAL GENOMES
PIRMIE INDIVIDUĀLIE GENOMI – 2007/2008.g. Sekvencē katru no hromosomu pāriem un iegūst diploīda genoma struktūru J. C r a i g V e n t e r J a m e s W a t s o n Science 317,1311(2007) PLoS Biology, e254(2007) Sekvencēšanā lieto klasisko Sangera metodi, strādājot "shot-gun” tehnikā. Ventera hromosomu abi pāri atšķiras par 0.5% (bez bāžu apmaiņām – SNP ieskaita arī insercijas un delēcijas) Nature 452,818(2008) Nature 452, 872(2008) Sekvencēšanā lieto 454 (Roche AB) metodi
ATSEVIŠĶU HROMOSOMU HAPLOTIPĒŠANA SNP genotipēšana un CNV lokalizēšana, analizējot indivīda genoma sekvenci, tomēr nedod visu nepieciešamo informāciju, jo nespēj piesaistīt to vai citu alēli konkrētai hromosomai, tā padarot haplotipēšanu nepilnīgu. Precīza haplotipa iegūšana jeb t.s. haplotipu fāzēšana ir svarīga arī medicīniskiem mērķiem, jo no mutāciju lokalizācijas ir atkarīga tā vai cita gēna funkcionēšana. Līdz šim piedāvātas divas universālākas metodes haplotipu fāzēšanai. Viena no tām – Nature Biotechnology 29,59(2011) baltās uz plašas un reprezentatīvas genoma bibliotēkas sekvencēšanu un datu apstrādi, bet otra – Nature Biotechnology 29,51(2011) uz individuālu hromosomu nodalīšanu, amplifikāciju un sekvencēšanu. Nature Biotechnology 29,38(2011)
ATSEVIŠĶU HROMOSOMU HAPLOTIPĒŠANA Izstrādāta metode individuālu metafāzes hromosomu nodalīšanai un amplificēšanai(Microfluidics technique + Illumina Quad Bead Chip technique) 1. Notver vienu metafāzes šūnu 2. Sašķeļ hromatīnu ar pepsīnu atsevišķās hromosomās 3. Pārdala atsevišķas hromosomas pa iekārtas 48 kamerām 4. Hromosomas denaturācija un DNS amplifikācija ar PCR 5. Amplificētā materiāla izvadīšana, apvienošana (pools) un analīze Nature Biotechnol. 29,51(2011)