1 / 15

Gena- og gagnas öfn (GEG1103)

Gena- og gagnas öfn (GEG1103). Fyrirlestrar 33-34 Genamengi heilkjörnunga og greining þeirra. Genamengi heilkjörnunga. Mikill munur á genamengi dreifkjörnunga vs . heilkjörnunga Önnur stærðargráða Margir litningar

zelda
Download Presentation

Gena- og gagnas öfn (GEG1103)

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Gena- og gagnasöfn (GEG1103) Fyrirlestrar 33-34 Genamengi heilkjörnunga og greining þeirra

  2. Genamengi heilkjörnunga • Mikill munur á genamengi dreifkjörnunga vs. heilkjörnunga • Önnur stærðargráða • Margir litningar • Samstæði (homology) litninga veldur fjölbreytni (polymorphism) erfðamengisins: í tvílitna lífveru eru tvær kópíur af hverjum litningi sem ekki þurfa að vera nákvæmlega eins • Margar gerðir af stýrlum og oft margir stýrlar fyrir sama gen • Transcription factors • 3 mismunandi RNA polymerasar • „Junk DNA“

  3. Genamengi heilkjörnunga • Junk  Garbage • Um 97% af genamengi mannsins er „junk“ • Óvirk gen (pseudogenes) • Strúktúrar sem ekki eru gen eða þekktir stýrlar • Verndar junk-ið gen gegn stökkbreytingum?? • En margt „junk“ er mjög geymið!! • Oft endurteknir raðabútar (repeats) • Endurtekningar í röð (tandem repeats) kallast minisatellites og microsatellites(eftir því hve endurtekna einingin er stór) • Tapast oft öll eða að hluta  hypervariable svæði á genamenginu  nýtast vel til rannsókna á mikið skyldum lífverum http://www.mun.ca/biology/scarr/

  4. Genamengi heilkjörnunga • Erfiðara að finna genin í DNA heilkjörnunga en dreifkjörnunga • intronur og extronur (GU-AGregla getur gagnast) • Alternative splicing • aðrar breytingar á mRNA (poly-A, capping) • stýrlar (promoters) ekki eins skýrt afmarkaðir og geta verið fjarri geni (TATA-box þó oft gagnleg) • ORF-finder o.þ.h. forrit duga ekki til  Notum forrit sem byggja á Markov-keðjum eða sambærilegri tölfræði • CpG eyjar: tíðni CG tvíkirnisins almennt ~ 20% af random-tíðni (þ.e.: 1,25%), en er há við 5´-enda margra gena • Codon usage bias: lífverur virðast hafa „preferens“ fyrir sumum táknum umfram aðra (http://www.cancerwatch.org/glossary/glossary_8.cfm)

  5. Spendýr Maður (Homo sapiens) Simpansi (Pan troglodytes) Górilla (Gorilla gorilla) Órangútan (Pongo pygmaeus) Rhesusapi (Macaca mulatta) „Galagóapi“ (Otolemur garnettii) Trjásnjáldra (Tupaia belangeri ) Hundur (Canis familiaris) Köttur (Felis catus) Hestur (Equus caballus) Kýr (Bos taurus) Afríkufíll (Loxodonta africana) Ljósfæla (Myotis lucifugus) Mús (Mus musculus) Rotta (Rattus rattus) Naggrís (Cavia porcellus) Pokarotta (Monodelphis domestica) Kanína (Oryctolagus cuniculus ) Madagascar-broddgöltur (Echinops telfairi ) Evrópski broddgöltur (Erinaceus europaeus) Beltisdýr (Dasypus novemcinctus) Breiðnefur (Ornithorhynchus anatinus ) Önnur hryggdýr Hænsn (Gallus gallus) Afríski klófroskur (Xenopus tropicalis) Zebrafiskur (Danio rerio) Japanski kúlufiskur (Takifugu rubripes) Græni kúlufiskur (Tetraodon nigroviridis) Japanski hrísfiskur (Oryzias latipes ) Hornsíli (Gasterosteus aculeatus ) Aðrir síðmynnlar Möttuldýr (Ciona intestinalis, Ciona savignyi ) Ígulker (Strongylocentrotus purpuratus) Frummynnlar Malaríuberandi moskítófluga (Anopheles gambiae) Guluberandi moskítófluga (Aedes aegypti) Bananafluga (Drosophila melanogaster + a.m.k. 5 aðrar Drosophila flugur) Hunangsfluga (Apis mellifera) Flatormur (Caenorhabditis elegans) Flatormur (Caenorhabditis briggsae) Silkiormur (Bombyx mori) Hveitibjalla (Tribolium castaneum) Genamengi dýra (metazoa) Þessi dýragenóm eru í dag fullgerð, eða nálægt því, og hægt að nálgast í aðalsafni ENSEMBL og/eða NCBI:

  6. Ígulker • „Fjólublái skollakoppur“ (Strongylocentrotus purpuratus) er náskyldur skollakoppi (S. droebachensis) (varist að rugla saman við purpurakopp, Paracentrotus lividus) • Tilheyrir flokki ígulkerja (Echinoidea) innan fylkingar skrápdýra (Echinodermata) • Finnst í Kyrrahafinu við strendur Kanada, Bandaríkjanna og Mexíkó

  7. Ígulker • Hefur lengi verið „módellífvera“ við rannsóknir á frjóvgun og fósturþróska • Æxlun er hefðbundin ytri kynæxlun: dýrin (bæði karl- og kvendýr) dæla kynfrumum sínum út í umhverfið (sjóinn) þar sem sáðfrumurnar frjóvga eggin (ytri frjóvgun) • Losun kynfrumna eins dýrs örvar losun kynfrumna nágranna (eykur líkur á frjóvgun) •  Mikill fjöldi kynfrumna úr mörgum einstaklingum á sama stað á sama tíma  Mikill fjölbreytileiki (polymorphism) í erfðamengi (um 4-5%) og arfblendni (heterozygosity) í genasjóði (gene pool) Lirfa skollakopps (S.droebachensis)

  8. Raðgreiningin • Raðgreining: notast við bæði haglabyssuraðgreiningu (WGS) og þreparaðgreiningu byggða á BAC-nálgun. • Samtals 8 „coverage“, sem nær yfir >90% erfðamengisins • Fjölbreytileiki (polymorphism) erfðamengisins er verulegur (um 4-5% munur milli samsvarandi litninga), en það torveldar „pússlun“ (assembly) contiga •  Margföld yfirferð þ.s. leitað var að götum og margföldunum með ýmsum aðferðum • Lokaútgáfan: 814 Mb erfðamengi(sem er í góðu samræmi við áður mæld gildi), mósaík setraðanna (haplotype) tveggja úr raðgreinda einstaklingnum. Fig. S1. Assemblies of the sea urchin genome. DNA from a single animal was used to make WGS and BAC libraries. The WGS reads were assembled when coverage reached 3x (v 0.1) and 6x (v 0.5). Because of heterozygosity, the redundancy of the initial assembly of the 6x WGS data set was high and a new module of Atlas, called Polyjoin, was developed to detect and merge redundant contigs. The BAC clones were fingerprinted and an FPC map was constructed, from which clones forming a minimal tiling path were selected. These clones were sequenced to approximately 2x coverage (“skimmed”) using the CAPSS strategy. The BAC skim reads were combined with the WGS reads to form eBACs, using a modified version of Atlas that avoided assembling highly divergent sequences from the two haplotypes. The eBACs were stitched together according to their position in the tiling path, and remaining gaps between BACs were filled in with contigs from the v 0.5 assembly. The resulting assembly (v 2.0) was purified of contaminating sequences to produce the final assembly, v 2.1. Stars indicate the new steps introduced in the assembly procedure.

  9. Genaskimun • Mörgum aðferðum var beitt við genaskimun í erfðamenginu, þ.á.m.: • Gnomon (http://www.ncbi.nlm.nih.gov/genome/guide/gnomon.html), en þar eru einkenni á borð við Codon Usage Bias o.fl. lesin úr þekktum prótín- og RNA-röðum tegundarinnar og hulið Markov-líkan útbúið út frá þeim upplýsingum, contig svo skimuð með því. • FgenesH (www.softberry.com) byggir einnig á huldum Markov-líkönum. (Til eru viðbætur við FgenesH þ.s. bætt er við skimun byggðri á samsvörun við þekkt hneppi.) • o.fl. (BCM-HGSC & NIDCR) • Niðurstöður skimana mataðar í GLEAN forritið (http://sourceforge.net/projects/glean-gene) sem býr til samhæfða genaspá. • Genalistinn (sem innihélt ~28.900 hugsanleg gen) sannreyndur gegn 560 þekktum genum úr S. purpuratus. • Eftir skimun til að finna hugsanleg „pseudogen“ o.fl., „lokaútgáfa“ erfðamengisins var sögð innihalda ~23.300 gen • Kortlagning genanna er enn aðeins afstæð – hafa ekki verið kortlögð á litningana 22. Yfirlitsskema yfir skýringaferlið.

  10. Genaskimun GC content distribution. In Fig. S5, the lengths of base composition domains are compared in four species. The same pattern occurs in all four species - long domains tend to be of average %GC, short domains tend to be very high or low %GC. Genes in sea urchin occur in a relatively narrow range with respect to %GC. In Fig. S6, the distribution of genes with respect to GC content, notice that there is no strong tendency for genes to occur in the genome's more Atrich GC content domains (as in A. mellifera) or more GC-rich GC content domains (as in D. melanogaster and A. gambiae)(44). Also, in sea urchin both GC content domains and genes both tend to occur in a very narrow range of %GC, from about 35% - 39%.

  11. Skýring erfðamengisins • Um 200 sérfræðingar komu að skýringu erfðamengisins. • Skýring er mikið til handvirk og byggð á svipun og einsleitni genaafurða samanborið við: • þekktar genaafurðir • þekktar „prótínfjölskyldur“ (t.d. PFAM) • þekkt hneppi og mótív Table 2. Distribution among sequenced animal genomes of various Pfam domains associated with selected aspects of eukaryotic cell physiology. In S. purpuratus, the number of annotated genes is listed; the number in parentheses is the total number of models (including ones that were not annotated) predicted to contain the Pfam domain. For Nematostella veciensis (Nv), numbers were obtained by searching Stellabase

  12. Skýring erfðamengisins • Mörg gen lík hryggdýragenum, ólík frummynnlagenum  staðfestir að skrápdýr eru skyldari seildýrum en frummynnlum Fig. 2. Orthologs among the Bilateria. The number of 1:1 orthologs captured by BLAST alignments at a match value of e = 1 x 10–6 in comparisons of sequenced genomes among the Bilateria. The number of orthologs is indicated in the boxes along the arrows, and the total number of International Protein Index database sequences is shown under the species symbol. Hs, Homo sapiens; Mm, Mus musculus; Ci, Ciona intestinalis; Sp, S. purpuratus; Dm, Drosophila melanogaster; Ce, Caenorhabditis elegans.

  13. Rast et al. 2006 (Science314, 952-956)

  14. Umritamengi fósturþroska • Búnar til 27 flögur (tiling arrays) sem samtals innihéldu 10.133.868 50-kirna depla sem spönnuðu allt erfðamengið á bæði + og – þráðum, jafnt prótínkóðandi sem ókóðandi kirni • Ættum að sjá öll umrituð kirni (að því gefnu að allt RNA einangrist og basaparist rétt á flögu)

  15. Umritamengi fósturþroska • RNA einangrað úr frumum 0, 15, 30 og 45 klst. eftir frjóvgun • cDNA myndað og fleytt yfir flögurnar • Um helmingur (~11.500) prótínkóðandi gena ígulkersins eru tjáð á fyrstu 2 dögum fósturþroskans • Einnig koma um 51.000 önnur RNA-mólekúl við sögu

More Related