460 likes | 707 Views
Oversikt over kap.10. Utfordringer og strategier ved genomanalyseGenomst?rrelseEgenskaper m? ogs? analyseresProblemer med DNA polymorfismerUtvikling av hel-genom kartInnsikt kommer fra fullstendig genomsekvenseringAntall og type generGrad av repeterte sekvenserGenom organisering og struktur
E N D
1. Kap 10.Rekonstruksjon av Genomet Gjennom genetisk og molekylær analyse
2. Oversikt over kap.10 Utfordringer og strategier ved genomanalyse
Genomstørrelse
Egenskaper må også analyseres
Problemer med DNA polymorfismer
Utvikling av hel-genom kart
Innsikt kommer fra fullstendig genomsekvensering
Antall og type gener
Grad av repeterte sekvenser
Genom organisering og struktur
Evolusjon og lateral genoverføring
Høyeffektive verktøy for å analysere genomer og deres proteinprodukter
DNA sekvensatorer
DNA arrays (mikromatriser)
Massespektrofotometere
3. Genomene til levende organismer varierer enormt i størrelse
4. Genomikere ser på to hovedtrekk ved genomer: sekvens og polymorfisme Hovedutfordring å bestemme sekvensen til hvert kromosom i genomet og identifisere mange polymorfismer
Hvordan kan man sekvensere et 500 Mb kromosom med 600 bp på en gang?
Hvor nøyaktig skal en genomsekvens være?
DNA sekvenseringsfeil er på omkring 1% per 600 bp
Hvordan kan en skille sekvensfeil fra polymorfismer?
Forekomst av polymorfismer i diploide humane genomer er omkring 1 av 500 bp
Gjentatte sekvenser kan være vanskelige å plassere
Uklonbart DNA kan ikke sekvenseres
Opp til 30% av genomet er heterokromatisk DNA som ikke kan klones
5. Splitt og overvinn strategien imøtekommer de fleste utfordringer Kromosomer blir brutt ned i små overlappende biter og klonet
Endene til klonene blir sekvensert og satt sammen til de opprinnelige kromosomtrådene
Hvert stykke blir sekvensert mange ganger for å redusere feilmarginen
10-gangers sekvensdekning gir en feilmargin på mindre enn1/10 000
6. Figure 10.2Figure 10.2
7. Teknikker for kartlegging og kloning Kloning
Bibliotek med DNA fragmenter på 500 – 1,000,000 bp
Innskudd inn i diverse vektorer
Hybridisering
Lokalisering av spesielle DNA sekvenser innen biblioteket av fragmenter
PCR oppformering
Direkte oppformering av et spesielt område som spenner over fra 1 bp to > 20kb
DNA sekvensering
Automatisert DNA sekvensering som bruker Sanger metoden, bestemmer sekvenser på opptil 600 bp på en gang
Dataassistert verktøy
Programmer for å identifisere sammentreff mellom en spesiell sekvens og en stor populasjon av tidligere sekvenserte fragmenter
Programmer for å identifisere overlapp av DNA fragmenter
Programmer fro å estimere feilmargin
Programmer for å identifisere gener i kromosomale sekvenser
8. Lage storskala koblingskart Typer av DNA polymorfismer brukt til storskala kartlegging
Single nukleotide polymorfismer (SNPs) – 1/500 – 1/1000 bp gjennom genomet
Enkle (Simple) sekvens repetisjoner (SSRs) – 1/20-1/40 kb gjennom genomet
2-5 nukleotides blir repetert 4-50 eller flere ganger
De fleste SNP'er og SSR'er har liten eller ingen effekt på organismen
Fungerer som DNA markører gjennom kromosomene
Må være i stand til å raskt identifisere og analysere populasjoner fra 100vis til 1000vis av individer Figure 10.3Figure 10.3
9. Genetiske markører identifiserer hele genomer De første genetiske kart brukte SSR'er som er høyt polymorfe
Identifisert ved screening av DNA biblioteker med SSR prober
Oppformert ved PCR og lengde- forskjeller analysert
SNP'er – millioner flere i det siste identifisert ved sammenligning av ortologe områder av cDNA kloner fra ulike individer
10. Homologer – gener med tilstrekkelig sekvenslikhet til å være beslektet til en viss grad i evolusjonshistorien
Ortologer – gener i to forskjellige arter som oppsto fra det samme genet i de to artenes felles stamfar
Paraloger – oppsto ved duplisering innen sammen art
Ortologe gener er alltid homologe, men homologe gener er ikke alltid ortologe
11. SNP’er og SSR’er ved genom dekning Inntil nylig ble kart konstruert fra omkring 500 SSR’er jevnt spredd tvers gjennom genomet (1 SSR for hver 6 Mb)
SNP’er gir mer enn 500,000 DNA markører tvers gjennom genomet
12. Typing av genetiske markører over hele Genomet To – trinns analyse for enkle sekvens repetisjoner
PCR oppformering
Størrelses separasjon Figure 10.4Figure 10.4
13. Langtrekkende fysiske kart: karyotyper og genomiske bibliotek posisjonerer markører på kromosomene Fysiske kart
Overlappende DNA fragmenter ordnet og orientert over hele spennet av kromosomene
Basert på direkte analyse av DNA istedet for rekombinasjon som koblingskart er basert på
Kartlegger virkelig antall bp, kb, eller Mb som skiller et lokus fra sine naboer
Koblings- kontra fysiske kart
1 cM = 1 Mb i mennesker
1 cM = 2 Mb i mus
14. Vektorer brukt til å klone store inskudd til fysisk kartlegging YAC’er (yeast artificial chromosomes)
Innskudd størrelse 100-1,000,000 Mb
BAC’er (bacterial artificial chromosomes)
Innskudd størrelse 50 – 300 kb
Mer stabile og lettere å rense fra verts DNA enn YAC’er
15. Hvordan bestemme rekkefølgen av kloner gjennom genomet Overlappende innskudd hjelper til med å sette sammen klonede fragmenter
Ovenfra og ned tilnærming– innskudd blir hybridisert mot karyotype av hele genomet
Nedenfra og opp tilnærming – overlappende sekvenser av titusenvis av kloner bestemmes ved restriksjonsseteanalyse eller sekvens- merkede (tag) seter (STS’er)
16. Human Karyotype (a) Fullstendig sett med humane kromosomer farget med Giemsa fargestoff viser bånd
(b) Ideogrammer viser idealiserte båndmønstre Figure 10.5 aFigure 10.5 a
17. Kromosom 7 ved tre oppløsningsnivåer Figure 10.5 bFigure 10.5 b
18. FISH protokoll for ovenfra og ned tilnærming Figure 10.6Figure 10.6
19. DNA hybridisering og restriksjonskartlegging – en nedenfra og opp tilnærming Figure 10.7Figure 10.7
20. Identifisering og isolering av ett sett med overlappende fragmenter fra et bibliotek To tilnærminger
Koblingskart brukes til å utvikle fysiske kart
Sett av markører mindre enn1 cM fra hverandre
Bruk markører til å gjenfinne fragmenter fra biblioteker ved hybridisering
Konstruer kontiger – to eller flere delvis overlappende klonede fragmenter
Kromosomvandring ved å bruke ender av usammenhengende kontiger til å probe fragmenter i ukartlagte områder
Fysiske kartleggingsteknikker
Direkte analyse av DNA
Overlappende kloner settes sammen ved restriksjonskartlegging
Sekvens merkede (tagged) segmenter (STS’er)
21. Høyoppløselig koblings kartlegging til å bygge overlappende sett av genomiske kloner Figure 10.8Figure 10.8
22. Fysisk kartlegging av overlappende genomiske kloner uten koblingsinformasjon Figure 10.10Figure 10.10
23. Fysisk kartlegging ved analyse av STS’er Figure 10.11Figure 10.11
24. Sekvenskart viser rekkefølgen av nukleotider i et klonet stykke DNA To strategier for å sekvensere det humane genom
Hierarkisk shotgun tilnærming
Hel-genom shotgun tilnærming
Shotgun – tilfeldig genererte overlappende innskutte fraagmenter
Fragmenter fra BAC’er
Fragmenter fra oppkutting av hele genomet
Oppkutting av DNA ved sonikering
Delvis fordøying med restriksjonsensymer
25. Hierarkisk shotgun strategiBrukt av den offentlig støttede innsats for å sekvensere det humane genom Kutt 200 kb BAC kloner i ~2 kb fragmenter
Sekvenser endene 10 ganger
Nødvendig med omkring 1700 plasmid innskudd per BAC og omkring 20,000 BAC’er for å dekke genomet
Data fra kobling og fysiske kart brukes til å sette sammen sekvenskart av kromosomene
Betydelig arbeid i å lage bibliotek av hver BAC og fysisk kartlegge BAC kloner Figure 10.12Figure 10.12
26. Hel-genom shotgun sekvenseringBrukt av det private firma Celera til å sekvensere hele det humane genom Hel-genom tilfeldig kuttet tre ganger
Plasmid bibliotek konstruert med ~ 2kb innskudd
Plasmid bibliotek ~10 kb innskudd
BAC lbibliotek med ~ 200 kb innskudd
Dataprogram setter sammen sekvenser inn i kromosomer
Ingen fysisk kartkonstuering
Bare et BAC bibliotek
Overvinner vanskelighetene med repeterte sekvenser Figure 10.13Figure 10.13
27. Begrensninger ved hel-genom sekvensering Noe DNA kan ikke klones
F.eks. heterokromatin
Noen sekvenser omarrangeres eller opprettholder delesjoner når de klones
Fremtidig stor-genom sekvensering vil bruke begge typer shotgun tilnærming
28. Sekvensering av det humane genom Det meste av prosessen skjedde iløpet av det siste året av prosjektet
Instrumentforbedringer – 3545,600 bp/dag
Automatisert fabrikkmessig produksjonslinje skaffet tilstrekkelig DNA til å forsyne sekvensatorene daglig
Store sekvenseringssentra med 100-300 instrumenter – 103,680,000 bp/dag
29. Integrering av koblings-fysiske- og sekvenskart Gir en kontroll av den riktige rekkefølgen av hvert kart mot de to andre
SSR og SNP DNA koblingsmarkører ble raskt integrert inn i fysiske kart ved PCR analyser gjennom innsatte kloner i fysiske kart
SSR, SNP (koblingskart), og STS markører (fysiske kart) har unike sekvenser på 20 bp eller mer og tar hensyn til plassering på sekvenskart
30. Forandringer i biologi, genetikk og genomiks fra den humane genomsekvens Genetikkens viktige punkter så langt
Fremskynder gen-finning og gen-funksjons analyse
Sekvensidentifisering i andre organismer gjennom homologi
Gen funksjon i en organisme hjelper til med å forstå funksjon i en annen med hensyn på ortologe og paraloge gener
Gener koder ofte for ett eller flere protein domener
Tillater gjetning på funksjon av nye proteiner ved sammenligning av protein sekvenser i databaser over alle kjente domener
Rask tilgang til identifisering av kjente humane polymorfismer
Fremskynder kartlegging av nye organismer ved sammenligning
F-eks. Mus og mennesker har høy likhet i geninnhold og rekkefølge
31. Hvordan transkripsjonsfaktor-proteindomener har utbredd seg i spesielle slekter Figure 10.14Figure 10.14
32. Konserverte segmenter i sammensatte blokker i humane og muse-genomer Figure 10
10.15Figure 10
10.15
33. Hovedinnsikt fra human- og modellorganismesekvenser Omkring 40,000 humane gener
Gener koder for ikke-kodende RNA eller proteiner
Repeterte sekvenser utgjør > 50% av genomet
Tydelige typer av genorganisering
Kombinasjonsstrategier gir øket genetisk informasjon og øker mangfoldet
Evolusjon ved lateral overføring av gener fra en organisme til en annen
Menn har dobbelt så høy mutasjonsgrad som kvinner
Humane raser har veldig få unike kjennetegnende gener
Alle levende organismer stammer fra en felles stamfar
34. Gjenstående spørsmål omkring det Humane Genomet Vanskelig å presist anslå antall gener på nåværende tidspunkt
Det fullstendige genom er ikke nøyaktig sekvensert
Små gener er vanskelige å identifisere
Noen gener blir sjelden uttrykt og har ikke normalt kodon bruksmønster – derfor vanskelige å påvise
35. Ikke-kodende RNA gener Transport RNA’er (tRNAs) – tilretteleggere som oversetter triplett koder fra RNA til aminosyresekvenser av proteiner
Ribosomal RNA’er (rRNAs) – komponenter av ribosomet
Small nucleolar RNA’er (snoRNAs) – RNA bearbeiding og basemodifisering i kjernen
Small nuclear RNA’er (sncRNAs) - spleisosomer
36. Protein kodende gener danner proteomet Proteome – kollektiv translation av 30,000 proteinkodende gener over i proteiner
Kompleksiteten i proteomet øker fra gjær til mennesker
Flere gener
Lurere kobling, økning eller minsking av funksjoneller moduler
Flere paraloger
Alternativ RNA spleising – mennesker innehar betydelig mer
Kjemisk modifikasjon av proteiner er høyere i mennesker
37. Repeterte sekvenser faller inn i fem klasser Transposon-avledete repetisjoner
Bearbeidede pseudogener
SSRs
Segmentielle duplikasjoner på 10-300 kb
Blokker av repeterte sekvenser ved sentromerer, telomererer og andre kromosomale særtrekk
38. Gen organisering av genomet Gen familier
Nært beslektede gener gruppert eller spredd
Gen-rike områder
Funksjonelle eller tilfeldige hendelser?
Gen ørkener
Utgjør 144 Mb eller 3% av genomet
Inneholder regioner som er vanskelige å identifisere?
F.eks store gener – nukleære transkripter utgjør 500 kb eller mer med veldig store introns (exons < 1% of DNA)
39. Lateral overføring av gener > 200 humane gener kan ha oppstått ved overførsel fra organismer som bakterier
Lateral overførsel er direkte overførsel fra gener fra en art til kjønnscellene til en annen
40. Dobbelt så høy mutasjonsgrad i menn Sammenligning av X og Y kromosomer
Det samme kan være tilfelle i autosomer, men vanskelig å måle
Hovedmengden av humane mutasjoner skjer i menn
Menn gir opphav til flere feil, men også mer mangfold
41. Menneskeraser har tilsvarende gener Genom sekvenssentra har sekvensert betydelige deler av minst tre raser
Variasjonsbredden av polymorfismer innen en rase kan være mye større enn variasjonsbredden mellom to individer av forskjellig rase
Veldig få gener er rasespesifikke
Genetisk er mennesker en enkelt rase
42. Alle levende organismer er en enkelt rase Alle levende organismer har bemerkelses- verdige like genkomponenter
Livet oppstod en gang og vi er etterkommere av den hendelsen
Analyse av passende biologiske systemer i modellorganismer gir grunnleggende innsikt i de tilsvarende humane systemer
43. Høyeffektive instrumenterDNA sekvensator Figure 10.23Figure 10.23
44. Høyeffektive instrumenter eks, mikromatriser (arrays) Figure 10.24Figure 10.24
45. Figure 10.25Figure 10.25
46. Massespektrometer Figure 10.27Figure 10.27
47. Sosiale, etiske, og rettslige spørsmål Privatisering av genetisk informasjon
Begrensninger ved genetisk testing
Patentering av DNA sekvenses
Samfunnets syn på eldre mennesker
Opplæring av leger
Human genetisk ingeniørkunst
Somatisk gen terapi – innsetting av erstatningsgener
Kjønnscelle terapi – modifikasjon på de humane kjønnsceller