460 likes | 713 Views
Oversikt over kap.10. Utfordringer og strategier ved genomanalyseGenomst?rrelseEgenskaper m? ogs? analyseresProblemer med DNA polymorfismerUtvikling av hel-genom kartInnsikt kommer fra fullstendig genomsekvenseringAntall og type generGrad av repeterte sekvenserGenom organisering og struktur
E N D
1. Kap 10.Rekonstruksjon av Genomet Gjennom genetisk og molekyl�r analyse
2. Oversikt over kap.10 Utfordringer og strategier ved genomanalyse
Genomst�rrelse
Egenskaper m� ogs� analyseres
Problemer med DNA polymorfismer
Utvikling av hel-genom kart
Innsikt kommer fra fullstendig genomsekvensering
Antall og type gener
Grad av repeterte sekvenser
Genom organisering og struktur
Evolusjon og lateral genoverf�ring
H�yeffektive verkt�y for � analysere genomer og deres proteinprodukter
DNA sekvensatorer
DNA arrays (mikromatriser)
Massespektrofotometere
3. Genomene til levende organismer varierer enormt i st�rrelse
4. Genomikere ser p� to hovedtrekk ved genomer: sekvens og polymorfisme Hovedutfordring � bestemme sekvensen til hvert kromosom i genomet og identifisere mange polymorfismer
Hvordan kan man sekvensere et 500 Mb kromosom med 600 bp p� en gang?
Hvor n�yaktig skal en genomsekvens v�re?
DNA sekvenseringsfeil er p� omkring 1% per 600 bp
Hvordan kan en skille sekvensfeil fra polymorfismer?
Forekomst av polymorfismer i diploide humane genomer er omkring 1 av 500 bp
Gjentatte sekvenser kan v�re vanskelige � plassere
Uklonbart DNA kan ikke sekvenseres
Opp til 30% av genomet er heterokromatisk DNA som ikke kan klones
5. Splitt og overvinn strategien im�tekommer de fleste utfordringer Kromosomer blir brutt ned i sm� overlappende biter og klonet
Endene til klonene blir sekvensert og satt sammen til de opprinnelige kromosomtr�dene
Hvert stykke blir sekvensert mange ganger for � redusere feilmarginen
10-gangers sekvensdekning gir en feilmargin p� mindre enn1/10 000
6. Figure 10.2Figure 10.2
7. Teknikker for kartlegging og kloning Kloning
Bibliotek med DNA fragmenter p� 500 � 1,000,000 bp
Innskudd inn i diverse vektorer
Hybridisering
Lokalisering av spesielle DNA sekvenser innen biblioteket av fragmenter
PCR oppformering
Direkte oppformering av et spesielt omr�de som spenner over fra 1 bp to > 20kb
DNA sekvensering
Automatisert DNA sekvensering som bruker Sanger metoden, bestemmer sekvenser p� opptil 600 bp p� en gang
Dataassistert verkt�y
Programmer for � identifisere sammentreff mellom en spesiell sekvens og en stor populasjon av tidligere sekvenserte fragmenter
Programmer for � identifisere overlapp av DNA fragmenter
Programmer fro � estimere feilmargin
Programmer for � identifisere gener i kromosomale sekvenser
8. Lage storskala koblingskart Typer av DNA polymorfismer brukt til storskala kartlegging
Single nukleotide polymorfismer (SNPs) � 1/500 � 1/1000 bp gjennom genomet
Enkle (Simple) sekvens repetisjoner (SSRs) � 1/20-1/40 kb gjennom genomet
2-5 nukleotides blir repetert 4-50 eller flere ganger
De fleste SNP'er og SSR'er har liten eller ingen effekt p� organismen
Fungerer som DNA mark�rer gjennom kromosomene
M� v�re i stand til � raskt identifisere og analysere populasjoner fra 100vis til 1000vis av individer Figure 10.3Figure 10.3
9. Genetiske mark�rer identifiserer hele genomer De f�rste genetiske kart brukte SSR'er som er h�yt polymorfe
Identifisert ved screening av DNA biblioteker med SSR prober
Oppformert ved PCR og lengde- forskjeller analysert
SNP'er � millioner flere i det siste identifisert ved sammenligning av ortologe omr�der av cDNA kloner fra ulike individer
10. Homologer � gener med tilstrekkelig sekvenslikhet til � v�re beslektet til en viss grad i evolusjonshistorien
Ortologer � gener i to forskjellige arter som oppsto fra det samme genet i de to artenes felles stamfar
Paraloger � oppsto ved duplisering innen sammen art
Ortologe gener er alltid homologe, men homologe gener er ikke alltid ortologe
11. SNP�er og SSR�er ved genom dekning Inntil nylig ble kart konstruert fra omkring 500 SSR�er jevnt spredd tvers gjennom genomet (1 SSR for hver 6 Mb)
SNP�er gir mer enn 500,000 DNA mark�rer tvers gjennom genomet
12. Typing av genetiske mark�rer over hele Genomet To � trinns analyse for enkle sekvens repetisjoner
PCR oppformering
St�rrelses separasjon Figure 10.4Figure 10.4
13. Langtrekkende fysiske kart: karyotyper og genomiske bibliotek posisjonerer mark�rer p� kromosomene Fysiske kart
Overlappende DNA fragmenter ordnet og orientert over hele spennet av kromosomene
Basert p� direkte analyse av DNA istedet for rekombinasjon som koblingskart er basert p�
Kartlegger virkelig antall bp, kb, eller Mb som skiller et lokus fra sine naboer
Koblings- kontra fysiske kart
1 cM = 1 Mb i mennesker
1 cM = 2 Mb i mus
14. Vektorer brukt til � klone store inskudd til fysisk kartlegging YAC�er (yeast artificial chromosomes)
Innskudd st�rrelse 100-1,000,000 Mb
BAC�er (bacterial artificial chromosomes)
Innskudd st�rrelse 50 � 300 kb
Mer stabile og lettere � rense fra verts DNA enn YAC�er
15. Hvordan bestemme rekkef�lgen av kloner gjennom genomet Overlappende innskudd hjelper til med � sette sammen klonede fragmenter
Ovenfra og ned tiln�rming� innskudd blir hybridisert mot karyotype av hele genomet
Nedenfra og opp tiln�rming � overlappende sekvenser av titusenvis av kloner bestemmes ved restriksjonsseteanalyse eller sekvens- merkede (tag) seter (STS�er)
16. Human Karyotype (a) Fullstendig sett med humane kromosomer farget med Giemsa fargestoff viser b�nd
(b) Ideogrammer viser idealiserte b�ndm�nstre Figure 10.5 aFigure 10.5 a
17. Kromosom 7 ved tre oppl�sningsniv�er Figure 10.5 bFigure 10.5 b
18. FISH protokoll for ovenfra og ned tiln�rming Figure 10.6Figure 10.6
19. DNA hybridisering og restriksjonskartlegging � en nedenfra og opp tiln�rming Figure 10.7Figure 10.7
20. Identifisering og isolering av ett sett med overlappende fragmenter fra et bibliotek To tiln�rminger
Koblingskart brukes til � utvikle fysiske kart
Sett av mark�rer mindre enn1 cM fra hverandre
Bruk mark�rer til � gjenfinne fragmenter fra biblioteker ved hybridisering
Konstruer kontiger � to eller flere delvis overlappende klonede fragmenter
Kromosomvandring ved � bruke ender av usammenhengende kontiger til � probe fragmenter i ukartlagte omr�der
Fysiske kartleggingsteknikker
Direkte analyse av DNA
Overlappende kloner settes sammen ved restriksjonskartlegging
Sekvens merkede (tagged) segmenter (STS�er)
21. H�yoppl�selig koblings kartlegging til � bygge overlappende sett av genomiske kloner Figure 10.8Figure 10.8
22. Fysisk kartlegging av overlappende genomiske kloner uten koblingsinformasjon Figure 10.10Figure 10.10
23. Fysisk kartlegging ved analyse av STS�er Figure 10.11Figure 10.11
24. Sekvenskart viser rekkef�lgen av nukleotider i et klonet stykke DNA To strategier for � sekvensere det humane genom
Hierarkisk shotgun tiln�rming
Hel-genom shotgun tiln�rming
Shotgun � tilfeldig genererte overlappende innskutte fraagmenter
Fragmenter fra BAC�er
Fragmenter fra oppkutting av hele genomet
Oppkutting av DNA ved sonikering
Delvis ford�ying med restriksjonsensymer
25. Hierarkisk shotgun strategiBrukt av den offentlig st�ttede innsats for � sekvensere det humane genom Kutt 200 kb BAC kloner i ~2 kb fragmenter
Sekvenser endene 10 ganger
N�dvendig med omkring 1700 plasmid innskudd per BAC og omkring 20,000 BAC�er for � dekke genomet
Data fra kobling og fysiske kart brukes til � sette sammen sekvenskart av kromosomene
Betydelig arbeid i � lage bibliotek av hver BAC og fysisk kartlegge BAC kloner Figure 10.12Figure 10.12
26. Hel-genom shotgun sekvenseringBrukt av det private firma Celera til � sekvensere hele det humane genom Hel-genom tilfeldig kuttet tre ganger
Plasmid bibliotek konstruert med ~ 2kb innskudd
Plasmid bibliotek ~10 kb innskudd
BAC lbibliotek med ~ 200 kb innskudd
Dataprogram setter sammen sekvenser inn i kromosomer
Ingen fysisk kartkonstuering
Bare et BAC bibliotek
Overvinner vanskelighetene med repeterte sekvenser Figure 10.13Figure 10.13
27. Begrensninger ved hel-genom sekvensering Noe DNA kan ikke klones
F.eks. heterokromatin
Noen sekvenser omarrangeres eller opprettholder delesjoner n�r de klones
Fremtidig stor-genom sekvensering vil bruke begge typer shotgun tiln�rming
28. Sekvensering av det humane genom Det meste av prosessen skjedde il�pet av det siste �ret av prosjektet
Instrumentforbedringer � 3545,600 bp/dag
Automatisert fabrikkmessig produksjonslinje skaffet tilstrekkelig DNA til � forsyne sekvensatorene daglig
Store sekvenseringssentra med 100-300 instrumenter � 103,680,000 bp/dag
29. Integrering av koblings-fysiske- og sekvenskart Gir en kontroll av den riktige rekkef�lgen av hvert kart mot de to andre
SSR og SNP DNA koblingsmark�rer ble raskt integrert inn i fysiske kart ved PCR analyser gjennom innsatte kloner i fysiske kart
SSR, SNP (koblingskart), og STS mark�rer (fysiske kart) har unike sekvenser p� 20 bp eller mer og tar hensyn til plassering p� sekvenskart
30. Forandringer i biologi, genetikk og genomiks fra den humane genomsekvens Genetikkens viktige punkter s� langt
Fremskynder gen-finning og gen-funksjons analyse
Sekvensidentifisering i andre organismer gjennom homologi
Gen funksjon i en organisme hjelper til med � forst� funksjon i en annen med hensyn p� ortologe og paraloge gener
Gener koder ofte for ett eller flere protein domener
Tillater gjetning p� funksjon av nye proteiner ved sammenligning av protein sekvenser i databaser over alle kjente domener
Rask tilgang til identifisering av kjente humane polymorfismer
Fremskynder kartlegging av nye organismer ved sammenligning
F-eks. Mus og mennesker har h�y likhet i geninnhold og rekkef�lge
31. Hvordan transkripsjonsfaktor-proteindomener har utbredd seg i spesielle slekter Figure 10.14Figure 10.14
32. Konserverte segmenter i sammensatte blokker i humane og muse-genomer Figure 10
10.15Figure 10
10.15
33. Hovedinnsikt fra human- og modellorganismesekvenser Omkring 40,000 humane gener
Gener koder for ikke-kodende RNA eller proteiner
Repeterte sekvenser utgj�r > 50% av genomet
Tydelige typer av genorganisering
Kombinasjonsstrategier gir �ket genetisk informasjon og �ker mangfoldet
Evolusjon ved lateral overf�ring av gener fra en organisme til en annen
Menn har dobbelt s� h�y mutasjonsgrad som kvinner
Humane raser har veldig f� unike kjennetegnende gener
Alle levende organismer stammer fra en felles stamfar
34. Gjenst�ende sp�rsm�l omkring det Humane Genomet Vanskelig � presist ansl� antall gener p� n�v�rende tidspunkt
Det fullstendige genom er ikke n�yaktig sekvensert
Sm� gener er vanskelige � identifisere
Noen gener blir sjelden uttrykt og har ikke normalt kodon bruksm�nster � derfor vanskelige � p�vise
35. Ikke-kodende RNA gener Transport RNA�er (tRNAs) � tilretteleggere som oversetter triplett koder fra RNA til aminosyresekvenser av proteiner
Ribosomal RNA�er (rRNAs) � komponenter av ribosomet
Small nucleolar RNA�er (snoRNAs) � RNA bearbeiding og basemodifisering i kjernen
Small nuclear RNA�er (sncRNAs) - spleisosomer
36. Protein kodende gener danner proteomet Proteome � kollektiv translation av 30,000 proteinkodende gener over i proteiner
Kompleksiteten i proteomet �ker fra gj�r til mennesker
Flere gener
Lurere kobling, �kning eller minsking av funksjoneller moduler
Flere paraloger
Alternativ RNA spleising � mennesker innehar betydelig mer
Kjemisk modifikasjon av proteiner er h�yere i mennesker
37. Repeterte sekvenser faller inn i fem klasser Transposon-avledete repetisjoner
Bearbeidede pseudogener
SSRs
Segmentielle duplikasjoner p� 10-300 kb
Blokker av repeterte sekvenser ved sentromerer, telomererer og andre kromosomale s�rtrekk
38. Gen organisering av genomet Gen familier
N�rt beslektede gener gruppert eller spredd
Gen-rike omr�der
Funksjonelle eller tilfeldige hendelser?
Gen �rkener
Utgj�r 144 Mb eller 3% av genomet
Inneholder regioner som er vanskelige � identifisere?
F.eks store gener � nukle�re transkripter utgj�r 500 kb eller mer med veldig store introns (exons < 1% of DNA)
39. Lateral overf�ring av gener > 200 humane gener kan ha oppst�tt ved overf�rsel fra organismer som bakterier
Lateral overf�rsel er direkte overf�rsel fra gener fra en art til kj�nnscellene til en annen
40. Dobbelt s� h�y mutasjonsgrad i menn Sammenligning av X og Y kromosomer
Det samme kan v�re tilfelle i autosomer, men vanskelig � m�le
Hovedmengden av humane mutasjoner skjer i menn
Menn gir opphav til flere feil, men ogs� mer mangfold
41. Menneskeraser har tilsvarende gener Genom sekvenssentra har sekvensert betydelige deler av minst tre raser
Variasjonsbredden av polymorfismer innen en rase kan v�re mye st�rre enn variasjonsbredden mellom to individer av forskjellig rase
Veldig f� gener er rasespesifikke
Genetisk er mennesker en enkelt rase
42. Alle levende organismer er en enkelt rase Alle levende organismer har bemerkelses- verdige like genkomponenter
Livet oppstod en gang og vi er etterkommere av den hendelsen
Analyse av passende biologiske systemer i modellorganismer gir grunnleggende innsikt i de tilsvarende humane systemer
43. H�yeffektive instrumenterDNA sekvensator Figure 10.23Figure 10.23
44. H�yeffektive instrumenter eks, mikromatriser (arrays) Figure 10.24Figure 10.24
45. Figure 10.25Figure 10.25
46. Massespektrometer Figure 10.27Figure 10.27
47. Sosiale, etiske, og rettslige sp�rsm�l Privatisering av genetisk informasjon
Begrensninger ved genetisk testing
Patentering av DNA sekvenses
Samfunnets syn p� eldre mennesker
Oppl�ring av leger
Human genetisk ingeni�rkunst
Somatisk gen terapi � innsetting av erstatningsgener
Kj�nnscelle terapi � modifikasjon p� de humane kj�nnsceller