260 likes | 401 Views
Genomi ka I. ATG. gén x. transzkripciós fúzió (operon). transzlációs fúzió ( fehérje ). ATG. ATG. ATG. gfp. gfp. trans zkripció. ATG. ATG. ATG. 5’. 5’. gfp. gfp. trans zláció. kiméra (fúziós) fehérje. külön fehérje termékek. Mi határoz meg egy gént ?.
E N D
Genomika I. ATG gén x transzkripciós fúzió (operon) transzlációs fúzió (fehérje) ATG ATG ATG gfp gfp transzkripció ATG ATG ATG 5’ 5’ gfp gfp transzláció kiméra (fúziós) fehérje külön fehérje termékek
Mi határoz meg egy gént? 1. Az öröklődés egysége, a fenotípusban jeleníti meg magát 2. Egy gén – egy enzim (Beadle és Tatum1943) 3. Egy gén – egy polipeptid, vagy egy gén – egy expressziós termék (egy RNSvagy egy fehérje) 4. Biokémiai funkció önálló egysége (Jacob és Monod) 5. Egy genetikailag térképezhető lokusz 6. Az expresszió egysége - A gén egy DNS szekvencia, ami átíródik - és tartalmazza az átírást szabályozó szekvenciákat is 7. Egy kódoló szekvencia - a génnek az a része, ami fehérjévé transzlálódik -- egy rRNS, vagy tRNSlokusz egy gén -- az intronok részei a génnek?
A prokarióta gén egyszerű szerkezete s70-típusú promóter Transzkripciós terminátor TTGACA ---17bp---TATAAT---A UUUUUUU Shine-Delgarno GGAGGA ATG Stop Szabályozó szekvenciák kódoló szekvencia változó 1-500 nts 2-8 nts (~ 5 nts) Riboszóma kötő hely (RBS)
A start kodonok flexibilisek Shine-Delgarno GGAGGA ATG A start kodonok >90%-a ATG Más kodonokkal is kezdődhet a kódoló szekvencia. Nem túl gyakran GTG (Valin) és TTG (Leucin) Egy metionin ekkor is beépül, az első aminosav.
30S alegység A korrekt startkodon kijelölése (transzláció) 3’ 16S rRNS UCCUCCA 5’ - NNNNNAGGAGGU-N5-10-AUG kódoló szekvencia Shine-Delgarno szekvencia (RBS) start kodon
N 5’ ’ Start Szimultán transzkripció és transzláció Nincs sejtmag, ez teszi lehetővé mRNS transzkriptum fehérje riboszóma RNAP Promóter
A gének operononokba szerveződnek Nem átfedő intergénes spacer A gén vége B gén kezdete TTGTGA - 30 nts - AAGAGGGCACCGATGGCG A B C B gén vége CTCTTGGAGGACGCATGACG átfedő transzlációs csatolás (coupling) (riboszóma nem disszociál) GGAGGACGCATGACG C gén kezdete
A génszerveződés hierarchiája Gén – a genetikai funkió egysége Operon – egy transzkriptumba átíródó gének Regulon – gének (operonok) azonos szabályozással Modulon – gének modulációja azonos stimulánsra Elemek – plazmid, kromoszóma, fág ** növekvő komplexitás Genom
Az első baktérium genom szekvencia (1995) The Institute for Genomic Research (TIGR) AHaemophilus influenzae Rd genomja Egy, gyűrűs kromoszóma 1,860,137 bp Külső kör – az adatbázisokban homológ kódoló szekvenciák A gének 40%-ának akkor még nem volt homológja
E. coli K12 • Narancs téglalap • forward gének • Sárga téglalap • gének a komplementer szálon • Piros nyilak • -rRNS • Zöld nyilak • -tRNA • Fehér kör • -REP szekvenciák • Kék kör • -hasonlóság bakteriofág fehérjékhez • Napkorong • -CAI (codon adaptation index)
Komparatív genomika Összetett genomok Gyűrűs és lineáris DNS elemek Nagymértékű változatosság
Mikrobiális genom szekvenciák http://www.tigr.org/tdb/mdb/mdbcomplete.html http://www.ncbi.nlm.nih.gov/PMGifs/Genomes/micr.html
Mihez kezdhetünk ezzel? Hogyan találhatjuk meg a géneket? CGGTTGAAAGCGGTAGCGTCCATGCGTATTACTCTTGAGCGGTCGAACCTTCTGAAATCGCTGAACCACGTCCACCGGGT CGTCGAGCGTCGCAACACGATCCCGATCCTGTCCAACGTTCTGCTGCGCGCCTCCGGCGCCAATCTGGACATGAAGGCGA CCGACCTCGATCTGGAAATCACCGAAGCGACCCCGGCCATGGTGGAGCAGGCTGGCGCCACCACCGTACCGGCACACCTG CTTTACGAAATCGTGCGCAAGCTGCCGGATGGTTCCGAAGTGCTTCTGGCGACCAACCCGGACGGCTCCTCCATGACCGT TGCGTCCGGCCGCTCGAAATTCTCGCTGCAATGCCTGCCGGAAGCGGATTTCCCTGACCTCACCGCCGGCACCTTCAGCC ACACCTTCAAACTGAAGGCGGCCGATCTGAAGATGCTGATCGACCGGACGCAGTTTGCGATTTCGACCGAAGAGACGCGT TATTACCTGAACGGCATTTTCTTCCACACCATCGAAAGCAATGGCGAGCTGAAACTGCGCGCCGTCGCCACCGACGGTCA CCGCCTTGCGCGTGCTGACGTCGATGCGCCCTCCGGCTCCGAAGGCATGCCGGGCATCATCATTCCGCGCAAGACCGTCG GTGAACTGCAGAAGCTGATGGACAATCCGGAACTGGAAGTCACAGTCGAAGTCTCGGATGCGAAGATCCGCCTGGCCATC GGTTCCGTCGTTCTGACCTCGAAGCTGATCGACGGCACCTTTCCCGATTATCAGCGCGTCATCCCAACCGGCAACGACAA GGAAATGCGCGTCGATTGCCAGACCTTCGCCCGGGCAGTGGACCGTGTTTCGACGATTTCTTCCGAGCGCGGCCGCGCCG TGAAGCTGGCGCTAACTGACGGCCAGTTGACGCTGACCGTCAACAATCCCGACTCGGGAAGTGCTACCGAAGAAGTGGCC GTTGGCTACGACAATGATTCGATGGAAATCGGCTTCAATGCCAAATATCTCCTCGACATCACGTCGCAGCTCTCCGGCGA AGATGCGATTTTTCTGCTGGCGGATGCGGGTTCGCCAACACTGGTTCGCGATACCGCCGGCGACGACGCACTCTATGTTC TGATGCCGATGCGCGTTTAAAACCGACCGTTTTCTTCAATTTTTCCAGAAACGCCGGTGGATCGCTTCATCGGCGTTTTT TGATTCGGCGAACAGGTGGCTCTACCCGTAACTGAATTTTCTCAGTTACGACATTTTGCCTTGTTTTTGCGCCAAATGGG ATCAACAGTACGTAACAATTTTTTGACAATGACCAATACATCCGAGGGGAATCATGGCACTCAACCTGAAGCAACGGCTT GAACAAAAATTTGAGGAAGAAATCCGCTTTTTCAAAGGTATGGTCAGCCAGCCGAAAAAAGTCGGCGCCATTGTCCCGAC ATCGTCGATCACGGCGAAAAAGATGGCAAGCGTCATCAATCCCCATTCCGGCCTGCCGGTTCTGGAACTCGGTCCCGGCA CCGGCGTCATCACCAAGGCCATTCTGGCGCGCGGCATCAAGCCGGAGAGCCTGACGGCCATCGAATATTCGACTGATTTC TACAATCAGCTGCTCCGGAGCTATCCAGGCGTCAATTTCGTCAATGGTGACGCCTTCGATCTCGATGCGACGCTTGGCGA GCACAAGGGTCAGATGTTCGACAGCGTTATCTCCGCCGTGCCGATGCTGAATTTTCCGATGGCTGCCCGCATCAAGCTTC TCGATGAATTGCTGAAGCGCGTGCCGCACGGCCGACCCGTAGTACAGATATCCTACGGTCCGATTTCCCCGATCGTCGCG CAGCCGCATCTCTACCATATCCGCCATTTCGATTTCATCGTGCGCAATATTCCGCCGGCGCAATTGTGGACCTATACGCG GGCCTGATCGTCCCGCCAGAACAGACGAGGCCGTCATTTCCCAGTCGTGACGAATGGTTAGGGTGTTGATTACCCTCTCC ATTGCCTTTGAGGACCGATTGCCATGCATGCGCTCTACATCACCCACCCCCAGGTCAAGATCGACCCGGCTGTTCCCGTT CCCGAATGGGGGCTTTCGGAAAGGGGTGCTGAACGGGCGCGTGAGGCGAGCCGCCTTCCCTGGGCGAAAGCATTGCGGCG CATCGTTTCCAGCGCCGAAACCAAGGCAATCGAAACCGCCCATATGCTCGCGGAAACCTCCGGTGCAGCAATAGAGATCA TCGAAGCGATGCATGAAAACGACCGGTCCGCCACCGGTTTCCTGCCGCCGCCGGAATTCGAGAAGGCGGCGGACTGGTTC TTCGCCCATCCTGAGGAGAGTTTTCAAGGCTGGGAGCGGGCAATCGACGCGCAGGCGCGGATCGTCGAGGCCGTCAAAGC CGTTCTCGACCGACACGACGCACGGCAGCCGATCGCCTTTGTCGGCCATGGCGGCGTGGGCACACTGTTGAAATGCCATA TTGAAGGCCGCGGCATCAGCCGCAGCAAGGACCAGCCTGCTGGCGGTGGCAATCTTTTCCGCTTTTCCATCGCCGAATTT TCACTTGCAGCGGCCTCCCCCACATGCGACTGGACGGCAATGGAAACATGGCAGGGATAAGACAATGACCGCGCGCGAAA AACTCATCGTCGGGCTGGATGTTCCGACTGTGCAGCAGGCAGAAGACATCGTGTCGAAAATCGGCGACGAGGTCCTGTTC TACAAGATCGGTTATCAGCTGGTATTCGCCGGGGGTCTTGAATTCGCGCGTGACCTCGTCCAGAGCGGCAAGAAGGTCTT TCTCGACATGAAGCTGCTCGATATCGACAACACCGTCGCCTCGGGCGTCGAAAACATCGCCCGCATGGGCATGTCGATGC TGACGCTGCATGCCTATCCCAAAGCCATGCGTGCTGCCGTCAAGGCGGCGGAAGGCTCCGGCCTCTGCCTGCTGGGCGTC
E K A P A Q S E M V S L S F H R K K L L P N L K W L A Y L S T K S S C P I * N G * P I F P P Keresd a nyitott leolvasási kereteket(Open Reading Frame=ORF) A triplett, a genetikai kód nem-megszakított természete segít 64 lehetséges kodon 61 igazi kodon 3 stop kodon (TGA, TAA, TAG) Véletlen eloszláskb. a kodonok 1/21 része stop kodon Minden szekvenciának 3 lehetséges leolvasási kerete van (+1, +2, +3) A komplementerének is 3 lehetséges leolvasási kerete van (-1, -2, -3) 6 lehetséges leolvasási keret GAAAAAGCTCCTGCCCAATCTGAAATGGTTAGCCTATCTTTCCACCGT
Minden szekvenciának meghatározzuk az összes lehetséges leolvasási keretét EMBOSS programok: GETORF, PLOTORF CACAGGAAACAGCTATGACCATGATTACGGATTCACTGGCCGTCGTTTTACAACGTCGTGACTGGGAAAACCCTGGCGTT ACCCAACTTAATCGCCTTGCAGCACATCCCCCTTTCGCCAGCTGGCGTAATAGCGAAGAGGCCCGCACCGATCGCCCTTC CCAACAGTTGCGCAGCCTGAATGGCGAATGGCGCTTTGCCTGGTTTCCGGCACCAGAAGCGGTGCCGGAAAGCTGGCTGG AGTGCGATCTTCCTGAGGCCGATACTGTCGTCGTCCCCTCAAACTGGCAGATGCACGGTTACGATGCGCCCATCTACACC AACGTAACCTATCCCATTACGGTCAATCCGCCGTTTGTTCCCACGGAGAATCCGACGGGTTGTTACTCGCTCACATTTAA TGTTGATGAAAGCTGGCTACAGGAAGGCCAGACGCGAATTATTTTTGATGGCGTTAACTCGGCGTTTCATCTGTGGTGCA ACGGGCGCTGGGTCGGTTACGGCCAGGACAGTCGTTTGCCGTCTGAATTTGACCTGAGCGCATTTTTACGCGCCGGAGAA AACCGCCTCGCGGTGATGGTGCTGCGTTGGAGTGACGGCAGTTATCTGGAAGATCAGGATATGTGGCGGATGAGCGGCAT TTTCCGTGACGTCTCGTTGCTGCATAAACCGACTACACAAATCAGCGATTTCCATGTTGCCACTCGCTTTAATGATGATT TCAGCCGCGCTGTACTGGAGGCTGAAGTTCAGATGTGCGGCGAGTTGCGTGACTACCTACGGGTAACAGTTTCTTTATGG CAGGGTGAAACGCAGGTCGCCAGCGGCACCGCGCCTTTCGGCGGTGAAATTATCGATGAGCGTGGTGGTTATGCCGATCG CGTCACACTACGTCTGAACGTCGAAAACCCGAAACTGTGGAGCGCCGAAATCCCGAATCTCTATCGTGCGGTGGTTGAAC TGCACACCGCCGACGGCACGCTGATTGAAGCAGAAGCCTGCGATGTCGGTTTCCGCGAGGTGCGGATTGAAAATGGTCTG CTGCTGCTGAACGGCAAGCCGTTGCTGATTCGAGGCGTTAACCGTCACGAGCATCATCCTCTGCATGGTCAGGTCATGGA TGAGCAGACGATGGTGCAGGATATCCTGCTGATGAAGCAGAACAACTTTAACGCCGTGCGCTGTTCGCATTATCCGAACC ATCCGCTGTGGTACACGCTGTGCGACCGCTACGGCCTGTATGTGGTGGATGAAGCCAATATTGAAACCCACGGCATGGTG CCAATGAATCGTCTGACCGATGATCCGCGCTGGCTACCGGCGATGAGCGAACGCGTAACGCGAATGGTGCAGCGCGATCG TAATCACCCGAGTGTGATCATCTGGTCGCTGGGGAATGAATCAGGCCACGGCGCTAATCACGACGCGCTGTATCGCTGGA TCAAATCTGTCGATCCTTCCCGCCCGGTGCAGTATGAAGGCGGCGGAGCCGACACCACGGCCACCGATATTATTTGCCCG ATGTACGCGCGCGTGGATGAAGACCAGCCCTTCCCGGCTGTGCCGAAATGGTCCATCAAAAAATGGCTTTCGCTACCTGG AGAGACGCGCCCGCTGATCCTTTGCGAATACGCCCACGCGATGGGTAACAGTCTTGGCGGTTTCGCTAAATACTGGCAGG CGTTTCGTCAGTATCCCCGTTTACAGGGCGGCTTCGTCTGGGACTGGGTGGATCAGTCGCTGATTAAATATGATGAAAAC GGCAACCCGTGGTCGGCTTACGGCGGTGATTTTGGCGATACGCCGAACGATCGCCAGTTCTGTATGAACGGTCTGGTCTT TGCCGACCGCACGCCGCATCCAGCGCTGACGGAAGCAAAACACCAGCAGCAGTTTTTCCAGTTCCGTTTATCCGGGCAAA CCATCGAAGTGACCAGCGAATACCTGTTCCGTCATAGCGATAACGAGCTCCTGCACTGGATGGTGGCGCTGGATGGTAAG CCGCTGGCAAGCGGTGAAGTGCCTCTGGATGTCGCTCCACAAGGTAAACAGTTGATTGAACTGCCTGAACTACCGCAGCC GGAGAGCGCCGGGCAACTCTGGCTCACAGTACGCGTAGTGCAACCGAACGCGACCGCATGGTCAGAAGCCGGGCACATCA GCGCCTGGCAGCAGTGGCGTCTGGCGGAAAACCTCAGTGTGACGCTCCCCGCCGCGTCCCACGCCATCCCGCATCTGACC ACCAGCGAAATGGATTTTTGCATCGAGCTGGGTAATAAGCGTTGGCAATTTAACCGCCAGTCAGGCTTTCTTTCACAGAT GTGGATTGGCGATAAAAAACAACTGCTGACGCCGCTGCGCGATCAGTTCACCCGTGCACCGCTGGATAACGACATTGGCG TAAGTGAAGCGACCCGCATTGACCCTAACGCCTGGGTCGAACGCTGGAAGGCGGCGGGCCATTACCAGGCCGAAGCAGCG TTGTTGCAGTGCACGGCAGATACACTTGCTGATGCGGTGCTGATTACGACCGCTCACGCGTGGCAGCATCAGGGGAAAAC CTTATTTATCAGCCGGAAAACCTACCGGATTGATGGTAGTGGTCAAATGGCGATTACCGTTGATGTTGAAGTGGCGAGCG ATACACCGCATCCGGCGCGGATTGGCCTGAACTGCCAGCTGGCGCAGGTAGCAGAGCGGGTAAACTGGCTCGGATTAGGG
lacY lacZ Grafikus megjelenítés
Open Reading Frame (ORF) – átlagos méret AB. subtilisgenomban, 98% a valószínűsége annak, hogy egy 500 nt hosszú ORF-en gén van
Az adatbázisok segíthetnek a gének azonosításában A szekvencia illesztő algoritmusok átvizsgálják az egész adatbázist, hogy van-e a mi génünkkel homológ. A leggyakrabban használt program a BLAST Basic Local Alignment Search Tool http://www.ncbi.nlm.nih.gov/BLAST/ blastn – nucleotid nucleotidhoz BLAST blastp – fehérje fehérjéhez BLAST blastx – nukleotid szekvencia (6 frame-ben lefordítva) a fehérje adatbázishoz tblastn – fehérje szekvencia a nukleotid (6 frame-ben) adatbázishoz tblastx – nukleotid szekvencia (6 frame-ben) a nukleotid (6 frame-ben)adatbázishoz
A nyers DNS szekvencia analízisére a blastx nagyon hasznos A DNS szekvenciánkat a fehérje adatbázishoz hasonlítja (6 frame-ben) Az illeszkedés (homológia) némi támpontot ad a funkcióra Egy a gond – illeszkedés homológia alapján, ezért kísérletes bizonyíték kell!! Kijelölheti a kísérletes munka irányát!
Purinban gazdag SD A nukleotid megoszlás periodicitása a kódoló szekvenciákban 4076 szekvenciaBacillus subtilis-ból
Eltérések a kodon használatban Organizmusonként változó kedvenc kodon használat Organizmusonként és organizmuson belül is változó. Lehetséges válasz az aminoacil-tRNS ellátottságra A gének transzlációs gyakoriságára is hatással lehet DNAStar program
Az új generációs programok a nem-véletlen ismétlődő motívumok alapján jósolják meg a kódoló szekvenciákat (pl. Glimmer, GeneMark) – egész jók már
Áfedés a gének között gondot jelent Mekkora gondot? Átfedés a gének között ugyanazon a szálon. Gének közötti átfedés az ellentétes szálakon.
Metabolizmus Információval kapcsolatos Sejt folyamatok Nincs COG Ismeretlen funkció COGs – clusters of orthologous sequences, ortológok
Metabolizmus összehasonlítása Pirimidin bioszintézis Minden egyes betű egy-egy mikroorganizmust jelent Nagybetű jelzi az ortológot Kis betű azt, hogy nincs ortológ gp – a Mycoplasma-ból a teljes út hiányzik h – az útvonal eleje hiányzik – prekurzort a gazdától kapja?