1 / 26

GA ja proteiinit

GA ja proteiinit. Suvi Karhu AUTO3070 Geneettiset algoritmit. Proteiinit. Aminohapoista koostuvia orgaanisia yhdisteitä, jotka toimivat mm. Kudosten rakennusaineina, esim. kollageeni Entsyymeinä, esim. laktaasi Aineiden kuljettajina: esim. hemoglobiini

aron
Download Presentation

GA ja proteiinit

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. GA ja proteiinit Suvi Karhu AUTO3070 Geneettiset algoritmit

  2. Proteiinit • Aminohapoista koostuvia orgaanisia yhdisteitä, jotka toimivat mm. • Kudosten rakennusaineina, esim. kollageeni • Entsyymeinä, esim. laktaasi • Aineiden kuljettajina: esim. hemoglobiini • Vasta-aineina, esim. immunoglobuliinit • Reseptoreina • Myrkkyinä, esim. botuliini • Hormoneina, esim. insuliini • Geenien säätelijöinä

  3. Proteiinisynteesi • Proteiinisynteesissä solu valmistaa proteiineja DNA:ssa olevan informaation perusteella • Vaiheet: • Transkriptiossa DNA:n nukleotidijärjestys kopioidaan lähetti-RNA:han • Lähetti-RNA siirtyy ribosomiin, missä nukleotidien järjestys käännetään polypeptidiketjun aminohappojärjestykseksi. (=Translaatio) • Proteiini laskostuu 3-ulotteiseen muotoonsa

  4. GA ja proteiinit Seuraavaksi muutama esimerkki proteiineihin liittyvistä GA:n sovelluksista…

  5. Aminohappoaakkoston yksinkertaistaminen

  6. Aminohappoaakkoston yksinkertaistaminen • Proteiinit muodostuvat 20 eri aminohaposta -> proteiinin aminohapposekvenssi voidaan kuvata käyttämällä 20 kirjainta…

  7. Alaniini (Ala / A) • Arginiini (Arg / R) • Asparagiini (Asn / N) • Asparagiinihappo (Asp / D) • Kysteiini (Cys / C) • Glutamiinihappo (Glu / E) • Glutamiini (Gln / Q) • Glysiini (Gly / G) • Histidiini (His / H) • Isoleusiini (Ile / I) • Leusiini (Leu / L) • Lysiini (Lys / K) • Metioniini (Met / M) • Fenyylialaniini (Phe / F) • Proliini (Pro / P) • Seriini (Ser / S) • Treoniini (Thr / T) • Tryptofaani (Trp / W) • Tyrosiini (Tyr / Y) • Valiini (Val / V)

  8. …mutta • Erilaisia aminohapposekvenssejä on enemmän kuin erilaisia proteiinirakenteita • Kaksi eri sekvenssiä saattaa tuottaa samanlaisen proteiinin Esim. …SKA… (seriini, lysiini, alaniini) …TKA… (treoniini, lysiini, alaniini) Seriinillä ja treoniinilla on samantapaiset kemialliset ominaisuudet -> ei välttämättä ole väliä kumpi niistä esiintyy sekvenssissä Aminohappojen ominaisuuksia: http://fi.wikipedia.org/wiki/Aminohappo#Aminohappojen_ryhmittely

  9. …joten • Proteiinin rakenne voidaan kuvata vähemmällä kuin 20 kirjaimella • Miksi tarvitaan? • Proteiinin rakenteen kuvaamisen yksinkertaistamiseksi • ->Helpompi vertailla, miten eri aminohapot vaikuttavat proteiinin toimintaan

  10. Ratkaisu? • Samankaltaisten aminohappojen ryhmittely (klusterointi, clustering) Esim. yhdistetään seriini ja treoniini: merkitään X:llä {S tai T} • Ongelma: Mikä on optimaalinen ryhmittely? ~ Lukujen ositusongelma. NP-täydellinen eli laskennallisesti erittäin vaativa ongelma. • GA:ta on kokeiltu ongelman ratkaisemiseen…

  11. GA • Aloituspopulaatio: Luodaan satunnainen joukko ryhmittelyjä • Cross-over: • Valitaan satunnainen aminohappo, esim. a • Etsitään vanhemmilta ne klusterit, joissa äsken valittu aminohappo esiintyy esim. {almrq}, {aps} • Yhdistetään nämä klusterit uudeksi klusteriksi • ->{almpqs}

  12. GA • Ei mutaatiota, koska satunnaisuus haitallista • Tulokset: • Suunnilleen yhtä hyviä kuin muilla menetelmillä saadut • GA nopeampi Lähde Palensky, M.; Ali, H.; , "A genetic algorithm for simplifying the amino acid alphabet," Bioinformatics Conference, 2003. CSB 2003. Proceedings of the 2003 IEEE , vol., no., pp. 598- 599, 11-14 Aug. 2003doi: 10.1109/CSB.2003.1227418URL: http://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=1227418&isnumber=27543

  13. Motiivien etsintä

  14. Motiivien etsintä • Motiivit ovat lyhyehköjä nukleotidijaksoja tai aminohappojaksoja, jotka toistuvat usein DNA-sekvenssissä tai aminohapposekvenssissä • Motiiveilla on jokin tärkeä biologinen merkitys, esim. DNA-motiivit määrittelevät proteiinisynteesin aloittamisessa tarvittavien transkriptiofaktoreiden kiinnittymiskohdan DNA-kierteessä

  15. Motiivien ei ole pakko toistua aina täysin samanlaisina, vaan ne voivat erota muutaman nukleotidin/aminohapon osalta • Esimerkki (koskee DNA:ta) sekvenssi1 CTAGCGGACTAGG sekvenssi2 TAGCTGGACTACT sekvenssi3 CATCAGGAATAAG ->motiivi on GGAMTA, missä M tarkoittaa ”C tai A” • IUPAC ambiguity codes

  16. Motiivien löytämiseksi on kehitetty erilaisia algoritmeja • Myös GA:ta voidaan käyttää

  17. GA ja motiivien etsintä • Generoidaan satunnaisia motiiveja, lasketaan mitkä niistä parhaiten kuvaavat sekvenssissä toistuvia jaksoja, ja risteytetään parhaita yritteitä • Mutaatiossa vältetään muuttamasta motiivin ”parhaita kohtia” • Lähde: Liu, F.F.M.; Tsai, J.J.P.; Chen, R.M.; Chen, S.N.; Shih, S.H.; , "FMGA: finding motifs by genetic algorithm," Bioinformatics and Bioengineering, 2004. BIBE 2004. Proceedings. Fourth IEEE Symposium on , vol., no., pp. 459- 466, 19-21 May 2004doi: 10.1109/BIBE.2004.1317378URL: http://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=1317378&isnumber=29175

  18. Proteiinin rakenteen ennustaminen

  19. Proteiinin rakenteen ennustaminen • Proteiinin rakenteet: • Primäärirakenne = aminohappojärjestys • Sekundäärirakenne muodostuu, kun aminohappoketjuun tulee paikallisia rakenteita, kuten α-heliksi ja β-laskos.

  20. Proteiinin rakenteen ennustaminen • Tertiäärirakenne on proteiinin lopullinen 3-ulotteinen muoto, joka muodostuu mm. α-heliksien ja β-laskosten välisestä vuorovaikutuksesta. Proteiinin 3-ulotteinen rakenne määrää proteiinin toiminnan.

  21. Proteiinin rakenteen ennustaminen • Laskostumisesta ollaan kiinnostuneita mm. siksi, että monet sairaudet johtuvat virheistä proteiinin laskostumisessa, esim. • Alzheimer, • Parkinson, • hullun lehmän tauti, • allergioita

  22. Proteiinin rakenteen ennustaminen • Lääkkeiden teho perustuu yleensä jonkin proteiinin aktiivisuuden muuttamiseen elimistössä • Tietoa proteiinin 3-ulotteisesta rakenteesta voidaan hyödyntää lääkkeiden suunnittelussa

  23. Proteiinin rakenteen ennustaminen • 3-ulotteinen rakenne voidaan selvittää kokeellisin menetelmin, mutta se on työlästä. • Röntgensädekristallografia • Ydinmagneettinen resonanssi (NMR) Olisi helpompaa jos tertiäärirakenne voitaisiin ennustaa suoraan primäärirakenteesta.

  24. Proteiinin rakenteen ennustaminen • Tertiäärirakenteen ennustaminen aminohapposekvenssistä on vaikeaa. • N aminohappoa -> 10N eri konformaatiota

  25. Proteiinin rakenteen ennustaminen • Ennustamisessa voidaan käyttää tietoa, että tertiäärirakenteessa proteiinin potentiaalienergia on minimissään • GA:ta voidaan käyttää minimoimaan energiaa • Yritteet ovat geometrisia esityksiä mahdollisista proteiinin rakenteista • Hyvyysfunktio on rakenteen potentiaalienergia • Yritteitä, joilla on pienin energia, risteytetään ja mutatoidaan, kunnes saadaan mahdollisimman pienienergiainen yrite

More Related