240 likes | 352 Views
In s ilico eljárás makromolekulák tervezéséhez. ELTE eScience RET 2.4-es alprojekt. Szoftverfejlesztés Ittzés Péter , Ph.D., ELTE RET eScience Horváth Arnold , szoftverfejlesztő, informatikus Kun Ádám , Ph.D., Collegium Budapest. Kovács Attila , Ph.D. Tátrai Antal , doktorandusz.
E N D
In silico eljárás makromolekulák tervezéséhez ELTE eScience RET 2.4-es alprojekt
Szoftverfejlesztés Ittzés Péter, Ph.D., ELTE RET eScience Horváth Arnold, szoftverfejlesztő, informatikus Kun Ádám, Ph.D., Collegium Budapest Kovács Attila, Ph.D. Tátrai Antal, doktorandusz Résztvevők: Projektvezető: Jakó Éena, Ph.D., ELTE RET eScience ICF alkalmazása molekuláris filogenetikai analízisben Ari Eszter, doktorandusz, Genetikai Tanszék Podani János, D.Sc., Növényrendszertani és Ökol. Tanszék In silico molekulatervezési módszer in vitro tesztelése Pál Gábor, Ph.D., Biokémiai TanszékSzenes Áron, doktorandusz, Biokémiai Tanszék
Az ICF elméleti háttere Az ICF (Iterative Canonical Form) rövid ismertetése • Eredetileg Boole függvények minimalizálására (Normálforma) • Részben-rendezett halmazokon értelmezhető • Kódolás: a részben-rendezett halmaz megfeleltetése a vizsgált strukúrának • A részben-rendezést meghatározó reláció alapján a kódolt adatstrukúrát átrendezhetjük és ez az esetek egy jelentős részében információ vesztés nélküli tömörítés • Megkönnyíti az osztályozást • A struktúra átalakítása reflektálhat a funkcióra
Példa I. • bináris string: 00111010 • 3 logikai változóval kódolva: a’bc’ + abc’ + a’b’c + a’bc
Példa távolságra • Többféle távolságformulát alkalmaztunk: Euklideszi, Manhattan, Jaccard… Bináris eset, x = 3, y = 0 ED = 1,73
TAGACTAG fA = 01010010 fT = 10000100 fC = 00001000 fG = 00100001 Kódolás ICF Szekvenciák ICF eredménye Matematikai modell Ponttértkép Dendrogram ICF Gráf Az ICF eddigi alkalmazásai • Mérnöki alkalmazás: kombinációs hálózatok és programozható logikai modulok tervezése (Hazai szabadalom) • Kémiai alkalmazás: molekuláris shape analízis • Ökológiai: fajkombinációk elemzése • Molekuláris taxonómia • Makromolekulák leírása
ICF alapú szoftverfejlesztés 2006 Az ICF 1.0 programcsomag I. • ICF számítás • Többféle input: • Bináris • Decimális • Nukleinsav • File import • Eredmények mentése • Eredmények ábrázolása gráfokon
Az ICF 1.0 programcsomag II. • Távolságok ICF alapján • Az ICF számításnál bemutatott input • Több távolságformula • Eredmények exportja • További elemzőprogramokhoz való kapcsolódás Pl.: SynTax 2000
Az ICF 1.0 programcsomag IV. • Felhasználói kéziköny • Angol és magyar nyelven • A program menüjéből elérhető HTML formátumban • Telepítő program • Windows • Mac
Az ICF 1.0 programcsomag V. • Moduláris szerkezet • Általános, diszkrét matematikai feladatokra alkalmas központi mag • Erre épülnek az ICF-fel kapcsolatos modulok • A megjelenítést egy különálló grafikus réteg végzi • Könnyen bővíthető input/output modulokkal • Objektum orientált - Java 1.5 alapú • Platformfüggetlen • Az algoritmust hatékonyabbá tettük, 263 hosszúságú bináris stringeket is kezel • Számokban: • 22 811 db kódsor • 120 osztály • 9 template • Tesztelés: ~ 200 teszt eset, jegyzőkönyv
Hagyományos filogenetikai módszerek: Alap feltevés: az egyes nukleotidok egymástól függetlenül evolválódnak Az egyes pozíciókon lévő nukleotidok hasonlóságán alapszik Nagyon hasonló ill. nagyon különböző szekvenciák nem elemezhetőek ilyen módszerekkel ICF módszer: Alap feltevés: az egyes nukleotidok egymástól NEM függetlenül evolválódnak A szekvenciák absztrakt szerkezetének hasonlóságán alapszik Nagyon hasonló ill. nagyon különböző szekvenciákat is lehet elemezni Az ICF alkalmazásai I. A hagyományos és az ICF alapú megközelítések összehasonlítása Az ICF, mint molekuláris filogenetikai módszer
22 mitokondriális tRNS gén Öt módszer Számos fa Konszenzus törzsfák ICF ICF vektorok MP ML Bayes analízis szubsztitúciós modell Jaccard Manhattan távolság mátrix távolság mátrix NJ NJ Diszkrét matematikaimódszer Hagyományos módszerek
Az eredmények és Bayes
A transzfer RNS másodlagos szerkezete harmadlagos szerkezete aminosav kötő hely aminosav kötő hely DHU hurok Tψ C hurok Extra hurok antikodon hurok
Az ICF validálása identitásváltást okozó tRNS mutációk vizsgálatával
Az ICF validálása identitásváltást okozó tRNS mutációk vizsgálatával
Az ICF validálása identitásváltást okozó tRNS mutációk vizsgálatával Gráfok közötti távolságok ábrázolása
Az ICF alkalmazásai II. Új antibiotikum célpontok keresése az ICF módszerrel • az antibiotikumok használhatósága rohamosan csökken a rezisztens mikroba törzsek kifejlődése miatt
A patogének elleni küzdelem egyik módja eddig nem kiaknázott molekuláris célpontok elleni antibiotikumok kifejlesztése. • A célpont esszenciális kell, hogy legyen a mikroba számára. • A célpontnak el kell térnie a humán megfelelőjétől. • A tRNS és aminoacil-tRNS szintetáz (AARS) kölcsönhatás gátlása ideális antibiotikum mechanizmus lehet. • Az AARS enzimek működése esszenciális a sejt számára. • 20-féle AARS enzim van, mindegyikből csak egyféle (nincsenek izoenzimek). • Mind az AARS enzimek, mind a tRNS-ek mutatnak eltéréseket prokarióta – eukarióta vonatkozásban.
? 1111111111122222222222333333333334444444444555555555566666666667777 1234567890123456778900012345678901234567890123456789012345678901234567890123 a ab hsapi_Ala_TGC: GGGGATGTAGCTCAGT--GGT--AGAGCGCATGCTTTGCATGTATGAGGTCCCGGGTTCGATCCCCGGCATCTCCA hsapi_Ala_TGC: GGGGGTGTAGCTCAGT--GGT--AGAGCACATGCTTTGCATGTGTGAGGCCCCGGGTTCGATCCCCGGCACCTCCA hsapi_Ala_TGC: GGGGGTGTAGCTCAGT--GGT--AGAGCGCATGCTTTGCATGTATGAGGTCCCGGGTTCGATCCCCGGCACCTCCA hsapi_Ala_TGC: GGGGGTGTAGCTCAGT--GGT--AGAGCGCATGCTTTGCATGTATGAGGCCTCGGGTTCGATCCCCGACACCTCCA hsapi_Ala_CGC: GGGGATGTAGCTCAGT--GGT--AGAGCGCATGCTTCGCATGTATGAGGCCCCGGGTTCGATCCCCGGCATCTCCA hsapi_Ala_AGC: GGGGATGTAGCTCAGT--GGT--AGAGCGCATGCTTAGCATGCATGAGGTCCCGGGTTCGATCCCCAGCATCTCCA hsapi_Ala_AGC: GGGGGTGTAGCTCAGT--GGT--AGAGCGCGTGCTTAGCATGTACGAGGTCCCGGGTTCAATCCCCGGCACCTCCA hsapi_Ala_AGC: GGGGGTATAGCTCAGT--GGT--AGAGCGCGTGCTTAGCATGCACGAGGTCCTGGGTTCGATCCCCAGTACCTCCA hsapi_Ala_AGC: GGGGGTATAGCTCAGC--GGT--AGAGCGCGTGCTTAGCATGCACGAGGTCCTGGGTTCAATCCCCAATACCTCCA hsapi_Ala_AGC: GGGGGTGTAGCTCAGT--GGT--AGAGCGCGTGCTTAGCATGCACGAGGCCCCGGGTTCAATCCCCGGCACCTCCA hsapi_Ala_AGC: GGGGAATTAGCTCAAGC-GGT--AGAGCGCTTGCTTAGCATGCAAGAGGTAGTGGGATCGATGCCCACATTCTCCA hsapi_Ala_AGC: GGGGAATTAGCTCAAGT-GGT--AGAGCGCTTGCTTAGCATGCAAGAGGTAGTGGGATCGATGCCCACATTCTCCA hsapi_Ala_AGC: GGGGAATTAGCGCAAGT-GGT--AGAGTGCTTGCTTAGCATGCAAGAGGTAGTGGGATCGATGCCCACATTCTCCA hsapi_Ala_AGC: GGGGAATTAGCCCAAGT-GGT--AGAGCGCTTGCTTAGCATGCAAGAGGTAGTGGGATCGATGCCCACATTCTCCA hsapi_Ala_AGC: GGGGAATTAGCTCAAGT-GGT--AGAGCGCTCGCTTAGCATGCGAGAGGTAGTGGGATCGATGCCCGCATTCTCCA hsapi_Phe_GAA: GCTGAAATAGCTCAGTT-GGG--AGAGCGTTAGACTGAAGATCTTAAAG-CCCTGGTTCAACCCTGGGTTTCAGCC hsapi_Phe_GAA: GCCGAAATAGCTCAGTT-GGG--AGAGCGTTAGACTGAAGATCTAAAGGTCCCTGGTTCGATCCCGGGTTTCGGCA hsapi_Phe_GAA: GCCGAGATAGCTCAGTT-GGG--AGAGCGTTAGACTGAAGATCTAAAGGTCCCTGGTTCAATCCCGGGTTTCGGCA hsapi_Phe_GAA: GCCGAAATAGCTCAGTT-GGG–-AGAGCGTTAGACCGAAGATCTTAAAG-CCCTGGTTCAATCCCGGGTTTCGGCA . . . 1111111111122222222222333333333334444444444555555555566666666667777 1234567890123456778900012345678901234567890123456789012345678901234567890123 a ab vchol_Ala_TGC: GGGGTTATAGCTCAGCT-GGG--AGAGCGCCTGCCTTGCACGCAGGAGGTCTGCGGTTCGATCCCGCATAACTCCA vchol_Ala_GGC: GGGGCTATAGCTCAGCT-GGG--AGAGCGCTTGCATGGCATGCAAGAGGTCTGCGGTTCGATCCCGCATAGCTCCA vchol_Phe_GAA: GCCCGGATAGCTCAGTC-GGT--AGAGCAGAGGATTGAAAATCCTCGTGTCGGTGGTTCGATTCCGCCTCCGGGCA vchol_Phe_GAA: GCCTCGATAGCTCAGTC-GGT–-AGAGCAGAGGATTGAAAATCCTCGTGTCGGTGGTTCGATTCCGCCTCGAGGCA . . . • Melyik tRNS-szintetáz kapcsolat a leginkább eltérő a humán-mikroba rendszerekben?
Teljes humán tRNS szett ICF analízise • Teljes patogén mikroba tRNS szett ICF analízise • A legnagyobb mértékben eltérő humán-mikroba tRNS párok azonosítása • Az azonosított párok funkcionális ellenőrzése • A nem-működő párokhoz tartozó mikroba szintetáz lesz a potenciális antibiotikum célpont
A kísérletek végzése nemzetközi együttműködésben • Együttműködési megállapodáson dolgozunk a világ egyik legelismertebb tRNS-kutató csoportjával, melyet Catherine Florentz vezet a Pasteur Egyetemen (Strasbourg) • Az ICF tesztelése a Pasteur Egyetemen már karakterizált, de még nem közölt tRNS-eken jelenleg zajlik. • Sikeres tesztelés esetén beindulhatnak a nagy volumenű kísérletek.
Szoftverfejlesztés • Az ICF kiterjesztése: • fehérjeszekvenciák analízisére, • CHIP adatok kiértékelésére, • szociológiai adatok elemzésére Expressziós CHIP alapú gyógyszer hatóanyag keresés (csontritkulás) Orosz László, D.Sc. Genetikai Tanszék Ponyi Tamás, Ph.D. Genetikai Tanszék Vellai Tibor, Ph.D. Genetikai Tanszék Borsy Adrienn, doktorandusz Genetikai Tanszék Podani János, D.Sc. Növényrendszertani és Ökológiai Tanszék tRNS mutációk okozta mitokondriális rendellenességek vizsgálata Catherine Florentz, D.Sc. Pasteur Egyetemen (Strasbourg) tRNS - AARS komplexek 3D modellezése Paul G. Mezey, D.Sc. Newfoundlandi Egyetem (Canada) Simon Éva, doktorandusz Newfoundlandi Egyetem (Canada) További tervek és lehetőségek