1 / 38

Docking von starren und flexiblen Proteinen

Seminar Bioinformatik, „ Theoretical Analysis of Protein-Protein Interactions ”. Docking von starren und flexiblen Proteinen. Präsentation von Andreas Schlicker ( andreasschlicker@web.de ). Übersicht. Molecular surface recognition:

elijah
Download Presentation

Docking von starren und flexiblen Proteinen

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Seminar Bioinformatik, „Theoretical Analysis of Protein-Protein Interactions” Docking von starren und flexiblen Proteinen Präsentation von Andreas Schlicker (andreasschlicker@web.de)

  2. Übersicht • Molecular surface recognition: • Docking von starren Proteinen und Liganden mit Hilfe von Korrelation geometrischer Eigenschaften • Dead-End Elimination theorem (DEE): • Reduktion des Konformations-Suchraums bei flexiblem Docking • Protein Docking mit flexiblen Seitenketten

  3. Molecular surface recognition • Docking von Molekülen anhand geometrischer Eigenschaften • Form von Interfaces im gebundenen und freien Zustand häufig sehr ähnlich • Suche im 6-dimensionalen Rotations- und Translationsraum

  4. Repräsentation der Moleküle • Projektion der 3D-Koordinaten auf ein Gitter • Gitterpunkt innerhalb des Moleküls, wenn Atomkern innerhalb Radius r vorhanden [1] [1]

  5. Matching von Oberflächen (I) • Korrelation der geometrischen Form • (α, β, γ) gibt die Verschiebung von Molekül b in Bezug auf Molekül a an [1] • Kein Kontakt  Korrelation = 0 • Kontakt  Korrelation > 0 je besser der Kontakt, desto größer die Korrelation

  6. Matching von Oberflächen (II) • Problem: auch Überlappung liefert positive Korrelation • Lösung: • ρ in Gleichung [2a] << 0 • δ in Gleichung [2b] > 0  Überlappung wird mit negativer Korrelation bestraft [1]

  7. Berechnung (I) • Direkte Berechnung der Korrelation benötigt Zeit O(N6)  Verwende Fourier Transformation [1] • Korrelation wird durch Inverse Fourier-Transformation erhalten  Benötigte Zeit liegt in O(N³ln(N³))

  8. Berechnung (II) • Molekül a wird fixiert, Molekül b wird in allen Orientierungen getestet [1]

  9. Resultate • Test mit 5 Komplexen, zwei Durchgänge mit unterschiedlichen Gitter-Größen [1] [1] [1]

  10. Vor- und Nachteile • Vorteile: • Schnelle Berechnung • Meistens korrekte Vorhersage • Parameter sind universell einsetzbar • Nachteile: • Starre Moleküle • Keine Berücksichtigung physiko-chemischer Eigenschaften

  11. Dead-End Elimination Theorem • Konformationsraum von Proteinen sehr groß, selbst bei Verwendung von Rotamer-Bibliotheken • Systematische Suche nach der „global minimum energy conformation“ (GMEC) praktisch unmöglich

  12. Energie einer Konformation • Potentielle Energie eines Proteins: [2]

  13. „Dead-Ending“ Rotamere • Rotamere, die in der GMEC nicht vorkommen können • Rotamer ir kann nicht vorkommen, wenn für ein Paar (ir, it) gilt: [2]

  14. Erweiterung auf Rotamerpaare • Energie eines Rotamerpaares [irjs] [2] • Interaktionsenergie mit anderen Rotameren [2]  Rotamerpaar [irjs] ist „dead-ending“, wenn gilt: [2]

  15. Algorithmus • Eliminiere alle Rotamere, die offensichtlich inkompatibel sind • Eliminiere „dead-ending“ Rotamere mit dem DEE Theorem • Wende DEE Theorem auf alle Rotamerpaare an und markiere „dead-ending“ Paare • Iteriere, bis keine weiteren Rotamere mehr entfallen

  16. Resultate (I) • Test mit dem Insulin-Dimer • anfängliche Kombinationsmöglichkeiten: 2,7*1076 • Nach 9 Iterationen: 7200 • Modellierung des Proteins liefert 55 richtig vorhergesagte Residuen • Verborgene Residuen werden mit 93% Genauigkeit vorhergesagt [2]

  17. Resultate (II) • Blind-Test an Limulus polyphemus • 194 Aminosäuren, wovon 71 % richtig vorhergesagt wurden • Viele Fehler durch falsche Salz- und Wasserstoffbrücken an exponierten Gruppen

  18. Vor- und Nachteile • Vorteile: • Schnelle Berechnung (Aufwand steigt „nur“ quadratisch mit Anzahl der Aminosäuren) • Starke Reduzierung des Suchraums • Nachteile: • Ungenauigkeiten durch verwendete Energiefunktion • Benötigt relativ genaues Template • Abhängig von der verwendeten Rotamer-Bibliothek

  19. Protein Docking mit flexiblen Seitenketten • Docking von rigiden Strukturen keine gute Lösung • Problem des exponentiellen Wachstums des Konformationsraums bei flexiblen Seitenketten

  20. Flexibilität • Alle Residuen flexibel behandeln sehr aufwändig selbst bei Verwendung von Rotamer-Bibliotheken  Nur Interface-Residuen flexibel • Interface benötigt  Rigides Docking zur Erzeugung von Anfangsstrukturen

  21. Rigides Docking • Verwendet geometrische und einfache chemische Fitness Funktionen • Von den erzeugten Komplexstrukturen wurden die 60 besten weiter verfolgt • Oft große Überlappung der Proteine und inkorrekt platzierte Seitenketten

  22. Bestimmung der Bindungsstelle • Residuen, die innerhalb 6 Å eines Atoms des anderen Proteins liegen • Seitenketten ohne Rotamere (CYS in Disulfidbrücken, ALA, GLY) werden nicht berücksichtigt

  23. GMEC • GMEC = Kombination der Rotamere, die die niedrigste Energie liefern [3]  Anwendung des DEE-Theorems möglich

  24. Suche nach der GMEC • Zwei Strategien: • Multi-Greedy Methode • Branch-and-cut basierend auf einem ILP

  25. Multi-Greedy Methode (I) • Aufbau eines Enumerations-Baumes mit möglichen Kombinationen [3]

  26. Integer Linear Program (ILP) • Formulierung als Minimierungs-Problem auf einem ungerichteten Graphen • Knoten v für alle Rotamere, E(v) = Etplir - Emax • Kanten uv für Rotamer-Paare verschiedener Residuen, E(uv) = Epwir,js - Emax  k-partiter Graph mit negativen Kanten- und Knoten-Gewichten  GMEC entspricht Rotamer-Graph mit minimalem Gewicht

  27. ILP (II) [3] [3]

  28. Branch-and-cut • Lösen der Relaxation des ILPs  Falls Lösung ā nicht optimal, suche nach fa <= f0, die ā als mögliche Lösung ausschließt • Falls keine Ungleichung gefunden wird, aufsplitten in zwei Unterprobleme

  29. Energieberechnung • Optimierung der GMEC mit AMBER • Freie Bindungsenergie: [3] • ΔGES: elektrostatischer Beitrag • ΔGcav: freie Cavitäts-Energie in Wasser • ΔGconf: Änderung der Entropie • ΔGvdW: Änderung der freien van-der-Waals Energie

  30. Algorithmus (I) • Generierung von Ausgangsstrukturen mit Hilfe von rigidem Docking • Bestimmung der Aminosäuren am Interface • Variation dieser Aminosäuren durch Rotamere • Iterative Anwendung des DEE Theorems zur Reduktion des Konformationsraumes

  31. Algorithmus (II) • Finden der GMEC mit Hilfe der schnellen Heuristic bzw. des exakten branch-and-cut Algorithmus • Optimierung der Molekülgeometrien mit Hilfe eines Molekülmechanik Kraftfeldes • Berechnung der freien Bindungsenergie

  32. Resultate (I) • Test mit drei Protein Komplexen • Anwendung des DEE ergibt große Vereinfachung [3]

  33. Resultate (II) [3]

  34. Resultate (III) [3]

  35. Resultate (IV) [3]

  36. Vor- und Nachteile • Vorteile: • Heuristik liefert schnell gute Annäherung an optimale Lösung • Branch-and-cut liefert optimale Rotamere • Nachteile: • Keine perfekte Trennung von guten und schlechten Ergebnissen • Ergebnisse stark von der Wahl des Kraftfeldes abhängig

  37. Zusammenfassung • Rigides Docking nur erfolgreich, wenn native und Komplexstruktur sehr ähnlich sind • Rigides Docking aber guter Startpunkt für flexibles Docking • Dead-End elimination starke Vereinfachung bei flexiblem Docking

  38. Referenzen [1]Katchalski-Katzir, E., Shariv, I., et al., (1992) PNAS, 89, 2195-2199.Molecular Surface Recognition: Determination of Geometric Fit between Proteins and their Ligands by Correlation Techniques [2] Desmet, J., De Maeyer, M., Hazes, B., and Lasters, I., (1992) Nature, 356, 539-542. DEE Theorem and its Use in Protein Side Chain Positioning [3] Althaus, E., Kohlbacher, O., Lenhof, H.-P., and Muller, P., (2002) J. Comput. Biol., 9, 597-612. A Combinatorial Approach to Protein Docking with Flexible Side Chains

More Related