380 likes | 556 Views
Seminar Bioinformatik, „ Theoretical Analysis of Protein-Protein Interactions ”. Docking von starren und flexiblen Proteinen. Präsentation von Andreas Schlicker ( andreasschlicker@web.de ). Übersicht. Molecular surface recognition:
E N D
Seminar Bioinformatik, „Theoretical Analysis of Protein-Protein Interactions” Docking von starren und flexiblen Proteinen Präsentation von Andreas Schlicker (andreasschlicker@web.de)
Übersicht • Molecular surface recognition: • Docking von starren Proteinen und Liganden mit Hilfe von Korrelation geometrischer Eigenschaften • Dead-End Elimination theorem (DEE): • Reduktion des Konformations-Suchraums bei flexiblem Docking • Protein Docking mit flexiblen Seitenketten
Molecular surface recognition • Docking von Molekülen anhand geometrischer Eigenschaften • Form von Interfaces im gebundenen und freien Zustand häufig sehr ähnlich • Suche im 6-dimensionalen Rotations- und Translationsraum
Repräsentation der Moleküle • Projektion der 3D-Koordinaten auf ein Gitter • Gitterpunkt innerhalb des Moleküls, wenn Atomkern innerhalb Radius r vorhanden [1] [1]
Matching von Oberflächen (I) • Korrelation der geometrischen Form • (α, β, γ) gibt die Verschiebung von Molekül b in Bezug auf Molekül a an [1] • Kein Kontakt Korrelation = 0 • Kontakt Korrelation > 0 je besser der Kontakt, desto größer die Korrelation
Matching von Oberflächen (II) • Problem: auch Überlappung liefert positive Korrelation • Lösung: • ρ in Gleichung [2a] << 0 • δ in Gleichung [2b] > 0 Überlappung wird mit negativer Korrelation bestraft [1]
Berechnung (I) • Direkte Berechnung der Korrelation benötigt Zeit O(N6) Verwende Fourier Transformation [1] • Korrelation wird durch Inverse Fourier-Transformation erhalten Benötigte Zeit liegt in O(N³ln(N³))
Berechnung (II) • Molekül a wird fixiert, Molekül b wird in allen Orientierungen getestet [1]
Resultate • Test mit 5 Komplexen, zwei Durchgänge mit unterschiedlichen Gitter-Größen [1] [1] [1]
Vor- und Nachteile • Vorteile: • Schnelle Berechnung • Meistens korrekte Vorhersage • Parameter sind universell einsetzbar • Nachteile: • Starre Moleküle • Keine Berücksichtigung physiko-chemischer Eigenschaften
Dead-End Elimination Theorem • Konformationsraum von Proteinen sehr groß, selbst bei Verwendung von Rotamer-Bibliotheken • Systematische Suche nach der „global minimum energy conformation“ (GMEC) praktisch unmöglich
Energie einer Konformation • Potentielle Energie eines Proteins: [2]
„Dead-Ending“ Rotamere • Rotamere, die in der GMEC nicht vorkommen können • Rotamer ir kann nicht vorkommen, wenn für ein Paar (ir, it) gilt: [2]
Erweiterung auf Rotamerpaare • Energie eines Rotamerpaares [irjs] [2] • Interaktionsenergie mit anderen Rotameren [2] Rotamerpaar [irjs] ist „dead-ending“, wenn gilt: [2]
Algorithmus • Eliminiere alle Rotamere, die offensichtlich inkompatibel sind • Eliminiere „dead-ending“ Rotamere mit dem DEE Theorem • Wende DEE Theorem auf alle Rotamerpaare an und markiere „dead-ending“ Paare • Iteriere, bis keine weiteren Rotamere mehr entfallen
Resultate (I) • Test mit dem Insulin-Dimer • anfängliche Kombinationsmöglichkeiten: 2,7*1076 • Nach 9 Iterationen: 7200 • Modellierung des Proteins liefert 55 richtig vorhergesagte Residuen • Verborgene Residuen werden mit 93% Genauigkeit vorhergesagt [2]
Resultate (II) • Blind-Test an Limulus polyphemus • 194 Aminosäuren, wovon 71 % richtig vorhergesagt wurden • Viele Fehler durch falsche Salz- und Wasserstoffbrücken an exponierten Gruppen
Vor- und Nachteile • Vorteile: • Schnelle Berechnung (Aufwand steigt „nur“ quadratisch mit Anzahl der Aminosäuren) • Starke Reduzierung des Suchraums • Nachteile: • Ungenauigkeiten durch verwendete Energiefunktion • Benötigt relativ genaues Template • Abhängig von der verwendeten Rotamer-Bibliothek
Protein Docking mit flexiblen Seitenketten • Docking von rigiden Strukturen keine gute Lösung • Problem des exponentiellen Wachstums des Konformationsraums bei flexiblen Seitenketten
Flexibilität • Alle Residuen flexibel behandeln sehr aufwändig selbst bei Verwendung von Rotamer-Bibliotheken Nur Interface-Residuen flexibel • Interface benötigt Rigides Docking zur Erzeugung von Anfangsstrukturen
Rigides Docking • Verwendet geometrische und einfache chemische Fitness Funktionen • Von den erzeugten Komplexstrukturen wurden die 60 besten weiter verfolgt • Oft große Überlappung der Proteine und inkorrekt platzierte Seitenketten
Bestimmung der Bindungsstelle • Residuen, die innerhalb 6 Å eines Atoms des anderen Proteins liegen • Seitenketten ohne Rotamere (CYS in Disulfidbrücken, ALA, GLY) werden nicht berücksichtigt
GMEC • GMEC = Kombination der Rotamere, die die niedrigste Energie liefern [3] Anwendung des DEE-Theorems möglich
Suche nach der GMEC • Zwei Strategien: • Multi-Greedy Methode • Branch-and-cut basierend auf einem ILP
Multi-Greedy Methode (I) • Aufbau eines Enumerations-Baumes mit möglichen Kombinationen [3]
Integer Linear Program (ILP) • Formulierung als Minimierungs-Problem auf einem ungerichteten Graphen • Knoten v für alle Rotamere, E(v) = Etplir - Emax • Kanten uv für Rotamer-Paare verschiedener Residuen, E(uv) = Epwir,js - Emax k-partiter Graph mit negativen Kanten- und Knoten-Gewichten GMEC entspricht Rotamer-Graph mit minimalem Gewicht
ILP (II) [3] [3]
Branch-and-cut • Lösen der Relaxation des ILPs Falls Lösung ā nicht optimal, suche nach fa <= f0, die ā als mögliche Lösung ausschließt • Falls keine Ungleichung gefunden wird, aufsplitten in zwei Unterprobleme
Energieberechnung • Optimierung der GMEC mit AMBER • Freie Bindungsenergie: [3] • ΔGES: elektrostatischer Beitrag • ΔGcav: freie Cavitäts-Energie in Wasser • ΔGconf: Änderung der Entropie • ΔGvdW: Änderung der freien van-der-Waals Energie
Algorithmus (I) • Generierung von Ausgangsstrukturen mit Hilfe von rigidem Docking • Bestimmung der Aminosäuren am Interface • Variation dieser Aminosäuren durch Rotamere • Iterative Anwendung des DEE Theorems zur Reduktion des Konformationsraumes
Algorithmus (II) • Finden der GMEC mit Hilfe der schnellen Heuristic bzw. des exakten branch-and-cut Algorithmus • Optimierung der Molekülgeometrien mit Hilfe eines Molekülmechanik Kraftfeldes • Berechnung der freien Bindungsenergie
Resultate (I) • Test mit drei Protein Komplexen • Anwendung des DEE ergibt große Vereinfachung [3]
Resultate (II) [3]
Resultate (III) [3]
Resultate (IV) [3]
Vor- und Nachteile • Vorteile: • Heuristik liefert schnell gute Annäherung an optimale Lösung • Branch-and-cut liefert optimale Rotamere • Nachteile: • Keine perfekte Trennung von guten und schlechten Ergebnissen • Ergebnisse stark von der Wahl des Kraftfeldes abhängig
Zusammenfassung • Rigides Docking nur erfolgreich, wenn native und Komplexstruktur sehr ähnlich sind • Rigides Docking aber guter Startpunkt für flexibles Docking • Dead-End elimination starke Vereinfachung bei flexiblem Docking
Referenzen [1]Katchalski-Katzir, E., Shariv, I., et al., (1992) PNAS, 89, 2195-2199.Molecular Surface Recognition: Determination of Geometric Fit between Proteins and their Ligands by Correlation Techniques [2] Desmet, J., De Maeyer, M., Hazes, B., and Lasters, I., (1992) Nature, 356, 539-542. DEE Theorem and its Use in Protein Side Chain Positioning [3] Althaus, E., Kohlbacher, O., Lenhof, H.-P., and Muller, P., (2002) J. Comput. Biol., 9, 597-612. A Combinatorial Approach to Protein Docking with Flexible Side Chains