300 likes | 401 Views
Proseminar Bioinformatik: Theoretical Analysis of Protein-Protein-Interactions. Scoring Functions. Silke Ruzek. 22.Juni.2004. Überblick. Einleitung 1.Modell: Paar Potentiale zur Bewertung möglicher Docking-Komplexe 2.Modell: Kombination von Scoring Funktionen Fazit
E N D
Proseminar Bioinformatik:Theoretical Analysis of Protein-Protein-Interactions Scoring Functions Silke Ruzek 22.Juni.2004
Überblick • Einleitung • 1.Modell: Paar Potentiale zur Bewertung möglicher Docking-Komplexe • 2.Modell: Kombination von Scoring Funktionen • Fazit • Diskussion
Einleitung • Ziel von Protein-Protein-Docking: Bestimmung der detaillierten Struktur des Komplexes ausgehend von den ungebundenen Komponenten • Docking Methoden verwenden rigid-body-Strategien und erzeugen eine große Anzahl von Docking-Komplex-Kandidaten • Aus vielen möglichen Konformationen sollen die stabilsten Komplexe ausgewählt werden • Scoring Funktionen bewerten Konformationen unter Berücksichtigung der chemischen Aktivität zwischen den Molekülen und der Größe der Kontaktfläche
Modell 1: Paar Potentiale • Residue-Residue-Paar Potentiale sind ein einfaches • Modell um die Vielfachheit der Interaktionen zwischen • Residuen darzustellen • Anwendung zur Identifizierung des nativen Protein- Komplexes aus der Menge der möglichen • Konformationen • Ein Komplex ist nahe an der nativen Konformation, • wenn der RMSD der C -Atome im Interface kleiner als • 2.5Å ist
Modell 1: Paar Potentiale Methode: • 4 Typen von Paar-Potentialen • basierend auf C -Atomen von Residuen • basierend auf allen Atomen von Residuen • basierend auf allen Seitenketten-Atomen • Atom-level Potential Jedem Atom in jeder Residue wird einer von 40 Atomtypen zugewiesen • Paar c existiert zwischen Residue/ Atomtyp i und j wenn die Atome der beiden Residuen/ die Atomtypen innerhalb einer Cutoff-Distanz liegen
Modell 1: Paar Potentiale • 3 Datensätze werden getestet: Interdomän-Paarungen nicht-redundanter Heterodimere 11 Strukturen mit RMSD von 2.5Å oder besser Interdomän-Paarungen nicht-redundanter Homodimere 23 Strukturen mit RMSD von 2.5Å oder besser Intramolekulare Residuen-Paarungen nicht-homologer Protein-Domänen 385 Domänenmit RMSD von 2.5Å oder besser Für jede Superfamilie der Klassen α,β,α/β,α+β aus SCOP wurde die beste Struktur genommen
Modell 1: Paar Potentiale Generierung des Potentials: • Bestimmung der Anzahl der Paarungen zwischen jedem Residuen-Typ • Kalkulation der erwarteten Anzahl von Paaren zwischen Residue i und j: • Nur Werte größer 5 werden berücksichtigt • Mole-fraction-Methode • Contact-fraction-Methode =Vorkommen jeder Residue
Modell 1: Paar Potentiale Paar-Potential-Matrix: • Score für jedes Paar entspricht dem log von tatsächlicher Anzahl durch erwartete Anzahl • Dadurch ergibt sich der Gesamtscore als Summe der individuellen Scores
Modell 1: Paar Potentiale Bewertung der Docking-Komplex: • Für jeden Komplex wird ein Gesamtscore durch Addieren der Scores der Paare, die das Interface des Komplexes bilden, berechnet. • Zusatzbedingung: Minimum relative surface accessibility (MRSA) Residuen,die nicht zugänglich sind können ausgeschlossen werden • Komplexe werden nach ihren Scores geordnet und die Position des nativen Komplexes in der Liste wird bestimmt
Modell 1: Paar Potentiale Testsysteme: • 5 Enzym-Inhibitor-Systeme und • 4 Antikörper-Antigen-Systeme Parameter: • Distance-Cutoff: - C -Atome: 5 -15 Å in 1Å Schritten - sonst : 4 -10 Å in 1Å Schritten • MRSA : 0, 5, 20% Nur Komplexe aus mindestens 20 Paaren werden berücksichtigt
Modell 1: Paar Potentiale Resultate: Tabelle I: alle Resultate
Tabelle II : Einordnung der korrekten Struktur Modell 1: Paar Potentiale Resultate: Enzym-Inhibitor Systeme Antikörper-Antigen Systeme
Kombination mit Multidock • Multidock: Methode die Bewegungen von Seitenketten nach Komplex-Bildung in einen niedrigeren Energiezustand berücksichtigt • Produziert vergleichbare Ergebnisse,ordnet aber auch richtige Docking-Komplexe komplett falsch ein • Paar-Potential filtert Docking-Komplexe aus • Multidock bewertet die restlichen Komplexe
Tabelle III: Kombinierte Resultate Kombination mit Multidock Kombinierter Rangbringt deutliche Verbesserung gegenüber Paar-Potential oder Multidock alleine
Fazit • Paar Potentiale können die stabile Docking-Konformation aus einer Liste von möglichen Komplexen auswählen • Ein korrektes Docking wird am oberen Ende der Hit-Liste plaziert • Beste Resultate durch intermolekulare Paarungen in einem Datensatz nicht-homologer Protein-Domänen • Paar Potentiale können eine Liste mit möglichen Komplexen verkleinern, bevor detailliertere Prozeduren angewendet werden können • Paar Potentiale ordnen auch falsch-positive Komplexe hoch ein, bewerten aber ein korrektes Docking nicht komplett falsch
Modell 2: Kombination von Scoring Funktionen • Struktur-basierte Potentiale werden zum Filtern, Rescoring und Einordnen der ausgewählten Konformationen verwendet. • Atomic Contact Potential (ACP) • Residue Potential Score (RPScore) • Kombination der Potentiale mit Energie-Termen • Anwendung auf • 13 Protein-Test-Sets • Docking-Resultate von 10 Paaren ungebundener Proteine
Motivation • Frühere Studie: Kombinierten Potentialen aus elektrostatischen, Desolvations- und van der Waals-Energien liefern bessere Ergebnisse • Entwicklung des Residue-Potential-Scores (Paar Potential) erlaubt Verbesserung der bisherigen Ergebnisse • ACP konnte durch Hinzufügen von elektrostatischem und van der Waals Term verbessert werden • Test mehrerer kombinierter Potentiale auf Verbesserungen
ACP • Atomic Contact Potential • Freie Energie die benötigt wird um Atom-Wasser-Kontakte durch Atom-Atom-Kontakte zu ersetzten. • ACP-Energien wurden für 18 Atom-Typen aus 89 nicht-homologen Proteinstrukturen abgeleitet :ACP-Energie der wechselwirkenden Atome i und j , wobei alle Paare mit weniger als 6Å Abstand beachtet werden
1.Test-Studie Methode: • Trainings-Sets aus 99 Konformationen für 13 Komplexe generiert mit FTDock • Minimierung der Konformationen in CHARMM • Bewertung der Testsets mit 16 verschiedenen Scoring Funktionen
Source: http://www.bmm.icnet.uk/docking/ 1.Test-Studie
1.Test-Studie Bewertung der Scoring-Funktionen durch • Ø RMSD der 10 top-plazierten Strukturen • Anzahl der Strukturen innerhalb 10Å RMSD der nativen Struktur (Hits) • Rang des ersten Hits • RMSD der best-bewertesten Struktur
Scoring Funktionen aus der Test-Studie werden an 10 Sets aus 20.000 Konformationen getestet (generiert durch rigid-body Docking Programm DOT) 2. Docking Studie (b) Distributionof the 10 decoy sets generated by DOT, each comprising 20,000 structures.
2.Docking Studie Anwenden von zwei verschiedenen Filtern • ACP+Elec Filter 500 Strukturen mit niedrigstenΔG Werten 1500 Strukturen mit niedrigsten ΔE Werten Kalkulierung von ΔE berücksichtigt die strukturellen Unsicherheiten beim Docking besser 2. RPScore Filter 500 Strukturen mit niedrigsten ΔG Werten
2.Docking Studie Filterleistung in Abhängigkeit von der Ladung der Komplexe
2.Docking Studie • Minimierung der gefilterten Strukturen in CHARMM • Pro Komplex entstehen 2 Test-Sets • Rescoring der Test-Sets anaolg zur ersten Studie
2.Docking Studie Ergebnisse: RPScore Filter ASP+Elec Filter
Fazit • Verfeinerung der Strukturen durch Energieminimierung • Zusätzlicher van der Waals Term verbessert die Einordnung der Konformationen • ΔG findet beim Filtern die meisten Hits und ist besonders für geladene Komplexe geeignet • Beste Strategien: RPScore Filter + ACP Scoring Funktion ACP+Elec Filter + RPScore Scoring Funktion • Durch Kombination von mehreren Potentialen in mulitstage postprocessing Prozeduren besseres Auffinden von möglichen stabilen Komplexen möglich
Referenz • Moont, G., Gabb, H.A., and Sternberg, M.J.E., (1999) Proteins, 35, 364-373. Use of Pair Potentials Across Protein Interfaces in Sreening Predicted Docked Complexes. • Zhang, C., Vasmatzis, G., Cornette, J.L., and DeLisi, C., (1997) J. Mol. Biol., 267, 707-726. Determination of Atomic Desolvation Energies from the Structures of Crystallized Proteins. • Murphy, J., Gatchell, D.W., Prasad, J.C., and Vajda, S., (2003) Proteins, 53, 840-854. Combination of Scoring Functions Improves Discrimination in Protein-Protein Docking.