380 likes | 515 Views
Cascade Correlation für Strukturen. Wissenschaftlicher Vortrag zur Habilation, Barbara Hammer, AG LNM, Universität Osnabrück. 3.95 € in Ihrer Apotheke ... aber die Pharmaindustrie. 10-15 Jahre 500 mio $ Produktenwicklung für seltene Krankheiten findet nicht statt (EU: 1 pro 2000,
E N D
Cascade Correlation für Strukturen Wissenschaftlicher Vortrag zur Habilation, Barbara Hammer, AG LNM, Universität Osnabrück Cascade Correlation für Strukturen
3.95 € in Ihrer Apotheke ... aber die Pharmaindustrie ... Cascade Correlation für Strukturen
10-15 Jahre 500 mio $ Produktenwicklung für seltene Krankheiten findet nicht statt (EU: 1 pro 2000, U.S.A: 1 pro 1000) vereinfachte Zulassung (‘Orphan-drug-Status’) automatisches drug design Cascade Correlation für Strukturen
Cascade Correlation für Strukturen ... ist eine 1999 von Bianucci/Micheli/Sperduti/Starita im Rahmen von QSAR/QSPR Problemen vorgeschlagene automatische Lernmethode, ... weiterentwickelt 2003 zu Contextual Cascade Correlation (Micheli/Sperduti/Sona) Cascade Correlation für Strukturen
Übersicht • QSAR/QSPR Probleme • Klassische Lösungen • Cascade Correlation • Cascade Correlation für Strukturen • Experimente • Theorie Cascade Correlation für Strukturen
QSAR/QSPR Probleme … Cascade Correlation für Strukturen
QSAR/QSPR Probleme Quantitative Structure Activity/Properties Relationship Probleme: sage aufgrund der Struktur eines chemischen Moleküls dessen chemische Funktionalität bzw. physikalische Eigenschaften quantitativ voraus Wirksamkeit zur Hemmung von Prostaglandinen Größe des Moleküls Cascade Correlation für Strukturen
C C C H H H C C C H H H H H H H H H H H H H H H H H H C C C C C H H H H H C H H QSAR/QSPR Probleme • QSPR-Problem: sage den Siedepunkt (in oC) von Alkanen voraus. Alkane: CnH2n+2, Methan, Ethan, Propan, Butan, Pentan, … Hexan 2-Methyl-Pentan je größer n und je mehr Seitenstränge, desto höher der Siedepunkt ausgezeichnetes Benchmark-Problem Cascade Correlation für Strukturen
QSAR/QSPR Probleme • QSAR-Problem: sage die Wirksamkeit (IC50) von Benzodiazepinen voraus Schmerz-/Beruhigungsmittel: Valiquid, Rohypnol, Noctamid, ... Funktionsweise: potentiert die Wirkung des hemmenden Neurotransmitters GABA Problem: Kreuztoleranz, Kreuzabhängigkeit interessantes Problem, Vergleichsergebnisse vorhanden Cascade Correlation für Strukturen
Klassische Lösungen … Cascade Correlation für Strukturen
Klassische Lösungen Topologische Indizes Physiko-chemische Eigenschaften lineare Regression neuronale Netze direkte Modellierung Geometrische Eigen-schaften, Ladung 0.42 Explizite vektorielle Darstellung der Konnektivität ... Cascade Correlation für Strukturen
C C C C C C C C C C Klassische Lösungen Siedepunkt von Alkanen: [Cherqaoui/Vilemin] 150 Alkane mit maximal 10 C-Atomen, ad hoc Kodierung: Anzahl der Nachbarn +1 der C in der durch die Stränge vorgegebenen Reihenfolge, der längste Strang zuerst: standard feedforward Netze adäquate Kodierung, aber n ist beschränkt 1233221121 Cascade Correlation für Strukturen
Klassische Lösungen Wirksamkeit von Benzodiazepinen[Hadjipavlou/Hansch]: IC50 von 79 klassischen 1,4-Benzodiazepin-2 bei Ratten (in vitro), direkte Modellierung und Parameteroptimierung anhand von Daten log 1/C = 1.3 log P - 2.3 log (β 10log P +1) + 1.08 B1-7 + 1.05 B1-2’ + 2.54 mit P: misst die Hydrophobizität des Moleküls, B1: Sterimol-Parameter, d.h. Breite/Größe des Residuums, log β = -2.41 gute Ergebnisse, aber komplizierte physikochemische Parameter Cascade Correlation für Strukturen
Cascade Correlation … Cascade Correlation für Strukturen
Cascade Correlation Cascade Correlation ... ist eine 1990 von Fahlman/Lebiere vorgeschlagene besonders effiziente Alternative zu standard feedforward Netzen, die iterativ (in Kaskaden) eine die Daten approximierende Funktion aufbaut. Cascade Correlation für Strukturen
x tanh(wtx+b) Cascade Correlation Daten (x,y) in ℝnxℝ seien gegeben, finde f mit f(x)≈y für alle Daten, kleinste Einheit: minimiere den Fehler auf den Daten x y maximiere die Korrelation der Ausgabe dieser Einheit mit dem bisherigen Fehler die Einheit kann zur Fehlerkorrektur benutzt werden hi(x)=fi(x,h1(x), ..., hi-1(x)) usw. Cascade Correlation für Strukturen
Cascade Correlation • ‘kaskadierte’ (wenige, iterativ optimierte) Parameter effizientes Training gute Generalisierung auch bei wenigen Daten Siegeszug mit dem zwei Spiralenproblem: sehr verschachtelte Funktionen, Training theoretisch nicht gut ver-standen, prinzipielle Eigenschaften wie standard feedforward Netze auch in der Praxis nicht besser als standard feedforward Netze mit besseren Trainingsverfahren oder SVM Cascade Correlation für Strukturen
Cascade Correlation für Strukturen … Cascade Correlation für Strukturen
Cascade Correlation für Strukturen Cascade Correlation für Strukturen 0.42 Cascade Correlation für Strukturen
l(v) ch1(v) chk(v) ... ... ... C C C C C C C C C C C C C C C C C C C C Cascade Correlation für Strukturen Strukturen = gelabelte Bäume mit fan-out k l(v)(ch1(v),...,chk(v)) CH3(CH2(CH2(CH(CH2(CH3),CH(CH3,CH2(CH3)))))) Cascade Correlation für Strukturen
bdz 1 2‘ 3 5 6 6‘ 7 8 9 Cascade Correlation für Strukturen Strukturen = gelabelte Bäume mit fan-out k etwa: bdz(h,f,h,ph,h,h,f,h,h) bdz(h,h,h,ph,c3(h,h,h),h,c3(h,h,h),h,h) bdz(c3(h,h,o1(c3(h,h,h))),h,h,ph,h,h,n2(o,o),h,h) Cascade Correlation für Strukturen
l(v) ch1(v) chk(v) ... ... ... Cascade Correlation für Strukturen Strukturen = gelabelte Bäume mit fan-out k allgemeiner DPAGs = gelabelte azyklische Graphen mit einem Startknoten, fan-out k, fan-in k’, und Positionierung der Kinder und Eltern Cascade Correlation für Strukturen
l(v) ch1(v) chk(v) ... ... ... q-1(h1(v)) Cascade Correlation für Strukturen rekursives Verarbeiten der Struktur von den Blättern zur Wurzel: q-1(hi(v)):=(hi(ch1(v)),...,hi(chk(v))) q-1 azyklisch! q-1 h1(v) = f1(l(v),h1(ch1(v)),...,h1(chk(v))) q-1 q-1 ... das ist verboten, da die Gewichte eingefroren werden! h2(v) = f2(l(v),h2(ch1(v)),...,h2(chk(v)), h1(v),h1(ch1(v)),...,h1(chk(v))) usw. überhaupt kein Problem! Cascade Correlation für Strukturen
Cascade Correlation für Strukturen init; repeat add hi; train fi(l(v), q-1(hi(v)), h1(v), q-1(h1(v)), ...,hi-1(v), q-1(hi-1(v))) on the correlation; train the output on the error; Cascade Correlation für Strukturen
Contextual Cascade Correlation q-1(hi(v)):=(hi(ch1(v)),...,hi(chk(v))) q+1(hi(v)):=(hi(pa1(v)),...,hi(pak’(v))) q-1 q+1 q+1 q-1 ... gäbe Zyklen innerhalb der Struktur! q-1 hi(v)= fi(l(v),q-1(hi(v)),h1(v),q-1(h1(v)),q+1(h1(v)) ...,hi-1(v),q-1(hi-1(v)),q+1(hi-1(v))) Cascade Correlation für Strukturen
Contextual Cascade Correlation q+1 erweitert den Kontext von hi: i=3 i=2 i=1 Cascade Correlation für Strukturen
Experimente … Cascade Correlation für Strukturen
Experimente Alkane: 150 Beispiele, bipolare Kodierung der Symbole, 10-fache Kreuzvalidierung wie [CV], mean max i ≈ 137 (CRecCC), 110 bzw. 140 (RecCC), Bereich: [-164,174] Cascade Correlation für Strukturen
Kontext: PCA der hi(v) Experimente Cascade Correlation für Strukturen
Experimente Benzodiazepine: 79 Beispiele, bipolare Kodierung, 5 Testbeispiele von [HH] und weitere folds, max i ≈ 13-40 Cascade Correlation für Strukturen
Experimente Cascade Correlation für Strukturen
Theorie … Cascade Correlation für Strukturen
Theorie Recurrent Cascade Correlation ... ist eine 1991 von Fahlman vorgeschlagene besonders effiziente Alternative zu standard rekurrenten Netzen, die iterativ (in Kaskaden) eine die Daten approximierende Funktion aufbaut ... es ist der Spezialfall für fan-out k=1 von Cascade Correlation für Strukturen RCC wurde nie wirklich angewandt, obwohl das Training von standard rekurrenten Netzen noch nicht zufriedenstellend gelöst ist Cascade Correlation für Strukturen
Periode ≤ 2 Theorie Giles, 1995: RCC kann nicht alle Automaten darstellen! • betrachte die Eingabe (1,1,1,1,1,1,1,1,1,...) • hi(t) = tanh(wit(1,hi(t-1),h1(t),h1(t-1),...,hi-1(t),hi-1(t-1))+bi) Behauptung: hi(t) konvergiert gegen einen Punkt der Periode ≤ 2 Mathe: sei f:ℝ(-1,1) stetig und monoton wachsend, dann konvergiert (fn(x))n gegen einen Fixpunkt. Induktion: h1(t) = tanh(w1h1(t-1)+b1’) ist monoton wachsend oder fallend • h1n konvergiert gegen einen Punkt der Periode ≤ 2 hi(t) = tanh(wi1hi(t-1) + wit(h1(t),h1(t-1),...,hi-1(t),hi-1(t-1)) + bi’) hi(t) = tanh(w∙hi(t-1) + λ) mit λ Periode ≤ 2 hi(t) = tanh(w∙tanh(w∙hi(t-2) + λ1) + λ2) ist monoton wachsend Cascade Correlation für Strukturen
Theorie ... für die exakt darstellbaren Funktionen ergibt sich: CRecCC NN = CC RCC RecCC RNN RecNN Cascade Correlation für Strukturen
Theorie ... für die approximativ (bezogen auf dP) darstellbaren Funktionen ergibt sich: RCC ist approximationsvollständig für Sequenzen (=RNN) RecCC mit multiplikativen Neuronen ist approximationsvollständig für Baumstrukturen (=RecNN) Contextual Cascade Correlation hat mindestens die approximativen Eigenschaften wie RecNNs und erweitert auf Kontext gerichtete azyklische Graphen ... der Beweis für RNNs benutzt faktisch nur RCC ... der Beweis für RecNNs benutzt faktisch nur multiplikative RecCC Cascade Correlation für Strukturen
Zu Risiken und Nebenwirkungen fragen Sie Ihren Arzt oder Apotheker Cascade Correlation für Strukturen