Jordan-Netze und Elman-Netze

1. Jordan-Netze und Elman-Netze 30. November 2005

2. 30.11.2005 Jordan-Netze und Elman-Netze 2 Inhalt 1. Zeitreihenprognose 1.1. Begriffskl�rung 1.2. M�glichkeiten 2. Jordan-Netz 2.1. Architektur 2.2. Eigenschaften 2.3. Funktionsweise 3. Elman-Netz 3.1. Architektur 3.2. Eigenschaften 3.3. Funktionsweise 4. Lernverfahren 5. Beispiel XOR-Problem

3. 30.11.2005 Jordan-Netze und Elman-Netze 3 1. Zeitreihenprognose 1.1. Begriffskl�rung (Zeitreihe) Musterfolge, bei der die Reihenfolge der Muster von der Zeit beeinflusst wird Muster kann nicht mehr isoliert betrachtet werden, sondern im zeitlichen Kontext mit anderen Mustern (wichtig ist die Position im gesamten Musterkontext) Ausgabe des Netzes h�ngt nicht nur von der aktuellen Eingabe ab, sondern auch von vorangegangenen (bzw. nachfolgenden) Mustern z.B. wirtschaftliche Kenndaten (Aktienmarkt), Kontrollsignale (Fahrzeugsteuerung), �

4. 30.11.2005 Jordan-Netze und Elman-Netze 4 M�glichkeiten Es gibt 2 Ans�tze zur Repr�sentation der Zeit Zeitfenster Partiell rekurrente Netze Es k�nnen auch beide kombiniert werden

5. 30.11.2005 Jordan-Netze und Elman-Netze 5 M�glichkeiten Zeitfenster Eingabe einer Teilfolge von n Mustern (statt des einzelnen Musters) Somit Zugriff auf ein Teilfenster der L�nge n F�r jedes neue Muster wird das Teilfenster um eine Position nach hinten verschoben Dieses �Sliding window� erlaubt Verwendung einfacher feedforward-Netze (Training mit Backpropagation) Nachteile: Gr�sse des Eingabefensters durch Netztopologie definiert / nur relative Position eines Musters im Eingabefenster relevant -> absolute Postion bleibt unber�cksichtigt

6. 30.11.2005 Jordan-Netze und Elman-Netze 6 M�glichkeiten Partiell rekurrente Netze Beispiel: Vorhersage des n�chsten Wertes eines Kurvenverlaufs

7. 30.11.2005 Jordan-Netze und Elman-Netze 7 M�glichkeiten Architektur erm�glicht, dass die zeitliche Reihenfolge der Eingabedaten Einfluss auf das Ergebnis hat Informationen aus dem Verarbeitungsschritt werden in den Verarbeitungsschritt �bernommen d.h., die Zeit wird im neuronalen Netz repr�sentiert Abgeleitet aus feed-forward-Netzen -> trainierbar durch modifizierte Lernverfahren der feed-forward-Netze

8. 30.11.2005 Jordan-Netze und Elman-Netze 8 Jordan-Netz Architektur

9. 30.11.2005 Jordan-Netze und Elman-Netze 9 Jordan-Netz Eigenschaften Feedforward Netze mit Kontextzellen, um den Ausgabezustand zu speichern Eingabezellen und Kontextzellen liefern Eingabe an den hidden Layer, dessen Ausgabe an die Ausgabezellen weiterpropagiert wird Ausgabewerte werden nach au�en weitergegeben und dienen weiterhin, �ber 1:1 R�ckkopplungsverbindungen mit festen Gewichten als Input an Kontextzellen Kontextzellen besitzen direkte R�ckkopplungen mit St�rke , nicht trainierbar, Aktivierungsfunktion: Identit�t Anzahl der Kontextzellen = Anzahl der Ausgabezellen Nur Verbindungen zur verdeckten Schicht und zur Ausgabeschicht sind trainierbar

10. 30.11.2005 Jordan-Netze und Elman-Netze 10 Jordan-Netz Funktionsweise Ausgabe des Netzes zum Zeitpunkt t: O(t) Zeitabh�ngiger interner Zustand: Vektor S(t) Externe Eingabe zum Zeitpunkt t: I(t) Ausgabefunktion F �bergangsfunktion G

11. 30.11.2005 Jordan-Netze und Elman-Netze 11 Jordan-Netz Funktionsweise Die Aktivierungsfunktion der Zustandszellen ist die identische Abbildung. Ausgehend von einem Startzustand ergibt sich dann f�r den Zustandsvektor S zur Zeit t:

12. 30.11.2005 Jordan-Netze und Elman-Netze 12 Jordan-Netz Funktionsweise Mit den Vereinfachungen, dass der Initialkontext der Nullvektor ist und die R�ckkopplungsverbindungen von der Ausgabe zu den Kontextzellen alle den Wert besitzen, reduziert sich die Gleichung zu Diese �bergangsfunktion ist eine gewichtete Summe aller bisherigen Ausgaben

13. 30.11.2005 Jordan-Netze und Elman-Netze 13 Jordan-Netz Funktionsweise steuert das Erinnerungsverm�gen des Netzes Wert liegt im Bereich [0,1] Kleiner Wert: weiter zur�ckliegende Zust�nde werden nur noch minimal ber�cksichtigt, die letzten dagegen relativ stark (Netzwerk vergisst schnell, reagiert aber flexibel auf neuere �nderungen) Wert nahe 1: Einfluss �lterer Ausgaben wichtiger Extremfall Wert=1: Aufsummierung aller bisherigen Ausgaben

14. 30.11.2005 Jordan-Netze und Elman-Netze 14 Jordan-Netz Nachteile: Oft wird kleiner Wert f�r ben�tigt und gro�er Wert f�r nahe 1.0 erw�nscht Kontextzellen k�nnen nur Ausgaben speichern, nicht internen Zustand der verdeckten Schicht

15. 30.11.2005 Jordan-Netze und Elman-Netze 15 Elman-Netz Architektur

16. 30.11.2005 Jordan-Netze und Elman-Netze 16 Elman-Netz Eigenschaften Feedforward Netze mit Kontextzellen, um den Zustand der verdeckten Zellen zu speichern Modifikation der Jordan-Netze R�ckkopplung aus der verdeckten Schicht keine direkte R�ckkopplung der Kontextzellen Anzahl der Kontextzellen = Anzahl der verdeckten Zellen R�ckkopplungsverbindung mit festem Gewicht 1 Aktivierungsfunktion: Identit�t Kontextzellen enthalten letzten Zustand der verdeckten Schicht, erlaubt zeitlichen Bezug

17. 30.11.2005 Jordan-Netze und Elman-Netze 17 Funktionsweise Aktivierungen der Kontextzellen auf definierten Wert setzen Nach Eingabe des 1.Musters werden verdeckte Zellen von Eingabe �und Kontextzellen aktiviert Neuer Zustand Kontextzellen=Kopie der Ausgabe der verdeckten Zellen (Identit�t) Verdeckte Zellen geben Ausgabe an Ausgabezellen weiter (Ausgabe nach aussen) N�chstes Muster: Kontextzellen enthalten nun die Aktivierungen der verdeckten Zellen des vorherigen Musters -> So kann ein zeitlicher Bezug zu fr�heren Mustern hergestellt werden Aufgabe der verdeckten Zellen: externe Eingabe und gespeicherter interner Zustand auf gew�nschte Ausgabe abbilden Elman-Netz

18. 30.11.2005 Jordan-Netze und Elman-Netze 18 Elman-Netz Funktionsweise Ausbildung einer internen Repr�sentation in den verdeckten Zellen durch Training, die die zeitlichen Eigenschaften der Eingabesequenz in geeigneter Weise wiederspiegelt -> Die Zeit ist in den internen Zust�nden der verdeckten Zellen kodiert Vorteil gegen�ber Jordan-Netzen: Eignung des Netzes ist nicht direkt von der zu erzeugenden Ausgabesequenz abh�ngig Erweiterbar auf hierarchische Elman-Netze: mehrere verdeckte Schichten, direkte R�ckkopplungen -> unterschiedliches Speicherverhalten durch Wahl unterschiedlicher Parameter

19. 30.11.2005 Jordan-Netze und Elman-Netze 19 Lernverfahren Partiell rekurrente Netze k�nnen mit einer leicht abgewandelten Form des Backpropagation-Lernverfahrens trainiert werden Man l�sst alle rekurrenten Verbindungen weg und erh�lt so ein reines Feedforward-Netzwerk, bei dem die Kontextzellen zus�tzliche Eingabezellen sind Das funktioniert, da der Zustandsvektor der Kontextzellen durch eine feste �bergangsfunktion definiert ist (feste Gewichte, nicht ver�nderbar)

20. 30.11.2005 Jordan-Netze und Elman-Netze 20 Lernverfahren Backpropagation-Algorithmus zum Training partiell rekurrenter Netze 1. Initialisierung der Kontextzellen 2. F�r jedes Trainingsmuster wird folgendes durchgef�hrt Anlegen des Eingabemusters und Vorw�rtspropagierung bis zur Ausgabe (ohne Beachtung der rekurrenten Verbindungen) Vergleich der tats�chlichen Ausgabe mit der gew�nschten und Berechnung des Fehlersignals f�r jede Ausgabezelle R�ckw�rtspropagierung der Fehlersignale von den Ausgabezellen bis zu den Eingabezellen Berechnung der Gewichts�nderungen mit Hilfe der Fehlersignale

21. 30.11.2005 Jordan-Netze und Elman-Netze 21 Lernverfahren Anpassung der Gewichte Berechnung des Folgezustands der Kontextzellen gem�� ihrer Eingangsverbindungen. Dies ist der einzige Schritt bei dem die rekurrenten Verbindungen beachtet werden

22. 30.11.2005 Jordan-Netze und Elman-Netze 22 Beispiel XOR-Problem Eingabe: Blocke von 3 bin�ren Werten Die ersten beiden Werte sind zuf�llig Der dritte Wert ist die XOR-Verkn�pfung der ersten beiden Aufgabe des Netzes: Voraussage des n�chsten zu erwartenden Wertes Dies kann es f�r die zweite zuf�llige Eingabe erreichen, indem es zusammen mit der Eingabe des ersten Zeitschrittes die Eingabe des dritten Zeitschrittes berechnet. Um dieses Verhalten zu erreichen, wird die Eingabe um einen Zeitschritt nach vorn versetzt und als Zielwert (durch Backpropagation) eingelernt

23. 30.11.2005 Jordan-Netze und Elman-Netze 23 Beispiel XOR-Problem Es zeigt sich, dass der Erkennungsfehler bei dem jeweiligen zweiten Wert abnimmt Das Netz erlernt also die XOR-Verkn�pfung und kann dort wo es m�glich ist den Wert berechnen Mit Hilfe der vorausgegangenen Eingaben kann das Netz also die n�chste Eingabe vorrausbestimmen

24. 30.11.2005 Jordan-Netze und Elman-Netze 24 Ende Das wars ;-) Vielen Dank f�r die Aufmerksamkeit

Jordan-Netze und Elman-Netze

Jordan-Netze und Elman-Netze

Presentation Transcript

Mobile Netze: Modulation und Kanalkodierung

Künstliche Neuronale Netze

Spikende Neuronale Netze

9. Radiale-Basisfunktionen-Netze (RBF-Netze)

Netze

Integrierte Versorgung, Schulungsvereine und diabetologische Netze

Strukturverarbeitende Neuronale Netze

Private Netze

Semantische Netze

Neuronale Netze

Wissensextraktion mittels künstlicher neuronaler Netze Autoassoziative Netze

Mehrschichtige Neuronale Netze

Petri-Netze Übungsbeispiele

Künstliche Neuronale Netze

Bayes-Netze

Petri Netze II

Neuronale Netze

Neuronale Netze

Bayes Netze

Geometrische Netze Verbinder- und Verknüpfungsregeln

Possibilistische Netze

Neuronale Netze (1)