470 likes | 681 Views
Computation Intelligence Seminar A Helmut GRABNER. Multiagent Systems. Einführung: Kommunikation Multiagent Systems: A Survey from a Machine Learning Perspective [Peter Stone, Manuela Veloso 2000]. Übersicht. Kurze Wiederholung Homogeneous Communication MA
E N D
Computation Intelligence Seminar A Helmut GRABNER Multiagent Systems Einführung: Kommunikation Multiagent Systems: A Survey from a Machine Learning Perspective [Peter Stone, Manuela Veloso 2000]
Übersicht • Kurze Wiederholung • Homogeneous Communication MA • Beispiel: Reaktives Multiagentensystem • Heterogeneous Communication MA • Interaktionen • Multiagent Q-Learning
Homogeneous Communicating Multiagent SystemsAllgemein • Agenten können direkt (!) miteinander kommunizieren • gleicher Aufbau, nur Input variiert
Homogeneous Communicating Multiagent SystemsBeispiel: Pursuit domain • [Stephen, Merx 1990] • Kommunikation um sicherzustellen, dass jeder an eine andere „Capture-Pos.“ fährt. (vgl. Homogeneous no communication.)
Homogeneous Communicating Multiagent SystemsAufgaben/Fragen • Aufgaben • Verteiltes erfassen von Informationen • Trafficopter • Fragen • Was, wann, wie und mit wem soll kommuniziert werden? • Sensorinformationen/Ziele
Homogeneous Communicating Multiagent SystemsReaktives Multiagentensystem Beispiel Communication in Reactive Multiagent Robotic Systems [Balch, Arkin 1994]
Beispiel: Reaktives MultiagentensystemInhalt • Kommunikationsmethoden • no communication • State communication • Goal communication • Aufgaben • Futtersuche (Forage – Task) • Abgrasen (Graze – Task) • Umgebung • 2D, Roboter, Hindernisse, Arttraktoren • Zusammenfassung
Beispiel: Reaktives Multiagentensystem - KommunikationsmethodeNo communication • Agent (Roboter) als Automat • keine direkte Kommunikation, Jeder Agent ist auf seine Wahrnehmung der Welt beschränkt • Unterscheidungen: andere Agenten (Roboter), Arttraktoren, Hindernisse
Beispiel: Reaktives Multiagentensystem - KommunikationsmethodeState Communication • Kein direktes Senden, andere können den Zustand aber abfragen • Agenten erkennen den Status eines anderen • Agent hat „Arbeit“ gefunden • Agent fährt zu demjenigen
Beispiel: Reaktives Multiagentensystem - KommunikationsmethodeGoal Communication • Explizite Kommunikation • Position des Arttraktors • Sender – Übertragung – Empfänger • Biologie: Honigbiene – Tanz • Roboter fährt direkt zum Arttraktor • eventuell kürzerer Weg
Beispiel: Reaktives Multiagentensystem - AufgabeForage-Task • Roboter sucht die Umgebung nach „Futter“ (Arttraktoren) ab und bringt diese „nach Hause“ • Hindernisse in der Umgebung • Die Masse eines Arttraktors bestimmt, wie schnell er transportiert werden kann. Mehrere Roboter gemeinsam können dies beschleunigen.
Beispiel: Reaktives Multiagentensystem – Aufgabe Forage-Task Kommunikationsmethoden • No communication • Automat • State und Goal communication • Realisiert mit 1 Bit: „Suchen“ oder „hinbewegen“ / „nach Hause“
Beispiel: Reaktives Multiagentensystem – Aufgabe Forage-Task Vergleiche 5145 Schritte 4470 Schritte 3495 Schritte
Beispiel: Reaktives Multiagentensystem – Aufgabe Forage-Task Vergleichsmaß • Roboter (1..5) x Arttraktoren (1..7) Steps (Zeitschritte) • Vergleich (Division) der beiden Messungen • (Speedup Vergleich) • Mittelwert
Beispiel: Reaktives Multiagentensystem – Aufgabe Forage-Task Auswertung
Beispiel: Reaktives Multiagentensystem – AufgabeGraze-Task • „Abgrasen“ der gesamten Umgebung • Hindernisse in der Umgebung
Beispiel: Reaktives Multiagentensystem – Aufgabe Graze-Task Kommunikationsmethoden • No communication • Automat • State und Goal communication • Realisiert mit 1 Bit: „Suchen“ oder „hinbewegen“ / „weiden“
Beispiel: Reaktives Multiagentensystem – Aufgabe Graze-TaskAuswertung • Kommunikation bringt fasst nichts • Wenn der Roboter „grast“ hinterlässt er unvermeidlich eine „Spur“ -> Diese Änderung der Umgebung kann als indirekte Kommunikation verstanden werden!
Beispiel: Reaktives MultiagentensystemZusammenfassung • Kommunikation bringt viel, bei Anwendungen mit wenig impliziter Kommunikation (Forage) • Kommunikation ist nicht notwendig, bei Anwendungen wo (viel) implizite Information vorhanden ist. • Komplexere Kommunikationsstrategien bringen relativ kleinen Gewinn
Heterogeneous Communicating Multiagent SystemsAllgemein • Verschieden auf jegliche Art • sehr komplex und leistungsstark (allgemeinster Fall) • Wohlwollend vs. Wettbewerb
Heterogeneous Communicating Multiagent SystemsBeispiel: Pursuit domain • Extremfall:Ein „intelligenter“ Agent steuert mehrere ausführende (single agent)
Heterogeneous Communicating Multiagent SystemsAufgaben/Fragen • Untereinander verstehen • Wohlwollend vs. Wettbewerb • Trainer • Verhandlungen • Temperaturkontrolle • Verpflichtungen • Ressource Management
Interaktion Wozu? • Möglichkeit zur Abstimmung von Aktionen • Alternative: vollständige wechselseitige Modellierung • bei homogenen: Modell der internen Zustände • bei heterogenen: Komplizierter - Ziel, Aktionen, Wissen der anderen Agenten sind möglicherweise nicht bekannt und müssen durch Beobachtung modelliert werden.
InteraktionZiele • Maximieren des Gesamtergebnisses • Sicherstellung des Bestehens und der Leistungsfähigkeit des Gesamtsystems • Arbeitsteilung (Bestimmung gemeinsamer Ziele/Aufgaben) • Vermeidung von Redundanzen • Abhängigkeiten der Aktionen der einzelnen Agenten (Reihenfolge) • Behandlung von Interferenzen und Konflikten („widersprüchliche“ Ziele) • Vermeidung unnötiger Konflikte • Kombination unterschiedlichen Wissens • Erfüllungen von Nebenbedingungen (z.B. begrenzte Ressourcen)
Interaktion Wie? • Speech acts • Kommunizieren mittels Aktionen • Kommunikation „extra - Environment“ ?
Interaktion Begriffe Interaktion: Wechselbeziehung, bes. die Kommunikation zw. Individuen innerhalb einer Gruppe. Kommunikation: Prozess der Mitteilung; der wechselseitige Austausch von Gedanken, Meinungen, Wissen, Erfahrungen und Gefühlen sowie die Übertragung von Nachrichten und Informationen Koordination: Abstimmen verschiedener Vorgänge Kooperation: Zusammenarbeit Konkurrenz: Wettbewerb
Interaktion Agenteninteraktion • Kommunikation (communication) • Verständigung mehrerer Agenten untereinander • Koordination (coordination) • jene Kommunikation welche zur aufgabenbezogenen Tätigkeit notwendig ist • Kooperation (cooperation) • jene Kommunikation welche zur Koordination und Vereinbarung gemeinsamer Ziele notwenig ist • Verhandlung (negotiation) • jene Kommunikation für die Aushandlung der Kompromisse
Interaktion Kommunikationstypen • keine Kommunikation • indirekte Kommunikation • Austausch von Information über einen gemeinsamen Informationsraum (Umwelt) • einfache Kommunikation • individueller Austausch von einfachen Nachrichten bzw. Ereignissen • Kommunikation basierend auf Konversation • Austausch von strukturierten Nachrichten • Konversationstheorie: Äußerungen werden mit Handlung gleichgesetzt (Sprechen ist eine Art Aktion) und wie sie die Zukunft verändern (Ich verurteile Sie zu...)
Interaktion Agentenkommunikation • Voraussetzungen für erfolgreiche Kommunikation (heterogene Agenten) • Gemeinsame Ontologie • Gemeinsame Begriffsmenge (Vokabular) • Gemeinsame Semantik für diese Begriffe • Gemeinsame Kommunikationssprache in Syntax und Semantik • Technische Voraussetzungen (Übertragungskanäle,..)
Interaktion Knowledge Interchange Format (KIF) • Zwischensprache zur Übersetzung einer Wissensbasis von einer Repräsentation zu einer anderen. • Muss mächtig genug sein, um alle in der Sprache formierten Wissensinhalte zu transportieren • Deklarative Semantik • Bedeutung von Ausdrücken mittels Interpretation über Modelle (logisch verwertbar) • (Common Lisp ähnlich)
Interaktion Knowledge Query and Manipulation Language (KQML) • spezifiziert ein Nachrichtenformat zum Austausch von Informationen • Nachricht wird in eine Struktur gebracht, die von jedem Agenten verstanden wird. Die Nachricht selbst jedoch muss nicht unbedingt verstanden werden. • 3 Ebenen • Inhaltsebene • aktueller Nachrichteninhalt (z.B.: in KIF) • Nachrichtenebene • spezifiziert den Nachrichtentyp/Nachrichtenparameter (Fragen, Mitteilen, „tu was“, Benachrichtigen,...) • Kommunikationsebene • Sender/Empfänger
Interaktion Simple Knowledge Transfer Protocol (SKTP) • Inhaltsebene(content Layer)Inhalt der Nachricht. Das in „Wörtern“ ausgedrückte „Wissen“ • Nachrichteneben(message Layer)Nachrichtentyp, Thema der Nachricht • Kommunikationsebene(communication Layer)Daten aus der KQML Nachricht für die Datenübertragung (Adressen)
Interaktion Beispiel: KQML Nachrichtenebene Kommunikationsebene Inhaltseben (ask-one: sender helmut: receiver boerse_server : replay-with euro_kurs: content (WERT EURO_DOLLAR ?wert): language Prolog: ontology Boerse) (tell: sender boerse_server: receiver helmut: in-replay-to euro_kurs: content (WERT EURO_DOLLAR 1.0029): language Prolog: ontology Boerse) Nachrichtentypen: Anfragen: ask-one, ask-all,... Antworten: replay, sorry,... Informationsverm.: tell,... Funktionsangebot: advertiese,... Zustand: ready, standby,...
Interaktion Koordination von Agenten • Welcher Agent soll was machen –Verteilte Künstliche Intelligenz • Kooperation • Notwendig? Selbstsüchtig • Delegieren von Aufgaben (hierarchische Strukturen) • Konkurrenz • Marktmechanismus • Gegenseitige Kooperation (Abmachungen) • Manager - mehrere Anbieter • keine zentrale Kontrolle • jeder Partner evaluiert Information aus seinem Standpunkt
Interaktion Koordinationsvarianten • direkter Nachrichtenaustausch (point to point) • message parsing • Klassisch: Verbindungsarten (Client/Server), Protokolle, Synchronisation,... • Blackboard (broadcast) • Verwendung von gemeinsamen Datenstrukturen (shared memory) • Agent entscheidet wann und was er bekannt gibt und ob er wann und welche Informationen sucht und diese bewertet • Synchron und Asynchron • Meeting
Multiagent Q-Learning Beispiel für die Komplexität, ohne Theorie Multiagent Q-Learning [Hu, Wellmann 2002]
Multiagent Q-Learning Multiagent Q-Learning • Was soll in dem aktuellen Zustand gemacht werden? • Join Action Values • Ein Agent muss n Q-Tables (eine für ihn und je eine für die anderen Agenten - Modellierung) erstellen
Multiagent Q-Learning Beispiel • Agent 1 und Agent 2 jeweils in die diagonale Ecke • Gewinner: der als erster angekommen ist (oder beide zugleich – Ziel) • kein Zusammenstoß
Beispiel: Multiagent Q-Learning States,... • States: 9 x 9 • Anfangszustand (0, 2) • Aktionen: 4 • Q Table: 81 x 4 = 324
Beispiel: Multiagent Q-Learning Ergebnis • Spieltheorie • Nash Gleichgewicht • Wie kann Kooperation aus Handlungen von Egoisten entstehen? • Bimatrix-game (Gefangenen Dilemma)
Multiagent Q-Learning Komplexität • m = Anzahl der Zustände • n = Anzahl der Agenten • A = möglichen Aktionen • Ein Agent muss n Q – Functions lernen!