640 likes | 949 Views
Soziale Simulationen. Künstliche Gesellschaften und individuelles Sozialverhalten. Matthias Schmitt. Was sind soziale Simulationen?. Sozialwissenschaft. Informatik. Soziale Simulationen & künstliche Gesellschaften. Ökonomie. Psychologie. Interessante Fragestellungen. Gesellschaften.
E N D
Soziale Simulationen Künstliche Gesellschaften und individuelles Sozialverhalten Matthias Schmitt
Was sind soziale Simulationen? Sozialwissenschaft Informatik Soziale Simulationen & künstliche Gesellschaften Ökonomie Psychologie
Interessante Fragestellungen Gesellschaften Computer Warum entsteht soziales Verhalten in Gruppen? Was ist die Voraussetzung dafür? Wie wirken bestehende Normen? soziale Simulationen Individuen Menschen Warum ist der einzelne sozial? Wie entsteht Kooperation?
Interessante Fragen II • Entstehung und Verbreitung von Normen, Allianzen, Kooperationen, Gruppenbildung und –dynamik • Kommunikation und Sprache, soziale Interaktion, Kultur • Institutionen und Politik, • Ökonomische Fragestellungen
Übersicht • Soziale Simulationen mit zellulären Automaten • Untersuchung von Normen unter diversen Aspekten • Soziales Lernen • Spielstrategien und –theorie • Emotionale Agenten
Soziale Simulationen und zelluläre Automaten • Segregation als makroskopischer Effekt bei mikroskopischer Veränderung • Migration, Kultur, Krieg, Handel • Entstehung und Wirkung von Normen
Die Schelling-Simulation • Primitiver zellulärer Automat • Fragestellung: Entstehung von Segregation in nicht-rassistischen Gesellschaften
Modell • Zwei antagonistische Typen von Agenten können sich bewegen • Eine Gefühlsregel implementiert eine lokal begrenzte Fitness-Funktion, die dem Agenten eine Präferenz für die nächste Bewegung eingibt.
Regeln • Ist ein Bürger unglücklich aufgrund seiner Nachbarn, so wandert er auf ein angrenzendes Feld mit besseren Bedingungen • Wie empfindlich ein Bürger auf die „falschen“ Nachbarn reagiert, kann als Parameter e gewählt werden • Die falschen Nachbarn können durch „gute“ wieder ausgeglichen werden; e ergibt sich also aus dem Verhältnis der Anzahlen auf den angrenzenden Feldern
Fragen • Wie hängt die Empfindlichkeit eines Bürgers von der Neigung des Systems zur Clusterbildung ab?
Ergebnisse • Das makroskopische Ergebnis (Segregation) ist in den überwiegenden Fällen unabhängig von der Empfindlichkeit der Bürger • obwohl Bürger auch durch „komplexe“ Musterbildung zufriedengestellt werden könnten, bilden sich grosse, simple Anhäufungen von gleichartigen Individuen • Dabei ist zu beobachten, dass beispielsweise bei einer Präferenz von 55% in den resultierenden Clustern eine Majorität von ca. 80% besteht (linearer 1D-Automat), wenn die Gruppen genau gleich stark sind. • Extrem primitiver Automat zeigt emergentes Verhalten, das auf reale Situationen bezogen werden kann (Bsp.: erste Einwanderer in Amerika)
Das Sugarscape-Modell • Vielfältig einsetzbarer zellulärer Automat • Simulation einer Population in einer künstlichen Umwelt, die durch Regelwerk repräsentiert wird • Primitive, regelbasierte Agentenreaktionen erzeugen komplexe Strukturen (Emergenz) • Fragestellungen: • Migration • Fortpflanzung • Kultur • Aggression • Eigentumsnorm • Handel • Krankheit
Modell • Agenten bewegen sich in einer Landschaft, die eine oder mehrere begrenzte, nachwachsende Ressource(n) bereitstellt • Agenten sind ausgezeichnet durch ihre Sichtweite und ihren Verdauungszyklus • Untereinander können sie Verhaltensregeln („Meme“) oder Ressourcen austauschen
Leben in Sugarscape • Landschaft: Torus von 50 x 50 Feldern (periodic boundary) mit Von-Neumann-Nachbarschaft • Verschiedenen Regionen mit unterschiedlicher Zuckermenge • Standardregel - G a (G für growth): in jeder Stelle regeneriert sich der Zucker mit einer Rate a pro Zeiteinheit bis zur maximalen lokalen Menge • Agenten sind am Anfang mit Zucker „ausgestattet“ • Zucker der nicht gegessen wurde, wird als Vermögen bezeichnet (bei Vermögen gibt es keine Begrenzung und wird von der Zeit nicht beeinflusst) • Wenn ein Agent kein Zucker mehr besitzt, stirbt er und wird von Sugarscape entfernt • Die Agenten haben ein endliches Dasein und ihnen ist ein Geschlecht zugewiesen • Tragfähigkeit: Die Umwelt kann nicht beliebig viele Agenten ernähren
Beispiel-Simulationszyklus Bewegungsregel (M) Fortpflanzungsregel (S) Kulturübertragungs- regel (K) • Kampfregeln (Ca) • Handelsregeln (T) • Jahreszeitenregeln (Se) • ... Wachstumsregel (G)
Grundlegende Regel-Beispiele (M) Schau dich soweit wie möglich um und finde die nächste leere Zelle mit max. Zucker. Gehe dorthin. Nimm allen Zucker. (S) Falls im fruchtbaren Alter und beide Partner genügend Zucker besitzen, wird ein Nachkomme erzeugt. Als Partner dienen alle Nachbarn, die den Bedingungen genügen. Erbschaftsregeln können (K) Im Gegensatz zur genetischen Ausprägung können die Kulturtags während der Lebensspanne des Agenten geändert werden: Für jeden Nachbarn wird zufällig ein Kulturtag ausgewählt und angeglichen. Man kann die Population in Völker einteilen, indem man bestimmte Übereinstimmungen in der Kultur zusammenfasst. Eltern vererben ihre kulturellen Traditionen; bei unterschiedlicher „Meinung“ entscheidet der Zufall. (G) Regenerationsregel, die den Zucker wachsen lässt. Im „Winter“ wächst der Zucker langsamer als im Sommer, die Jahreszeiten lassen sich auch lokal auf der Sugarscape-Welt einstellen, wodurch Migrationsverhalten erzeugt werden kann.
Exkurs: Meme (Dawkins) • „emanzipierte“ Informationseinheiten • Gedanke oder „Idee“, Verhalten, Kulturtechniken => „Kulturtags“ • Mutation während der Fortpflanzung möglich
Fragen • Wie wirken sich Beweglichkeit, Zuckerverteilung, verschiedene Metabolismen oder Jahreszeiten aus? (Migration) • Wie wirken sich verschiedene Kulturübertragungsregeln aus? (Kultur) • Wie wirken sich Handelsbeziehungen aus? (Handel) • Unter welchen Umweltbedingungen entsteht eine Eigentumsnorm? (Sozialverhalten)
Migration in Sugarscape • Agenten konzentrieren sich auf die Orte höchster Zuckerkonzentration • Durch Jahreszeiten kann ein Zugvogelverhalten oder ein „Winterschlaf“ erzeugt werden • Besonders günstig: natürlich niedriger Metabolismus und hoher Sichtradius
Kultur in Sugarscape • Führt man eine kulturelle Zugehörigkeit ein, so nehmen entweder langfristig alle die gleiche Kultur an, oder es entstehen „Stämme“ • Dieser Zustand ist dann ein Gleichgewichtszustand • Je länger der kulturelle Code ist, desto länger dauert es bis zum equilibrierten System
Handel auf Sugarscape • Es wird eine zweite Ressource eingefügt, z.B. Gewürz und jeder Agent erhält ein Bedürfnis (Metabolismusraten SZ und SG) nach dieser Ressource • Dieses Bedürfnis hat je nach seiner Wichtigkeit Auswirkung auf das Verhalten des Agenten: • Relative Wichtigkeit, G zu finden:
Handel auf Sugarscape II • Neue Bewegungsregel: schaue dich soweit wie möglich um und bestimme das Feld, das den meisten Profit verspricht. Gehe dorthin und sammle die entsprechende Ressource. • Ergebnis: Pendelbewegung zwischen den Bergen und Erschöpfungstod
Handel auf Sugarscape III • „... We can imagine consumers wandering around a large market square with all their possessions on their backs. They have chance meeting each other, and when two consumers meet, they examine what each has to offer to see if they can arrange a mutually agreeable trade...“(Kreps, 1990, zitiert nach Ernst) • Wann und mit wem werden die Agenten handeln? • Wie wird der Preis bestimmt? • Wie groß wird das Handelsvolumen sein?
Handelsregeln • Bedürfnis w: Mangel an Zucker: • Treffen zwei Agenten aufeinander, berechnen sie ihr w wahrheitsgemäß und die folgende Tabelle gibt Aufschluss über ihre Handelsverhalten (wA = wB => kein Handel): • Mit jedem Handel nähern sich beide w an; der Wohlstand steigt. • Handel wird auch stattfinden, wenn es beiden Akteuren an derselben Ressource mangelt; der Agent mit dem relativ geringeren Mangel wird durch Bestpreise belohnt
Preisbestimmung • Damit beide profitieren, muss der Preis im Intervall wA ... wB liegen. Um Zucker zu erhalten, ist A also nicht zu jeden Preis bereit; der max. Preis ist wA. Alle Preise in diesem Intervall wären akzeptabel, aber je näher der Preis an einem Ende liegt, desto unfairer der Handel. • Preis: • p > 1: p Einheiten G pro Einheit Z • p < 1: 1/p Einheiten Z pro Einheit G
Handel: Forschungsfragen • Entwicklung der Preise und des Handelsvolumens? • Individueller Profit und gesellschaftlicher Profit? • Was passiert bei Auflockerung der neoklassischen Annahmen von • ewigem Leben • konstanten Präferenzen und • vollständiger Information • Treten die Marktergebnisse der klassischen Theorie ein? • Stellt sich eine pareto-optimale Verteilung ein? • Erreichen Markt und Preis allg. Gleichgewicht?
Ergebnisse bei klassischen Agenten • Anfängliche Preisvarianz nimmt ab; der Preis konvergiert • Große Schwankungen im Handelsvolumen • Bevölkerungskapazität des Systems wird verbessert • Ein wirtschaftliches Gleichgewicht entsteht „from bottom up“ • Aber: das theoretische Handelsvolumen wird nie erreicht und das Gleichgewicht ist nur bzgl. der nächsten Nachbarn optimal.
Handel unter dem GesetzR(60,100) • Ein Agent hat keine konstanten Präferenzen mehr, scheidet nach einer festgelegten Zeit aus und wird durch einen randomisierten Akteur ersetzt • Folge: Entfernung von jeglichem Gleichgewicht • Weitere Variante: Hinzunahme von S und evolutionäre Änderung von Sichtweite und Metabolismus • Folge: wie in R(60,100)
Handel und Kultur • Änderung von Präferenzen durch den Kontakt mit anderen Akteuren – Durch jeden Kontakt mit einem anderen Akteure kann sich der Bedarf (=Stoffwechsel) an Z und G verschieben. Folge: Eine enorme Preisschwankung und eine konstant hohe Standardabweichung • Wohlstandsverteilung – Handel verschärft das Wohlstandsgefälle. Im Gegensatz zu einem allgemeinen Gleichgewicht resultiert dieses nicht allein aus den Unterschieden der ursprünglichen Ausstattung, sondern auch aus der lokalen Preisheterogenität • Veränderung des neoklassischen Modells zugunsten einer realitätsnäheren Simulation zeigen eine dramatische Entfernung der Lehrbuchmeinung über allgemeines Marktverhalten
Normemergenz auf Sugarscape • Einführung eines „Eigentums-Mems“, welches das Agentenverhalten beeinflusst. Ist es im kulturellen Code aktiv, so • Wird der Agent Felder, auf die er kommt, als sein Eigentum markieren • Keinen fremden Zucker aus anderweitig markierten Zellen nehmen • Optional (nicht in Originalarbeit): der Agent wird eine leichte Präferenz für eigene Felder haben • Der Nachwuchs erhält die Mem-Ausstattung der Eltern • Einführung eines „Sanktionierungs-Mems“, dass den Agenten dazu veranlasst, alle eventuellen Diebstähle (auch die bei fremdem Eigentum) innerhalb seiner Sichtweite unter Einsatz einer gewissen Zuckermenge seines eigenen Vorrats zu bestrafen.
Normemergenz auf Sugarscape II • Startbedingung: • Ohne Sanktionierungsmöglichkeit • 50% der Bevölkerung hat Eigentums-Mem • Mem-Übertragungswahrscheinlichkeit 1/11 • Ergebnis: die Populationen sterben aus, sobald das Mem verschwunden ist: Agenten ohne Mem sind zu arm, um sich zu paaren. • Populationen mit Mem am Start leben etwas länger als solche völlig ohne Mem
Normemergenz auf Sugarscape III • Startbedingung: • Sanktionierungsmöglichkeit • 50% der Bevölkerung hat Eigentums-Mem • Sanktionierung kostet den Strafenden • Ergebnis: das Eigentums-Mem hat weiterhin Schwierigkeiten, sich zu etablieren • Grund: es besteht ein Trittbrettfahrerproblem; das Sanktionierungsmem erweist sich als Nachteil und stirbt aus
Normemergenz auf Sugarscape IV • Startbedingung: • Kostenfreie Sanktionierungsmöglichkeit • 50% der Bevölkerung hat Eigentums-Mem • Ergebnis: das Eigentums-Mem bleibt erhalten und sorgt für ein dauerhaftes Überleben der Population auch bei hohen Verdauungsraten
Normemergenz auf Sugarscape V Ergebnisse: • Die Durchsetzung einer Norm erfordert „billige“ Sanktionierungsmöglichkeiten • Andernfalls besteht das Trittbrettfahrerproblem, dass Normemergenz verhindert. • Populationen ohne Eigentumsnorm sterben aus, wenn ihre Umweltbedingungen und ihre Metabolismen nicht optimal sind.
Normen: Entstehen und Wirkung • Zusammenfassung: • Normen können als emergentes Verhalten in Sugarscape simuliert werden. • Zellularautomaten sind mächtige Werkzeuge zur Untersuchung von Artificial Societies • Jetzt: • Normen als Regelsysteme • Andere Normerzeugungsmechanismen in verschiedenen Simulationssystemen und Modellen
Vorgegebene Normen • Castelfranchi et al.: Norm zur Aggressionskontrolle in einem zellulären Automat, dessen Agenten Stärke besitzen, die abhängig von ihrer Nahrungsaufnahme ist und die bestimmte Felder als Eigentum markieren können. • Die Nahrung erscheint zufällig auf den Feldern • Blind, Strategisch, oder Nonaggression als Agentenverhalten implementiert. Attacken kosten den Angreifer und den Verteidiger gleichermaßen Stärke. • Die Nahrungsaufnahme benötigt mehrere Taktzyklen, in dieser Zeit kann der essende Agent in den ersten beiden Fällen angegriffen werden; der Stärkere gewinnt, reisst dem schwachen das Futter weg und kann selbst den Essvorgang beginnen. • Nonaggression bedeutet, dass kein Angriff gegen einen Agenten erfolgen darf, der auf seinem eigenen Feld isst.
Vorgegebene Normen II Ergebnis: • Normen können Aggression beschränken • Normen haben einen positiven Effekt auf die durchschnittliche Stärke eines Agenten, mindestens genauso effektiv ist wie strategische Aggression • Bei strategischer Aggression erleiden die schwachen Agenten einen Nachteil, weil sie die Hauptlast der Aggressionskontrolle tragen (die Starken werden ja nie attackiert) • Normen haben Auswirkungen auf den Anteil des Agenten am gesamten Nahrungsvorkommen, weil sowohl vorteilhafte wie unvorteilhafte Attacken unterbunden werden und so die Kosten für die Aggressionskontrolle gleichmäßiger verteilt werden
Normentstehung in anderen Modellen Können egoistische Agenten Normen erlernen? • Antwort Flentge: „Ja, solange billige Sanktionsmöglichkeiten bestehen“ • Antwort Dawkin: „Ja, solange sie die gleichen Gene haben“ • Antwort Axelrod: „Ja, wenn die gleichen Agenten mehrfach aufeinander stossen“ • Antwort Ito: „Ja, wenn das Wissen über das Verhalten des Einzelnen jedem zugänglich ist“ • Antwort Dörner: „Ja, wenn sie ein emotionales Bedürfnis danach haben“
Normverbreitung in anderen Algorithmen • Die Durchsetzung einer Norm hängt in der Realität stark von der Interaktion zwischen den Spielern ab, die bisher vernachlässigt wurde. • Interaktion bzw. Kommunikation wird in drei Formen modelliert: • Zellularautomat • Netzwerk mit power-law Verhalten • Zufallsgraph mit poissonverteilten Verbindungen • Fragestellung: MDT, Einfluss der Lernalgorithmen, Einfluss der Konnektivität
Power-law-Netzwerk • Eine kleine Anzahl Agenten hat eine weit überdurchschnittliche Anzahl von Sozialkontakten • Ausgehend von einer kleinen Anzahl Kontakte werden in jedem Zeitschritt weitere Verbindungen geschaffen, wobei Andockstellen bevorzugt werden, die bereits von vielen Verbindungen angelaufen werden. • Normkodierung wie bisher (Bitmuster)
Zufallsgraph • Jeder Agent hat eine fixe Anzahl Verbindungen, die Verbindungen sind poissonverteilt. Bei kleiner mittlerer Verbindungszahl existieren isolierte Agenten. Bei beiden Modellen interagiert jeweils ein zufällig gewählter Akteur via einer seiner Verbindungen wie folgt: Imitation: mit einer gewissen Wahrscheinlichkeit wird das Gegenüber die Normcodierung übernehmen (oder umgekehrt), wobei die Wahrscheinlichkeit dafür von der Hamming-Distanz der Normen abhängen kann. Individuell: ein Agent kann mit einer gewissen Wahrscheinlicheit seine eigene Meinung bilden (zufällig).
Ergebnis • Ohne individuelles Lernen setzt sich in allen Interaktionsmodellen eine Norm durch • Individuelles Lernen fördert die Koexistenz zweier verschiedener Normen • Die MDT für den Zufallsgraphen ist im allgemeinen deutlich größer als für das PL-Netz (Spezialfall: durchschnittliche Konnektivität ist 1); Grund: Die Pfadlänge ist im PL-Netz kürzer. • Nähert sich die Konnektivität einem kritischen Bereich, so konvergieren Randomnet und Powernet gegen eine gemeinsame MDT. • Die MDT hat ein Minimum zwischen den Bereichen extrem weniger und extrem starker Interaktion.
Soziales Lernen • Biologische Evolution, individuelles Lernen und kulturelle Evolution sind Wege, das gleiche Problem zu lösen: Koordination zwischen Agenteninterner und der Umweltstruktur zu erreichen. Sie sind allerdings unterschiedlich schnell. • Gibt man einer Population die Möglichkeit der Umweltveränderung, so können auch komplexe Prozesse, die vom Individuum innerhalb seiner Lebensspanne nicht gelernt werden können, von der Gesellschaft adaptiert werden. • Kultur involviert die Fähigkeit, Repräsentationen der Umwelt zu erschaffen und so Informationen schneller und sicherer weiterzugeben. • Fragestellung: Erlernen einer Mondphasenvorhersage in einer Gesellschaft
Relation zwischen den Strukturen und ihre Möglichkeiten Umweltstruktur 1. Direktes Lernen durch Umweltbeobachtung 2. Erlernen einer Sprache, um die Relation zwischen Umwelt- und Kulturstruktur zu beschreiben Interne Struktur Kulturelle Struktur 3. Vermitteltes Lernen durch Betrachtung der kulturellen Struktur
Simulation: Agenten • Die Bewohner sind durch neuronale Netze repräsentiert, deren Input sowohl künstliche als auch natürliche Muster sein können • Ein Zyklus: jeder lernt so gut er kann (aus allen Bereichen: Umwelt und Kultur), erzeugt ein Artefakt, erzeugt einen Nachkommen und stirbt. Es findet keine „genetische“ Informationsübertragung statt. • Jeder Nachkomme bekommt ein randomisiertes Startnetz. • Welches Artefakt als Studienobjekt benutzt wird, kann parametrisiert werden (auf „Erfolgsbasis“ der letzten Generation oder per Zufall)
Simulation II: Umwelt • Die zu erlernende Regel ist ein simples XOR. Ein perfektes Artefakt sähe daher so aus: • Jede Ziffer kann mit reellen Zahlen von 0..1 belegt sein; die Tabellen sind prototypisch Symbolische Repräsentation (Agenten-Intern) Physikalische Repräsentation
Aufbau eines Agenten Mond-Beschreibungsnetz Tiden-Beschreibungsnetz Symbolisch Symbolisch Input des Artefakts, Tiden-Anteil Input des Artefakts, Mond-Anteil Aktuator Input durch Beobachtung, Mond-Anteil Erfahrung Input durch Erfahrung, Tiden-Anteil Erfahrung Artefakt
Der Lernprozess • Die Agentennetze werden in einem bestimmten Verhältnis von direkter und vermittelter Beobachtung trainiert. • Das Lernen von Artefakten wird bevorzugt, weil die natürliche Beobachtung sehr lange dauert.
Ergebnis • Der Lernprozess verläuft sehr langsam, falls keine Präferenz der Nachkommen für die Nutzung von Artefakten „kompetenter“ Eltern besteht • Mit einer solchen Vorliebe lernt die Gesellschaft in einer absehbaren Anzahl von Generationen, sehr gute Artefakte herzustellen und die durchschnittliche Kompetenz steigt stark an, obgleich die Lernfähigkeit nicht zugenommen hat. • Gesellschaften, die kulturelle Artefakte herstellen, profitieren von diesen und helfen bei der Anpassung an die Umwelt; die genetische Ausstattung ist nicht die einzige Quelle solcher Anpassungen.
Spieltheoretische Ansätze • Spiele eignen sich besonders, um bei Menschen (und Maschinen) Verhaltensweisen zu erkennen; sie erzeugen eine Abstraktion, die eine leichtere Mustererkennung möglich macht. • Entstehung und Stabilisierung von Kooperation am Beispiel des iterierten Gefangenendilemmas • Fragestellung: Welche Strategien sind in diesem Spiel besonders erfolgreich?