Von Neumann, Nash, Mentes Brillantes y la Teoría de Juegos Guillermo Durán

Von Neumann, Nash, Mentes Brillantes y la Teoría de Juegos Guillermo Durán Departamento de Computación Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires

Imaginemos el siguiente juego (macabro, por cierto): Dos personas, que llamaremos A y B, son colocadas en habitaciones separadas con un botón próximo a cada una. Saben que ambos serán matados a menos que uno apriete su respectivo botón en la próxima hora. La primer persona que apriete el botón salvará a la otra, pero se condenará a su propia muerte. Asumiremos que A y B se aman mutuamente. ¿Qué estrategia tendrá cada uno?

B Salvar a A Salvar a B Salvar a A (1,1) (1,2) A Salvar a B (2,1) (2,2) Claramente, ambos deben hacer una evaluación de quien debe salvarse y obrar en consecuencia. Representemos las estrategias posibles en una matriz:

El caso sencillo es cuando los dos llegan a la misma conclusión: A debe salvarse y B sacrificarse, o viceversa. Serían los casos (1,1) y (2,2) de la matriz. En el primero A espera que B toque el botón, y ambos están de acuerdo. En el segundo, B espera que A toque el botón, y listo.

Los casos de conflicto son los otros dos, y en cierta medida son similares entre sí. El de (2,1) lo podríamos llamar el de “amor profundo”. Ambos quieren salvar al otro. En este caso se desataría una carrera por llegar primero al botón para cumplir con el deseo. El de (1,2) lo podríamos llamar el de “amor, pero no tanto”. Ambos esperan el sacrificio del otro. En este caso, van a esperar hasta el último segundo para apretar el botón (una especie de carrera para llegar último al botón).

El dilema nuclear: un “juego” un poco más real En Agosto de 1949 la Unión Soviética explotó su primer bomba atómica en Siberia, demostrando que ya poseía la tecnología necesaria. Mucho antes de lo que los americanos (y sus aliados) habían esperado ya había dos poderes atómicos. El mundo estaba ante una situación similar a la que mostramos en el juego anterior.

URSS Apretar No Apretar Apretar (1,1) (1,2) USA No Apretar (2,1) (2,2) Estados Unidos y la Unión Soviética tenían dos opciones: apretar el “botón nuclear” y hacer desaparecer a su enemigo de la faz de la tierra o mantener su poderío nuclear como una amenaza latente.

El caso (1,1) de la matriz ahora no es posible, por motivos obvios. Los casos simétricos (1,2) y (2,1) permitían terminar definitivamente con el enemigo, pero pagando el costo mundial del uso de la bomba. El caso (2,2) aparecía como una suerte de “equilibrio” donde los dos mantenían la amenaza latente (y de hecho fue lo que pasó en la práctica).

Para 1950, importantes sectores de USA y sus aliados europeos creían que Estados Unidos debía contemplar seriamente la idea de un ataque nuclear sobre la entonces URSS. Lo llamaban “la guerra preventiva”. Contra lo que uno podría suponer, “la guerra preventiva” estaba defendida por algunos de los principales intelectuales americanos, entre ellos dos de los más famosos matemáticos del momento: Bertrand Russell y John von Neumann.

John von Neumann (1903-1957) fue el creador de la teoría de juegos. Desde la década del ’20 estuvo trabajando en la estructura matemática del poker y otros juegos, pero enseguida vio que sus teoremas podían ser aplicados a economía, política, relaciones internacionales, etc. JVN demostró matemáticamente que siempre hay un curso racional de acción para juegos de dos jugadores, con intereses completamente opuestos (uno gana y el otro pierde). Esta prueba es conocida como el Teorema Minimax.

La clase de juegos cubiertos por este Teorema incluye un montón de juegos recreativos, desde el ta-te-ti hasta el ajedrez. JVN probó que siempre hay una forma optimal de jugar a dichos juegos. La primer referencia bibliográfica que aparece sobre estos temas es un artículo de von Neumann de 1928, ampliado años después en el libro “Theory of Games and Economic Behavior”, de von Neumann y Morgenstern, publicado en 1944.

¿Qué es la Teoría de Juegos? Es la teoría matemática que modela situaciones de conflicto. Una situación de conflicto (un juego) es una situación en la cual individuos (jugadores) interactúan y obtienen resultados que dependen de tal interacción. Cada jugador tiene control parcial de la situación. Cada jugador tiene ciertas preferencias sobre los resultados posibles y se asume que estas preferencias son descriptas por una función numérica (función de utilidad). Cada jugador trata de llevar a cabo las estrategias que resulten más favorables a sus intereses, o sea, trata de maximizar su función de utilidad.

Tradicionalmente la TdJ clásica se ha dividido en dos ramas: Teoría Cooperativa y No Cooperativa. La TdJ No Cooperativa asume que no hay lugar para comunicación, correlación o acuerdos entre los jugadores, de no ser los explícitamente estipulados por las reglas del juego. Es de interés el describir recomendaciones para los jugadores tales que ninguno tenga incentivos para unilateralmente desviarse (si los demás siguen las recomendaciones, y yo me muevo, pierdo). Esta idea corresponde al concepto de Equilibrio de Nash. Es el concepto más importante en Teoría No Cooperativa y su estudio formal (John Nash, 1950) marcó un hito en el tema, que le terminó dando a Nash el premio Nobel de Economía en 1994 por su “análisis pionero del equilibrio en la teoría de los juegos no cooperativos”.

El Dilema del Prisionero Es el problema “madre” en Teoría de Juegos y tiene “infinitas” formulaciones diferentes. Veamos una de ellas: son detenidos dos hombres acusados de cometer un crimen y son encarcelados en celdas diferentes. El juez tiene ciertos indicios sobre la culpabilidad de ambos, pero decide hacer un interrogatorio planteándoles el siguiente dilema:

Si ambos se declaran inocentes, serán condenados a 3 años de prisión cada uno. • Si ambos acusan al otro, serán condenados a 10 años de prisión cada uno. • Si uno se declara inocente y es acusado por su compañero, será condenado a 20 años de prisión, mientras al otro le corresponde sólo 1. • Llamaremos C a la estrategia “cooperativa” (declararse inocente) y D a la estrategia “defraudativa” (acusar al otro).

C D C D (3,3) (20,1) (1,20) (10,10) La matriz de pagos queda entonces de la siguiente manera: Una interpretación más interesante de situaciones que presentan las características del Dilema del Prisionero se presenta cuando dos empresas compiten en la venta de un mismo producto y tienen que fijar el precio del mismo. Pueden definir una estrategia de competición con la otra empresa y fijar un precio bajo (estrategia D), o elegir una estrategia de cooperación y fijar un precio alto (estrategia C). Es inmediato verificar que el único equilibrio de Nash de este juego es (D,D) .

Sin embargo, a simple vista resulta muy atractivo el resultado que surge de usar las estrategias (C,C) y naturalmente uno se preguntará si en alguna otra versión del modelo esta estrategia goza de una estabilidad apropiada. Un camino que da respuesta satisfactoria a este hecho surge de considerar un modelo donde el juego en cuestión se repite.

D C C C C D D D D C Ejemplos de estrategias en juegos repetidos: Estrategia Gatillo: Estrategia C-tft: Observación: estas estrategias asumen que los juegos son infinitos. La asunción de finitud modifica en parte las estrategias (excepto que el juego se repita una cantidad finita de veces, pero el número final sea desconocido).

¿Freno o no freno? En la vida cotidiana nos topamos con este tipo de decisiones todos los días. Supongamos que llegamos a una esquina en simultáneo con otro auto. Para darle un sentido económico al ejemplo, supongamos tambien que Lavagna abrió el corralito en forma muy restringida y que cada sucursal va a devolverle la plata al primero que llegue, y que justamente quien maneja el otro auto que llegó a la esquina conmigo tiene su plazo fijo en la misma sucursal que yo (y que además somos los dos que estamos por llegar primero).

(5,5) (0,10) (10,0) (-2,-2) La matriz de pagos podría ser la siguiente: ¿Cuáles son los equilibrios de Nash de este juego?

(2,4) (4,2) (1,1) (3,3) La Teoría de Movidas (TOM) (Theory of Moves, Steven Brams, 1994) Asume juegos estrictamente ordinales. Supongamos que tenemos dos actores (el jugador fila F y el jugador columna C) cada uno con dos posibles decisiones. Cada jugador ranquea los 4 estados del juego de 1 a 4 (1 es el peor estado, 4 es el mejor). Por ejemplo: C1 C2 F1 F2

Estos resultados son sólo ordinales, indican sólo un ordenamiento de los resultados de mejor a peor. No da ninguna graduación sobre cuanto la prefiere un jugador a un resultado sobre los otros. Sólo indica las preferencias de los jugadores. Primera diferencia entre la TOM y la TJC es que para la TJC importan las utilidades mientras que para la TOM no son relevantes.

Otra diferencia es que en la TJC los movimientos son en simultáneo, o al menos se realizan sin conocer el movimiento del otro jugador. En la TOM vamos a suponer que se mueve en forma alternada partiendo de un estado inicial y llegando a un estado final. Aparecen nuevos conceptos de equilibrios y estrategias que me llevan a mover o detenerme en un estado determinado. Veamos aplicaciones de la TOM a ejemplos que nos van a resultar cotidianos y cercanos.

La renuncia de Chacho Alvarez a la vicepresidencia Corría octubre del 2000 y se empezaba a resquebrajar la Alianza que había ganado las elecciones unos pocos meses antes. El vicepresidente de la Nación (y líder de uno de los partidos de la Alianza) había denunciado coimas en el Senado en la aprobación de la ley de reforma laboral. El presidente de la Nación (y uno de los líderes del otro partido de la Alianza) se debatía entre investigar a fondo las denuncias apoyando a su vicepresidente (y fortaleciendo la Alianza) o no hacer nada, dejando pedalear en el aire a Chacho. Chacho Alvarez se debatía entre renunciar o no renunciar.

I NI (3,1) (2,3) R NR (4,2) (1,4) ¿Cómo repesentamos este juego en términos de la TOM? 1) La realidad (desde mi óptica) ¿Cuál es el estado inicial? ¿Cuál es el estado final?

I NI (3,1) (2,2) R NR (4,3) (1,4) 2) De la Rua estadista (obviamente ficticio !) ¿Cuál es el estado inicial? ¿Cuál es el estado final?

El asalto • Supongamos que soy asaltado por una persona armada. • Definamos mi objetivo y el del ladrón en términos de prioridades: • Los míos: • 1)No salir herido. • 2)Que no me roben. • 3)Atraer la atención de la gente. • El del ladrón (inteligente): • 1)Robarme todo lo que tenga. • 2)No llamar la atención. • 3)Evitar el uso de la fuerza (si lo llegan a agarrar la pena es mucho peor)

V NV (2,2) (4,1) R NR (1,3) (3,4) ¿Cómo repesentamos este juego en términos de la TOM? ¿Cuál es el estado inicial? ¿Cuál es el estado final?

Juegos Cooperativos Supongamos que tenemos 100 presos y se les plantea el siguiente problema. Se los coloca en una fila, cada uno con un gorro negro o blanco. El último de la fila ve todos los gorros, excepto el suyo. El anteúltimo de la fila ve todos los gorros, excepto el suyo y el del último. Y asi siguiendo... Cada preso para ser liberado debe acertar el color de su gorro, empieza a arriesgar el último, luego el anteúltimo, etc. Todos escuchan lo que dicen todos.Lo único que tienen permitido es arriesgar el color de su gorro, absolutamente ninguna cosa más.

¿Cuál será la estrategia conjunta para salvar a la mayor cantidad de presos? Una estrategia para salvar al menos al 50 %: Consiste en que cada preso de orden par dice el color del gorro del que tiene adelante. Así, garantizamos salvar a todos los de orden impar, ya que la estrategia es conocida por todos de antemano. Una estrategia para salvar seguro a todos menos al último de la fila (el primero que arriesga): El preso de orden 100 dice “blanco” si la cantidad de blancos que tiene adelante es impar, y “negro” en caso contrario. De ahí en adelante todos pueden deducir que gorro tienen contando la paridad de blancos y negros de los que tienen adelante.

Von Neumann, Nash, Mentes Brillantes y la Teoría de Juegos Guillermo Durán

Von Neumann, Nash, Mentes Brillantes y la Teoría de Juegos Guillermo Durán

Presentation Transcript

Game Theory

dynamic games with complete information

COCAÍNA Y MARIHUANA

MPD 575 Design for Testability

Universidad Federico Villarreal Colegio de Contadores Públicos de Puno

ADMINISTRACION GENERAL Profesores: Karina Sandoval H. Guillermo Godoy I.

BIOINSTRUMENTACION CARDIOVASCULAR

Mississippi 4-H Forestry

Teoría de Juegos

Simulación de juegos de azar

Device Management

JAMES GUILLERMO MINA BALLETEROS Alcalde Municipal 2012 – 2015

The Spiral of Silence

El averiguaedades

2.1 Instruction Set Architecture

presenta

TEORÍA DE LOS JUEGOS

INDICE

Rechtliche Aspekte statistischer Methoden im Gesundheitsbereich

Juegos Olímpicos

Computer Hardware and System Software Concepts

Session 2: