120 likes | 1.1k Views
Programación Dinámica Estocástica. ICEF. Introducción. La programación dinámica estocástica difiere de la determinística en que los estados y los retornos o ganancias son probabilísticos. Un juego aleatorio.
E N D
Programación Dinámica Estocástica ICEF Dra. Sandra Gutiérrez
Introducción • La programación dinámica estocástica difiere de la determinística en que los estados y los retornos o ganancias son probabilísticos.
Un juego aleatorio • Se hace girar una ruleta con marcas de n números consecutivos:1 a n, en su periferia. La probabilidad de que la rueda se detenga en el número i después de un giro es pi. Un jugador paga $x por el privilegio de hacer girar la rueda un máximo de m giros. La recompensa para el jugador es el doble de la cantidad obtenida en el último giro. Suponiendo que el juego se repite (hasta con m giros cada vez) una cantidad razonablemente grande de veces, se desea proponer una estrategia óptima para el jugador.
El juego modelado como programación dinámica • Etapa i: giro i, i=1,…,m • Alternativas: hacer girar la rueda una vez más o terminar el juego • El estado j del sistema en la etapa i se representa con uno de los números 1 a n que se haya obtenido en el último giro.
Ejemplo • Suponga que el perímetro de la rueda está marcado con los números 1 a 5. La probabilidad de detenerse en el número i es p1=0.3, p2=0.25, p3=0.2, p4=0.15 y p5=0.1. El jugador paga $5 para hacer un máximo de cuatro giros. Determine la estrategia óptima para cada uno de los cuatro giros, y el ingreso neto esperado correspondiente.
Ejercicios • 1. Suponga que para el ejemplo realizado en clase, la ruleta está marcada con los números del 1 al 8,y que se detendrá en cualquiera de ellos con probabilidades iguales. Suponiendo que cada juego tiene un total de cinco giros, proponga una estrategia óptima para el juego. • 2. Se desea vender un auto al mejor postor. Al estudiar el mercado, se llega a la conclusión de que existe la posibilidad de recibir tres tipos de ofertas, con probabilidades iguales: baja en unos $1050, intermedia en unos $1900 y alta en unos $2500. Se decide anunciar la venta durante tres días consecutivos. Al final de cada día se decidirá si aceptar o no la mejor oferta que se haga. ¿Cuál es la estrategia óptima para aceptar una oferta?