1 / 6

Programación Dinámica Estocástica

Programación Dinámica Estocástica. ICEF. Introducción. La programación dinámica estocástica difiere de la determinística en que los estados y los retornos o ganancias son probabilísticos. Un juego aleatorio.

preston
Download Presentation

Programación Dinámica Estocástica

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Programación Dinámica Estocástica ICEF Dra. Sandra Gutiérrez

  2. Introducción • La programación dinámica estocástica difiere de la determinística en que los estados y los retornos o ganancias son probabilísticos.

  3. Un juego aleatorio • Se hace girar una ruleta con marcas de n números consecutivos:1 a n, en su periferia. La probabilidad de que la rueda se detenga en el número i después de un giro es pi. Un jugador paga $x por el privilegio de hacer girar la rueda un máximo de m giros. La recompensa para el jugador es el doble de la cantidad obtenida en el último giro. Suponiendo que el juego se repite (hasta con m giros cada vez) una cantidad razonablemente grande de veces, se desea proponer una estrategia óptima para el jugador.

  4. El juego modelado como programación dinámica • Etapa i: giro i, i=1,…,m • Alternativas: hacer girar la rueda una vez más o terminar el juego • El estado j del sistema en la etapa i se representa con uno de los números 1 a n que se haya obtenido en el último giro.

  5. Ejemplo • Suponga que el perímetro de la rueda está marcado con los números 1 a 5. La probabilidad de detenerse en el número i es p1=0.3, p2=0.25, p3=0.2, p4=0.15 y p5=0.1. El jugador paga $5 para hacer un máximo de cuatro giros. Determine la estrategia óptima para cada uno de los cuatro giros, y el ingreso neto esperado correspondiente.

  6. Ejercicios • 1. Suponga que para el ejemplo realizado en clase, la ruleta está marcada con los números del 1 al 8,y que se detendrá en cualquiera de ellos con probabilidades iguales. Suponiendo que cada juego tiene un total de cinco giros, proponga una estrategia óptima para el juego. • 2. Se desea vender un auto al mejor postor. Al estudiar el mercado, se llega a la conclusión de que existe la posibilidad de recibir tres tipos de ofertas, con probabilidades iguales: baja en unos $1050, intermedia en unos $1900 y alta en unos $2500. Se decide anunciar la venta durante tres días consecutivos. Al final de cada día se decidirá si aceptar o no la mejor oferta que se haga. ¿Cuál es la estrategia óptima para aceptar una oferta?

More Related