Cap 4 Búsqueda Heurística

Cap 4 Búsqueda Heurística Inteligencia Artificial 1 Parte II

Marvin Minsky (AI Magazine - 1991) • En pequeños dominios, podemos intentar aplicar todos nuestros métodos de mindless search...pero no es práctico porque la búsqueda se vuelve enorme...(CAP 3) • Para reducir la extensión de la búsqueda desinformada debemos incorporarle tipos adicionales de conocimiento lo que, bajo determinadas condiciones, facilita la tarea de resolución de problemas (CAP 4)

Repaso • Russell y Norvig han definido con elegancia un algoritmo general para resolver problemas de búsqueda. Este algoritmo puede ser usado para expresar diferentes estrategias específicas de búsquedas. • Un problema se representa como una estructura con componentes: • ESTADO • NODO PADRE • OPERADOR • PROFUNDIDAD • COSTO DE RUTA.

Conceptos Generales • Una estrategia se define como una forma de darle un orden de prioridades a la expansión de nodos. • Hacer uso de la información con respecto al espacio de estados • una FUNCION DE EVALUACION que describa la deseabilidad de expandir un nodo • usar conocimiento específico del problema • encontrar soluciones con mayor eficiencia

Temas importantes • Búsqueda Primero el Mejor • Búsqueda A* (A estrella) • Heurística • Escalada (Ascenso a la Cima) • Forjado Simulado

4.1 • 4.1 • Búsqueda primero el mejor

Algoritmos de búsqueda informada(Búsqueda inteligente) • Búsqueda Heurística • Estrategias de Búsqueda Avara • A*

Búsqueda Heurística • Usar información “heuristica” para adivinar qué nodo expandir • la heurística aparece bajo la forma de una función de evaluación basada en la información específica para el dominio o contexto relacionada con el problema • el problema de búsqueda se puede considerar como la maximización o minimización de una función, como es del todo general. • La función de evaluación nos proporciona una manera de evaluar un nodo “localmente” basado en una estimación del costo de llegar desde el nodo al nodo meta. • Problemas con la Heurística • la heurística suele ser poco certera - problema abierto • valor de la actividad a un meta-nivel - problema abierto • puede no encontrar la mejor respuesta - superado por algoritmo A*

4.1 Búsqueda Primero lo Mejor La IDEA ===> usar una función de evaluación para cada nodo - estimar la deseabilidad ==> EXPANDIR EL NODO MÁS DESEABLE ENTRE LOS NO EXPANDIDOS IMPLEMENTACION ===> FUNCIÓN_EMBRETAR_COLA = QUEUINGFN = insertar sucesores en orden decreciente de idoneidad, quedando en el tope el mejor CASOS ESPECIALES Búsqueda avara A*

Búsqueda Primero lo Mejor • Ordenar los nodos de tal forma que el nodo de mejor evaluación sea el primero en ser expandido • la función de evaluación no es omnisciente - provee una medida estimada de la deseabilidad de usar cierta ruta hacia el estado meta • la medida debe incorporar cierto estimado de costo de la ruta desde un estado hacia el estado meta más cercano a él.

BPM - Búsqueda primero lo mejor • Idea básica  expandir el nodo que maximiza o minimiza la función de evaluación f(n) • Estrategia Avara: f(n) = h(n), donde h(n) estima el costo de llegar desde el nodo n hacia la meta • ¿Qué sucede si a cada paso tratamos de acercarnos al nodo meta? En este caso el método seguirá la ruta más larga, al empezar a moverse hacia delante según la receta Escalada tiene este mismo defecto

BPM • Objetivo de la familia de búsquedas llamada Búsqueda Primero lo Mejor  encontrar velozmente la meta • expandimos el nodo más cercano al nodo meta • para merecer optimalidad, queremos encontrar rapidamente la meta más “chata” (esto es, más cercana al origen) • el objetivo es distinto al de la búsqueda de costo uniforme - vista previamente (la única búsqueda ciega interesada en costos) - que no está dirigida a la meta sino hacia emplear el costo de ruta, ya recorrida, g, para decidir qué nodo expandir  en costo uniforme la lista se ordena para obtener la solución más barata en base a datos experimentados.

Búsqueda Avara • La función de evaluación muestra la siguiente heurística: h(n) = costo estimado entre n y la meta • por ejemplo • hDLR(n) = distancia en línea recta desde n hasta Bucarest  La búsqueda avara expande el nodo que pareciera estar más cerca de la meta.

Búsqueda Avara • Una de las búsquedas Primero lo Mejor más sencillas - MIN costo estimado para llegar a la meta (2º sumando de f = g + h  f = h) • ese costo se puede estimar pero no determinar con exactitud; la buena heurística ayuda. • la función heurísticah es una función que calcula dichos estimados de costo • h(n) = costo estimado de la ruta más barata desde el estado en n hasta el estado meta.

Búsqueda Avara • El nodo con valor h mínimo es el que se va a expandir: cola con privilegios • hpuede ser cualquier función, siempre que valga cero en la meta, pero la calidad cambia mucho • las funciones heurísticas son problema -intensivas (son problema - específicas) • en problemas de búsqueda de ruta una buenah es hDLR , donde DLR es distancia en línea recta • una ruta de A a B suele ir en la dirección correcta

Búsqueda Avara • Adoptar la primera selección con una visión inmediata, sin preocuparse si ha de ser la mejor con una perspectiva a largas vistas. • La búsqueda halla soluciones en forma rápida, que no siempre son las óptimas • susceptible a falsas largadas o pasos en falso (Iasi  Fagaras) que va hacia Neamt, ruta muerta sin salida • hay que cuidarse de los estados repetidos • oscilaciones entre Neamt y Iasi

Búsqueda Avara • Parecida a BPP, prefiriendo seguir una ruta singular hacia la meta, aunque recula (backtracking o reversiva) al chocar con una ruta muerta • sufre del mismo defecto  ni es óptima, ni es completa (con una ruta posiblemente infinita) • su complejidad temporal en el peor de los casos es O(b^m), siendo m la profundidad máxima del espacio de búsqueda • complejidad espacial igual a la temporal (guarda todos los nodos en memoria) • una buenahreduce fuertemente la complejidad

AVARA- Minimizar el Costo Estimado • Función de evaluación heurística: • h(n) = costo estimado de la ruta entre el nodo n al nodo meta • h(n) = 0, si n es el nodo meta • tabla de distancias lineales a Bucarest =>

Ejemplo de Búsqueda Avara • En el mapa ya visto anotamos Arad==>Bucarest = 366 km • h(n) = distancia en línea recta • - Zerind 374 • -Sibiu 253 <== • -Timisoara 329

Ejemplo de Búsqueda Avara • Arad - 366 • Oradea - 380  Fagaras .. 178 • Rimnicu Vicea - 193

Ejemplo de Búsqueda Avara • Sibiiu 253 • Bucarest 0 <====

AVARA- Minimizar el Costo Estimado h(n) = 366 Arad Zerind Sibiu h(n) = 253 h(n) = 329 Timisoara h(n) = 374 193 178 366 380 Fagaras Oradea Rimnicu Arad 253 h(n) = 0 Sibiu Bucharest verdadera ruta óptima es: Arad  Sibiu  Rimnicu  Pitesti  Bucharest

Propiedades de la búsqueda avara • Completa? • No - puede colgarse en algún bucle • p.ej., Iasi  Neamt  Iasi  Neamt  … • Pasa a ser completa en espacio finito si se sujeta a una verificación de estado repetido • Complejidad Temporal: • En el peor caso: O(bm) • pero una buena heurística provoca mejoras dramáticas • Complejidad Espacial: • En el peor caso: O(bm) • mantiene todos los nodos en memoria • Optima? • No

Minimizar el costo de ruta total • La búsqueda avara minimiza el costo estimado hasta la meta h(n) • poda fuertemente el costo de búsqueda • ni óptima ni completa • la búsqueda de costo uniforme minimiza el costo hasta ese momento, g(n) • óptima y completa • podría ser muy ineficiente • f(n) = g(n) + h(n)= costo estimado de la solución más barata pasando por (n)

Minimizar el costo de ruta total • Observaciones • Supongamos que tenemos un nodo n a una profundidad d en el árbol de búsqueda y que adivinamos que ese nodo se halla a una distancia h(n) de la meta más cercana a él. • La meta estaría entonces a la profundidad d + h(n) en el espacio de problema • En lugar de elegir para la expansión el nodo de mínimo h(n) (distancia esperada hacia la meta), elegimos el nodo de MIN d + h(n) • La profundidad se mide con la función de costo de la ruta g(n) • Queda MIN g(n) + h(n)

Búsqueda A* • Idea no expandir trayectos que ya se sabe que son caros • Función de evaluación • f(n) = g(n) + h(n) • g(n) = costo hasta llegar a n • h(n) = costo estimado hasta la meta desde n • f(n) = costo total de ruta pasando por n hasta la meta • A* usa una heurística admisible - no hay sobreestimación de distancia • Teorema - A* es óptimo • Aproximación  léase h como “heurístico”, pues es funcíón fuerte de la heurística elegida

Optimalidad de A* • Definir f* - el costo de la solución óptima para la ruta • A* expande todos los nodos con f(n)<f* • A* podría expandir algunos de los nodos a la derecha del “contorno de la meta”, para los cuales f(n) = f*, antes de seleccionar el estado meta. • La primera solución encontrada debe ser la óptima, dado que los nodos de todos los contornos subsiguientes tendrán un costo f más alto y con ello un costo g más alto (todos los estados meta tienen h(n) = 0)

Forma útil de ver la optimalidad de A* • Lema  A* expande nodos en el orden de valores crecientes de f • Esto implica decir que así como Primero en Amplitud va agregando niveles o capas, A* va agregando contornos “iso-f”, siempre crecientes, todos incluyendo el nodo de inicio y a medida que se acercan a la meta, empiezan a incluir justo la meta y la superan. El contorno “iso-f” llamado i tiene todos los nodos con f=fi.

A* - resumen gráfico • Ver figuras con círculos concéntricos deformados, ya no con CONTORNOS equirradiales • 

“Contornos” concéntricos

“Contornos” concéntricos 380

* ------------------------ ------------------------ * n * G1 *G2 Sea una meta subóptima G2 que está en la cola de espera Sea n un nodo sin expandir en el camino más corto hacia una meta óptima G1 A* nunca va a elegir G2 para su expansión Prueba estandar de la optimalidad de A*

Optimalidad de A* Teorema: Sea h*(n) el costo real desde n hasta la meta. Si h(n) < h*(n) para todo nodo n, entonces A* siempre va a encontrar un nodo meta óptimo. Prueba: Sea s el nodo meta de mínimo costo. Sea (tentativamente) que A* seleccione un nodo meta subóptimo s’, donde g(s)<g(s’)…ec.a Sea n un nodo sin expandir en la ruta desde el nodo inicio y el nodo meta óptimo s. Notar que ese nodo sin expandir necesariamente existe, de acuerdo con la suposición previa (en el otro caso, s ya habría sido elegido como el nodo meta).  => .

Optimalidad de A* Puesto que n no ha sido elegido para su expansión en su ruta hacia s’, se sigue que: f(n) = g(n) + h(n) ³f(s') = g(s') + h(s') = g(s') Dado que h es admisible, g(n) + h*(n) ³ g(n) + h(n) = f(n), y entonces g(n) + h*(n) ³f(s') = g(s') lo cual implica que g(s) ³g(s')  Esto contradice la suposición previa (ec. a), la que indica que s’ es una meta subóptima..

A* • Una heurística admisible nunca sobreestima el costo de llegar a la meta • un estimado de costo optimista en la solución de un problema es menor -más barato- que el real. • Si h es admisible, f(n) nunca sobreestima el costo real de la mejor solución pasando por n • La búsqueda A* - con f(n) y con h admisible • completa y óptima • hDLR es admisible

Conducta de la búsqueda A* • A lo largo de cualquier ruta a partir del inicio, el costo de f nunca decae - esto es casi la regla general de las heurísticas admisibles • una heurística que cumple con esa regla se dice que exhibe MONOTONICIDAD • heurística no-monotónica, caso raro • f(n) = g(n) + h(n) = 3+4 siendo n nodo padre • f(n’)= g(n’)+h(n’) = 4+2 siendo n’ nodo hijo • 6 no tiene sentido ya que el costo de f(n’) debe ser por lo menos 7, ya que la ruta por n’ ha pasado por n. Esta no-monotonicidad debe ser corregida por inconsistente. • Nota  sigue siendo una heurística admisible ya que no sobreestima el costo, al contrario, lo infraestima más.

Conducta de la búsqueda A* • Realizar entonces una corrección menor que restituya la monotonicidad de una heurística no-monotónica • el costo f nunca decrece durante cualquiera de las rutas partiendo del inicio, suponiendo que h sea admisible • diverge desde el nodo inicial, sumando nodos en zonas anulares concéntricas de costos f, o sea los contornos de iso- f .

Conducta de la búsqueda A* • Con una búsqueda de costo uniforme (esto es, A* usando h = 0), las zonas cubiertas entre dos contornos son anillos circulares alrededor del estado de inicio. • Con más heurística (h>0) incorporada, las zonas anulares o contornos se estirarán hacia el estado meta y poco a poco irán delimitando más la ruta óptima, enmarcandola más ajustadamente. • Esto recuerda los cambios de nivel de la BPA

Completitud de A* • A* expande nodos en el orden de un creciente f, con lo cual eventualmente expandirá hasta llegar al estado meta • salvo que haya una cantidad infinita de nodos con f(n)< f* • un nodo con un factor de ramificación infinito • una ruta con costo de ruta finito pero con un número infinito de nodos a lo largo de ella

Complejidad de A* • La búsqueda A* es OPTIMAMENTE EFICIENTE para cualquier función heurística al contrastarse con otros algoritmos óptimos que compiten con ella. • No hay otro algoritmo que expanda menos nodos que A* • Cualquier algoritmo, que no expanda todos los nodos en los contornos existentes entre el contorno del inicio y el de la meta, corre el riesgo de no encontrar la solución óptima

Complejidad de A* • Complejidad temporal - O(b^d) • Complejidad espacial - O(b^d) • el espacio de búsqueda de A* crece exponencialmente a no ser que sea • h(n)-h*(n) =< O(log h*(n)) • prácticamente, el error es a lo menos proporcional al costo de la ruta • el crecimiento exponencial satura a cualquier computadora

Complejidad de A* • el uso de una heurística buena provee ventajas enormes • usualmente A* se queda sin espacio antes de quedarse sin tiempo, puesto que mantiene a todos los nodos en memoria

A* f(n) = 366 Arad 140 75 118 h(n) = 253 f(n) = 393 h(n) = 329 f(n) = 447 h(n) = 374 f(n) = 449 Zerind Sibiu Timisoara 140 99 151 80 Fagaras Oradea Arad f(n) = 413 Rimnicu f(n) = 417 f(n) = 646 f(n) = 661 146 97 80 Craiova Pitesti Sibiu f(n) = 526 f(n) = 415 f(n) = 553

Resumen de la búsqueda A* • A* usa una heurística admisible. • h(n) £ h*(n), donde h*(n) es el costo verdadero desde n • para rutas sobre terreno, la distancia en línea recta nunca sobreestimará la distancia real de una de ellas. • A* es óptima si h es admisible

Resumen de la búsqueda A* • Idea  No expandir estados que ya se sabe que son caros • Mejorar la búsqueda de costo uniforme y la búsqueda avara haciendo: f(n) = g(n) + h(n) • g(n) = costo de inicio a n • h(n) = costo estimado desde n hasta meta • f(n) = costo total estimado de la ruta desde inicio a meta pasando por n

A* h(n) = 253 f(n) = 393 Sibiu 140 151 99 80 Fagaras Oradea f(n) = 417 Arad f(n) = 413 Rimnicu f(n) = 526 f(n) = 646 99 211 146 97 80 Sibiu Pitesti f(n) = 415 Bucharest Craiova Sibiu f(n) = 553 f(n) = 450 f(n) = 591 f(n) = 526 138 101 97 Bucharest Craiova Rimnicu f(n) = 418 f(n) = 607 f(n) = 615

A* h(n) = 253 f(n) = 393 Sibiu 140 151 99 80 Fagaras Oradea Arad f(n) = 413 Rimnicu f(n) = 417 f(n) = 661 f(n) = 646 146 97 80 Sibiu Pitesti f(n) = 415 Craiova f(n) = 553 f(n) = 526 138 101 97 Bucharest Craiova Rimnicu f(n) = 418 f(n) = 607 f(n) = 615

Casos límites de A* • Si h=0 y g=d  BPA • Si h=1/d y g=0  BPP • Si h=0 y g=0  Búsqueda aleatoria • Si h=h y g=0  Búsqueda avara • Si h=0 y g=g  Búsq. de costo uniforme • Si h(n)>h*(n)  se habría perdido la ruta óptima • Si h(n)<h*(n)  ruta bien ¿tramo redundante?

4.2 • 4.2 • Funciones heurísticas

4.2 Funciones Heurísticas • Problema de los 8 tejos-Restricciones: no avanzar dos o más pasos por turno, no avanzar diagonalmente, no superponer un tejo a otro, no destornillar la cajita… • h1(n) =tejos fuera de orden---h2(n) = suma de distancias de Manhattan 1 2 5 4 3 8 4 6 1 8 6 3 7 5 7 2 estado inicial Estado meta

Cap 4 Búsqueda Heurística

Cap 4 Búsqueda Heurística

Presentation Transcript

Unit B 4-4

LOG STICA

LOG STICA

B- CaP

LOG STICA EMPRESARIAL

Cap tulo 4:

LOG STICA

Comunidad ling stica

Cap 4 – Conceitos de Cristalografia

Cap tulo 4 Determinantes

B squeda no Informada

ALGORITMOS DE B SQUEDA

T cnicas de B squeda

CAP. 4

T cnicas de B squeda

ARCHIV STICA

Condiciones de trabajo B squeda en Google: REVOLUCI N INDUSTRIAL

Estrategias de B squeda

Lingu stica

Estat stica

CAP ÍTULO 4

Cap. 4 Le Leve