220 likes | 345 Views
Sistemas de razonamiento probabilístico. Red de creencias: características.
E N D
Red de creencias: características La principal ventaja del razonamiento probabilístico sobre el razo-namiento lógico es que el primero permite tomar decisiones racio-nales aún en los casos en que no haya suficiente información para probar que cualquier acción dada funcionará. • La red de creencias es un grafo dirigido y acíclico en el cual: • Un conjunto de arcos dirigidos o flechas, conecta pares de nodos. • Un conjunto de variables representa los nodos de la red. • Cada nodo tiene una tabla de probabilidad condicional que cuantifica los efectos que los padres tienen sobre el nodo.
Sismo P(H) Hurto P(S) 0.001 0.002 H S P(A) Alarma V V 0.95 V F 0.94 F V 0.29 F F 0.001 A P(J) A P(M) Juan llama María llama V 0.90 V 0.70 F 0.05 F 0.01 Ejemplo de Red de creencias
Una red de creencias provee una descripción completa del dominio. Una entrada general es la probabilidad de una conjunción de asignaciones particulares a cada variable, tal como P(X1 = x1 ...Xn = xn). Usando la notación P(x1, x2, ...,xn) como abreviatura de esto, el valor de esta entrada está dado por la siguiente fórmula: P(x1, x2, ...,xn) = P(xiPadres(Xi )) [1] Ejemplo: probabilidad de que la alarma haya sonado pero que no hayan ocurrido hurto o sismo, y Juan y María llamen: P(JMAHS)=P(JA) P(MA)P(AHS)P (H)P(S) = 0.90 * 0.70 * 0.001 * 0.999 * 0.998 = 0.00062 n i = 1 Representación de la distribución de probabilidad conjunta
Distribución de probabilidad conjunta (cont.) Probabilidad condicional por definición: P(x1, x2, ...,xn) = P(xi xi-1, ...,x1) [2] Comparando con la ecuación [1] vemos que la especifica-ción es equivalente a la aseveración general [3] P(Xi Xi-1,..., X1)=P(XiPadres(Xi )) siendo Padres(Xi ){xi-1, ...,x1} La ecuación anterior nos dice que la red de creencias es una representación correcta del dominio solo si cada nodo es condicionalmente independiente de sus predecesores, en el orden de los nodos, dados sus padres. Intuitivamente, padres del nodo Xi debería contener todos aquellos nodos en X1, . . .,Xi-1que influencian directamente a Xi. n i=1
Procedimiento para la construcción de la red • Elegir el conjunto de variables Xi relevantes que describen el dominio. • Elegir un orden para las variables. • Mientras queden variables: • a) Tomar una variable Xi y agregar un nodo a la red para dicha variable. • b) Hacer que Padres(Xi) sea un conjunto mínimo de nodos ya existente en la red, tal que la propiedad de independencia condicional [3] sea satisfecha. • c) Definir la tabla de probabilidad condicional para Xi.
Nodo determinístico: su valor queda especificado exactamente por los valores de sus padres, sin incertidumbre. • Las relaciones con incertidumbre pueden a veces ser caracterizadas por las llamadas relaciones con ruido. El ejemplo estándar es el llamado OR-ruidoso que es una generalización del OR lógico. • En lógica proposicional, podíamos decir Fiebre es verdadero si y solo si Resfrío, Gripe o Malaria es verdadero. El modelo OR-ruidoso agrega alguna incertidumbre a este enfoque estrictamente lógico. • El modelo asume tres cosas: • Cada causa tiene una chance independiente de causar el efecto. • Todas las causas posibles están listadas. • Cualquier cosa que inhibe, por ej. a Gripe, de causar Fiebre, es inde-pendiente de lo que inhiba a Resfrío de causar Fiebre. Estos inhibid. no se representan como nodos sino que se resumen como“parám.de ruido”. Representación de tablas de probabilidad condicional
P(Fiebre) Resfrío Gripe Malaria P(Fiebre) F F F 0.0 1.0 V F F 0.9 0.1 Parámetros de ruido F V F 0.8 0.2 V F F 0.4 0.6 F V V 0.98 0.02 V F V 0.94 0.06 V V F 0.88 0.12 0.012 V V V 0.988 Representación de tablas de probabilidad condicional (continuación)
Relaciones de independencia condicional en redes de creencias Separación dependiente de la dirección o d-separación: Dada una red, es posible determinar si un conjunto de nodos X es independiente de otro conjunto Y, dado un conjunto de nodos evidencia E. Si todo camino no dirigido desde un nodo en X a un nodo en Y es d-separado por E, luego X e Y son condicionalm. independ., dada E. Un conjunto de nodos E d-separa dos conjuntos de nodos X e Y si cada camino no dirigido desde un nodo en X hasta un nodo en Y está bloqueado dado E. Un camino está bloqueado dado un conjunto de nodos E si hay un nodo Z en el camino para el cual se cumple una de las tres condiciones siguientes: 1 Z está en E y Z tiene una flecha ingresando y otra saliendo. 2 Z está en E y tiene ambas flechas del camino hacia afuera. 3 Ni Z ni ningún descend.de Z está en E,y ambas flecha apuntan a Z.
Relaciones de independencia condicional en redes de creencias (continuación) Z X E Y Z Z Tres formas en que un camino desde X hasta Y puede ser bloqueado, dada la evidencia E. Ejemplo: Batería Radio Ignición Nafta Arranca Se mueve
La tarea básica de cualquier sistema de inferencia probabilístico es computar la distribución de probabilidad posterior de un conjunto de variables de Query, dados los valores exactos de algunas variables de evidencia: P(QueryEvidencia), Ej. P(HurtoJuanLlama) • En general, un agente toma valores para variables de evidencia, de sus percepciones (o de otro razonamiento), y pregunta sobre valores posibles de otras variables de modo que puede decidir qué acciones tomar. • Las redes de creencias pueden realizar cuatro tipos de inferencias: • Inferencias diagnósticas (de efectos a causas) • Inferencias causales (de causas a efectos) • Inferencias intercausales (entre causas de un efecto común) • Inferencias mezcladas (combinando dos o más de las anteriores) Inferencia en redes de creencias
Posibles usos de las redes de creencias • Además de permitir calcular la creencia en variables de Query, dados los valores definidos para variables de evidencia, las redes de creencias pueden ser usadas para lo siguiente: • Tomar decisiones basadas en probabilidades en la red y en las uti-lidades del agente. • Decidir qué variables de evidencia adicionales deberían ser obser-vadas para ganar información útil. • Realizar análisis de sensibilidad para entender qué aspectos del modelo tienen el mayor impacto sobre las probabilidades de las va-riables de Query. • Explicar al usuario los resultados de la inferencia probabilística.
Inferencia en redes de creencias con múltiples conexiones • Hay tres clases básicas de algoritmos para evaluar redes de conexiones múltiples: • Agrupamiento (clustering), métodos que transforman la red en un polytree equivalente probabilístico (pero diferente topológicamen-te), uniendo nodos ofensivos. • Condicionamiento por conjunto de corte, métodos que realizan la transformación dando valores concretos a las variables, y luego eva-luando un polytree para cada particularización posible. • Simulación estocástica, métodos que usan la red para generar un gran número de modelos concretos del dominio que son consisten-tes con la distribución de la red.
Red con conexiones múltiples con tablas de probabilidad condicional P(N) = 0.5 Nublado N P(R) N P(Ll) Regador Lluvia V V 0.10 0.80 F 0.50 F 0.20 Pasto Húmedo R Ll P(H) V 0.99 V V 0.90 F F V 0.90 F 0.00 F
P(N) = 0.5 Nublado P(R +Ll = x) N VV VF FV FF 0.08 0.02 0.72 0.18 0.10 0.40 0.10 0.40 V Regador + Lluvia F R + Ll P(H) V 0.99 V V 0.90 F F V 0.90 F 0.00 F Equivalente de la red con conexiones múltiples usando agrupamiento (clustering) Pasto Húmedo
+ Nublado + Nublado - Nublado - Nublado Lluvia Lluvia Regador Regador Pasto Húmedo Pasto Húmedo Método de condicionamiento por conjunto de corte Transforma la red en varios polytrees más simples. Cada red simple tiene una o mas variables particularizadas a un valor definido. El conj. de variables que puede ser particularizado se llama conjunto de corte. Nota. Polytree: red simplemente conectada, en tal red hay como máxi-mo un camino no dirigido entre dos nodos cualesquiera.
Método de simulación estocástica Se corren simulaciones repetidas del mundo descripto por la red de creencia, y se estima la probabilidad en que es-tamos interesados, contando las frecuencias con las cuales los eventos relevantes ocurren. La mayor dificultad con es-te método es que toma un largo tiempo obtener probabili-dades precisas para eventos poco probables.
Ingeniería del conocimiento para razonamiento con incertidumbre • Decidir sobre qué hablar. Es importante decidir qué factores serán modelados, y cuáles serán resumidos por enunciados probabilísticos. • Decidir sobre un vocabulario de variables al azar. • Codificar conocimiento general acerca de la dependencia entre variables. • Codificar una descripción del caso particular específico del problema. • Presentar Queries al procedimiento de inferencia y obte-ner respuestas.
Otros enfoques de razonamiento con incertidumbre • Razonamiento por omisión (default) • Trata a las conclusiones como creíbles hasta que se haya encontra-do una razon mejor para creer en algo más. Exhibe no monotonici-dad porque el conjunto de creencias no crece monotónicamente a medida que se obtiene nueva evidencia. Estos tipos de sistemas comparten un cierto número de temas problemáticos: • ¿Cuál es el status semántico de las reglas por omisión? ¿Cuál es el conjunto adecuado de reglas por omisión que se debe tener? • ¿Qué ocurre cuando la evidencia coincide con las premisas de dos reglas por omisión con conclusiones en conflicto? • Algunas veces un sistema puede llevar a un número de conclusiones basándose en una creencia que es retractada más tarde. ¿Cómo puede el sistema hacer un seguimiento de qué conclusiones necesitan ser retractadas? • ¿Cómo las creencias que tienen status por omisión pueden ser usadas para tomar decisiones?
Métodos basados en reglas para el razonamiento con incertidumbre • Además de la monotonicidad, los sistemas de razonamiento lógico tienen otras tres propiedades que los razonadores probabilísticos no poseen: • Carácter local: A B podemos concluír B dada A sin preocupar-nos acerca de cualquier otra regla. • Desapego: Una vez que se ha encontrado una prueba lógica para una proposición B, esta puede ser usada sin importar cómo fue derivada. • Funcionalidad de la verdad: En lógica,la verdad de sentencias com- plejas se puede computar a partir de la verdad de sus componentes. • Las propiedades antes mencionadas no son apropiadas para el razonamiento con incertidumbre.
P(A B) P(A) P(B) P(H1) = 0.5 P(H1 H1) = 0.5 P(H1 T1) = 1.0 P(H1) = 0.5 P(T1) = 0.5 P(H1 H2) = 0.75 P(H2) = 0.5 Métodos basados en reglas para el razonamiento con incertidumbre (continuación) Ejemplo: funcionalidad de la verdad. Los eventos H1, H2 y T1 tienen la misma probabilidad 0.5, entonces un sistema verdad-funcional debe asignar la misma creencia a la dis-yunción de cualquier par de ellos. Pero, podemos ver que la probabilidad de la disyunción depende de los eventos, y no de sus probabilidades:
Teoría Dempster - Shafer Trata la distinción entre incertidumbre e ignorancia. En vez de computar la probabilidad de una proposición, com-puta la probabilidad de que la evidencia soporte la propo-sición. Una interpretación de esta teoría es que define un interva-lo de probabilidad: en el ejemplo de R&N el intervalo para Cara es [0,1] antes del testimonio del experto,y [0.45,0.55] después.