110 likes | 175 Views
A Theory of Action for MultiAgent Planning. Michael Georgeff. Contenido. Introducción Modelo de proceso y acciones Definición formal Composición de Acciones Libre de interferencia Razonamiento general sobre acciones Conclusiones. Introducción.
E N D
A Theory of Action for MultiAgent Planning Michael Georgeff
Contenido • Introducción • Modelo de proceso y acciones • Definición formal • Composición de Acciones • Libre de interferencia • Razonamiento general sobre acciones • Conclusiones
Introducción • Si los Agentes inteligentes son para actuar racionalmente, necesitan poder razonar sobre los efectos de sus acciones. • Si el ambiente es dinámico o incluye otros agentes necesitan razonar sobre la interacción entre sus acciones y eventos en el ambiente y deben poder sinconizar sus actividades para realizar sus objetivos • Para razonar sobre los efectos de acciones concurrentes, se necesita conocer como las acciones son ejecutadas, no solo sus efectos finales.
Modelo de proceso y de acciones • Una transición atómica es una relación sobre el conjunto de estados del mundo. • Una acción es una clase de evento (vista intuitiva) eso resulta de la actividad de algunos agentes • realizando una acción, un agente fuerza alguna secuencia de transiciones atómicas en el mundo. Por cada acción se corresponderá a alguna estructura interna que especifique como y bajo que condiciones estas transiciones atómicas debes ser hechas. • Podremos especificar la clase de comportamiento posible y observable de un agente cuando realiza una acción por medio de un dispositivo llamado . process model
Modelo de proceso • Consiste de un número de estado interno llamados control points • Asociados con cada puntos de control esta un correctness condition (condición de exactitud). Especifica los estados aceptables del mundo en ese punto de control. • La manera en la que el dispositivo realiza una acción es descripta por una función parcial, llamada la función del process control(control de proceso)
Definición formal Un modelo de proceso es una seven-upla A= <S,F,C,d,P,ci,cf> donde S :es un conjunto de estados del mundo F: SxS es un conjunto de transiciones atómicas C: conjunto de los puntos de control d : CxF -> C es una función de control de procesos P: C->2S subconjunto asociado de S con cada puntos de control los valores de esta función son llamados corretness conditions ci: pertenece a C , es el punto de control final cf: pertenece a C , es el punto de control final
Definición formal (continuación) En general, d es la función parcial. Si dado que un puntos de control c y transiciones atómicas tr, <c,tr> esta en el dominio de d,decimos que “tr es aplicable a c”. Visto intuitivamente, si esta en el puntos de control c1 y el mundo esta en un estado s1, satisface la condición de exactitud P(c1), el dispositivo puede pasar a puntos de control c2 y el mundo a estado s2. Siempre y cuando exista una transición atómica aplicable a tr entre el estado s1 y s2 y d (c1,tr)=c2. Alternativamente, el dispositivo puede permanecer en el punto de control c1 y algunas transiciones o eventos ocurren en el mundo (quizás resultado de la acción de algunos otros agentes). En cualquier caso, para que la ejecución tenga éxito, (no falle) el nuevo estado del mundo necesita satisfacer la condición de exactitud para c2, i.e., s2 necesita ser un elemento de P(c2).
Composición de Acciones La motivación detrás del modelo presentado aquí, es el operador de parallel – composition (composición paralela). Definida como: A1= <S,F1,C1,d 1,P1, ci1 ,cf1> y A2 = <S,F2,C2,d 2,P2, ci2 ,cf2> son dos modelos de proceso para la acción a1 y a2 respectivamente. Definimos a un modelo de proceso representando la composición paralela de A1 y A2 denotada como A1 || A2 para ser el modelo de proceso <S,F,C,d,P, ci ,cf> donde • F= F1U F2 • C=C1xC2 • Para todo c1e C1, c2 e C2 y tr en F1, d ((c1, c2),tr)= (d 1 (c1, tr), c2) • Para todo c1 e C1, c2 e C2 y tr en F2, d ((c1, c2),tr)= (c1, d 2 (c2,tr)) • Para todo c1 e C1, c2e C2 , P ((c1, c2)r)=P(c1) P(c2) • ci =< ci1,ci2> • cf =< cf1,cf2> U
Libre de interferencia Un conjunto de modelos de procesos A1,......,An se dice ser libre de interferencia si para cada modelo de proceso Ai cumple: Para todos los puntos de control c en Ai y todas las transiciones tr aplicables a c y para todo j , j distinto i, tr en c no interfiere con Aj. Luego si un conjunto de acciones es libre de interferencia, ninguna puede fallar debido a la interferencia con las demás, por supuesto cualquiera puede fallar como resultado de la interacción con el ambiente. Para determinar libertad de interferencia es suficiente con representar el funcionamiento de un dispositivo por: • Un conjunto de condiciones de exactitud o correctitud y • Un conjunto de transiciones atómicas restringidas a las condiciones de correctitud de el nodo del que parten.
Razonamiento general sobre acciones • En la combinación con la lógica temporal la teoría propuesta de acción provee una base semántica para el razonamiento con sentido común y un entendimiento en lenguaje natural. • Determinar la libertad de interferencia • Los modelo de proceso también son apropiados para representar la mayoría de las construcciones de programación, incluyendo secuenciamiento, elecciones no determinísticas e iteraciones.
Conclusiones • Han sido presentada una teoría naciente de acción apropiada para el razonamiento sobre la interacción en multi agente. • Esta teoría provee una semántica para sentencias de acción en un lenguaje natural y de programación. • La teoría esta basada sobre un dispositivo llamado modelo de proceso, es usado para representar el comportamiento observable de un agente en le ejecución de una acción. • Este modelo puede ser usado para razonar sobre planes multi-agentes y programas concurrentes. • En particular, el operador de composición paralela fue definido y se derivaron las condiciones para determinar la libre interferencia para acciones concurrentes. • El uso de modelos de procesos como interpretación de lógicas temporales apropiadas para el razonamiento sobre planes y programas.