230 likes | 339 Views
Raciocínio Prático. Luiz A M Palazzo Abril de 2010. Agentes Inteligentes. Sensores. AGENTE. Racionalidade. AMBIENTE. Atuadores. Raciocínio Prático.
E N D
Raciocínio Prático Luiz A M Palazzo Abril de 2010
Agentes Inteligentes Sensores AGENTE Racionalidade AMBIENTE Atuadores
Raciocínio Prático • É o raciocínio orientado à ação (o processo de descobrir o que fazer) em contraponto ao raciocínio teórico, que é orientado às crenças do agente. • O raciocínio prático humano consiste em duas atividades: • Deliberação: decidir onde se quer chegar, e • Raciocínio Meios-Fim: decidir como chegar lá • O resultado da deliberação é a intenção • A intenção é muito mais forte do que meros desejos
Planejamento • Agentes Planejadores • Planejamento é essencialmente programação automática • Raciocínio Meios-Fim: Dar ao agente: • Representação da meta/intenção a atingir, • Representação das ações que podem ser executadas, • Representação do ambiente... • ... e receber um plano para atingir a meta
Exemplo: Mundo dos Blocos • Contém (a) um braço robô, (b) três blocos A, B e C e (c) um topo de mesa • Ontologia on(x,y), ontable(x), clear(x), holding(x) • Ex: clear(A). on(A,B). ontable(B). ontable(C). • Emprega-se a Hipótese do Mundo Fechado. • Um objetivo é representado por um conjunto de fórmulas: ontable(A) ^ ontable(B) ^ ontable(C) • As ações são representadas como no sistema STRIPS. • Cada ação possui: (a) um nome, (b) uma pré-condição, (c) uma del-list e (d) uma add-list. Cada um destes elementos pode possuir variáveis.
Exemplo: stack(x,y) • A ação stack(x,y) pode ser assim definida: • Nome: stack(x,y) • Pré: clear(y) ^ holding(x) • Del: clear(y) ^ holding(x) • Add: armempty ^ on(x,y) • Exemplos: definirunstack(x,y), pickup(x), putdown(x)
Loop de Controle do Agente • O que é um plano? Uma seqüência de ações com variáveis sendo substituídas por constantes. • Agent Control Loop 1. while true 2. observe the world; 3. update internal world model; 4. deliberate about what intention to achieve next; 5. use means-ends reasoning to get a plan for the intention; 6. execute the plan 7. end while
Deliberação • Como um agente delibera? • Começa por tentar entender que opções tem disponíveis • Escolhe entre elas e se compromete com uma delas • As opções escolhidas são então intenções • A função de deliberação pode ser decomposta em dois componentes funcionais: • Geração de opções • Filtragem
A(8) B(5) C(3) A(8) B(5) C(3) Passo 1 Raciocínio Meios - Fim Passo 2 8 4 4 • Simulação (1) Passo 3 Estado Inicial Estado Objetivo Passo 4 Passo 5 Passo 6 Passo 7
Conferindo... • Teseu e o Minotauro: • http://www.logicmazes.com/theseus.html • VáriosDesafios • http://www.logicmazes.com
As Torres de Hanói ESTADO INICIAL ESTADO OBJETIVO ? Clique aqui para jogar: http://www.mazeworks.com/hanoi/
A solução é um caminho no ESPAÇO DE ESTADOS Busca em Espaços de Estados EstadoInicial Solução Espaço de Estados Estado Final
Estratégias de Busca • Tentativa e Erro • Hill Climbing • Análise Meios-Fins
Tentativa e Erro Pode ser organizada: pesquisaem amplitude, ouemprofundidade. Chegaaoobjetivoapósum grandenúmero de passosaleatóriosMuitosmovimentossãodesperdiçadosMaspode ser a saídaquandonão se tem outraalternativa
Hill Climbing 4 3 Estado Inicial A cada estado possívelum valor é atribuído. Aqui quanto mais baixo melhor. A cada passo um novo estado é escolhido com um valor melhor. Pode “empacar”. (Onde?) Nesse caso usar T&E; 4 3 2 3 2 1 Estado Objetivo 2 1
Hill Climbing • Dependendo do estadoinicial o trajetopodeficarempacadoem um máximo local
Análise Meios-Fim • Nãoháplanejamentoenvolvidonasestratégias “Tentativa e Erro” e “Hill Climbing” • A Análise Meios-Fim distingue entre planejarum movimento e executar um movimento • Foipropostacomo parte do General Problem Solver (GPS) por Newell e Simon em 1972.
Análise Meios-Fim A busca é guiadapeladetecção das diferenças entre o estadocorrente e o estadoobjetivo. 1) Comparar o estadocorrente com o estadoobjetivo e identificar as diferenças. 2) Selecionar um operador para reduzir a diferença. • Se o operadorpode ser aplicado, fazer isto; • Se não, estabelecer um novo sub-objetivo, de atingir um estado no qual o operadorpossa ser aplicado. • A análisemeios-fim é entãorecursivamenteaplicada a este novo sub-objetivo. • Voltar a 1
Um Exemplo Simples • Pintarsua casa • Aplicarpintura • Precisa de tinta e pincel • Iraté a ferragem • Achar as chaves do carro …
A Pilha de Objetivos • Pintar a casa(Objetivo 1) • Aplicar a pintura(Sub-objetivo2) • Precisa de tinta e pincel(Sub-objetivo3) • Vaiaté a ferragem(Sub-objetivo4) • Cheganaferragem(Sub-objetivo4) • Adquiretinta e pincel(Sub-objetivo3) • Aplica a pintura(Sub-objetivo2) • Pinta a casa(Objetivo 1)
Funcionamento da Pilha de Objetivos Solved Goal 4: Pop-offStack Push Goal 1 on Stack Push Goal 2 on Stack Push Goal 3 on Stack Push Goal 4 on Stack G4 G1 G2 G3 G4 G3 G1 G2 G3 G2 G1 G2 G1 G1
Sistemas de Produções Um conjunto de regras de produção (regras se-então) SEvocê tem um pincel de rolo, E você tem tinta E você tem umasuperfíciepronta para ser pintada E a superfície é grande E o seuobjetivo é pintar a superfície ENTÃO use o roloembebidoemtinta para pintar a superfície E espere que a superfícieresultepintada.
Aplicando Sistemas de Produções 1) As condições das regrassãocomparadas com o conteúdocorrentementeativonamemória de trabalho. 2) Se mais do que umaregrapode ser aplicada, aplicarprocedimentos de solução de conflito. 3) A regraselecionada é disparada. 4) Retorna a 1 (O Modelo ACT de Anderson: “a cogniçãohumanabaseia-se emsistemas de produções”).