1 / 21

INF 1771 – Inteligência Artificial

INF 1771 – Inteligência Artificial. Aula 12 – Árvores de Decisão. Edirlei Soares de Lima <elima@inf.puc-rio.br>. Árvores de Decisão. Uma das formas de algoritmo de aprendizado mais simples e de maior sucesso .

azalia-kemp
Download Presentation

INF 1771 – Inteligência Artificial

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. INF 1771 – Inteligência Artificial Aula 12 – Árvores de Decisão Edirlei Soares de Lima <elima@inf.puc-rio.br>

  2. Árvores de Decisão • Uma das formas de algoritmo de aprendizado mais simples e de maior sucesso. • Uma árvore de decisão tem como entrada um objeto ou situação descritos por um conjunto de atributos e como saída uma “decisão” (previsão do valor de saída dada a entrada). • Uma árvore de decisão toma as suas decisões através de uma sequência de testes.

  3. Árvores de Decisão • Cada nó interno da árvore corresponde a um teste do valor de uma propriedade. • Os ramos dos nós são rotulados com os resultados possíveis do teste. • Cada nó folha da árvore específica o valor a ser retornado se aquela folha for alcançada. • A representação de uma árvore de decisão é bem natural para os seres humanos. Raiz Ramo Ramo Nó Nó Ramo Ramo Ramo Nó Folha Folha Ramo Ramo

  4. Exemplo – Restaurante • Problema: Esperar por uma mesa em um restaurante. • O objetivo é aprender uma definição para o predicado “vai esperar”. • Primeiramente é necessário definir quais atributos estão disponíveis para descrever alguns exemplos nesse domínio.

  5. Exemplo – Restaurante • Atributos: • Alternativa: Verdadeiro se existe um restaurante alternativo adequado nas proximidades. • Bar: Verdadeiro se o restaurante tem uma área de bar confortável para ficar esperando. • Sex/Sab: Verdadeiro se o dia da semana for sexta ou sábado. • Faminto: Verdadeirose estamos com fome. • Pessoas: Quantas pessoas estão no restaurante (os valores são Nenhuma, Algumas e Cheio). • Preço: Preço do restaurante de ($, $ $, $$$). • Chuva: Verdadeiro se está chovendo lá fora. • Reserva: Verdadeiro se nós fizemos uma reserva. • Tipo: Tipo de restaurante (Francês, Italiano, Tailandês, Hambúrguer). • EstimativaEspera: Tempo de espera estimado (00-10, 10-30, 30-60, > 60 minutos).

  6. Exemplo – Restaurante Pessoas? Nenhuma Algumas Cheio Não Sim EstimativaEspera? >60 30-60 0-10 10-30 Não Alternativa? Faminto? Sim Sim Sim Não Não Reserva? Sex/Sab? Sim Alternativa? Sim Não Sim Sim Não Não Não Sim Bar? Sim Sim Chovendo? Sim Não Sim Não Não Não Sim Sim

  7. Gerando Árvores de Decisão a partir de Exemplos • É possível gerar uma árvore de decisão a partir de um conjunto de exemplos. • Exemplos positivos são aqueles que levam a uma resposta positiva. Exemplo: “vai esperar” = Sim. • Exemplos negativos são aqueles que levam a uma resposta negativa. Exemplo: “vai esperar” = Não.

  8. Conjunto de Treinamento

  9. Gerando Árvores de Decisão a partir de Exemplos • Seguindo o principio de Ockham, devemos encontrar a menor árvore de decisão que seja consistente com os exemplos de treinamento. • “Qualquer fenómeno deve assumir apenas as premissas estritamente necessárias à explicação do fenómeno e eliminar todas as que não causariam qualquer diferença aparente nas predições da hipótese ou teoria.” • A ideia básica do algoritmo é testar os atributos mais importantes primeiro. • O atributo mais importante é aquele que faz mais diferença para a classificação de um exemplo. • Dessa forma, esperamos conseguir a classificação correta com um pequeno número de testes.

  10. Gerando Árvores de Decisão a partir de Exemplos Conjunto de Treinamento 1 3 4 6 8 12 2 5 9 10 7 11 Pessoas? Tipo? Algumas Cheio Nenhuma Tailandês Hamburger Francês Italiano 1 8 4 12 6 3 1 6 4 8 3 12 7 11 2 5 9 10 5 10 2 11 7 9 Não Sim Faminto? Tipo é um atributo ruim, pois ele deixa 4 resultados sem nenhuma conclusão. Pessoas é um atributo bom, pois 2 resultados dele levam a conclusões diretas.

  11. Gerando Árvores de Decisão a partir de Exemplos • Algoritmo: • (1) Enquanto existirem exemplos positivos e negativos, deve-se escolher o melhor atributo para dividi-los. • (2) Se todos os exemplos restantes forem positivos (ou todos negativos), então podemos responder Sim ou Não. • (3) Se não existirem exemplos restantes, retorna um valor padrão calculado a partir da classificação da maioria dos atributos do nó pai. • (4) Se não existirem atributo restantes, mas ainda existirem exemplos positivos e negativos temos um problema.

  12. Gerando Árvores de Decisão a partir de Exemplos • Quando não existem atributos restantes, mas ainda existem exemplos positivos e negativos significa que: • Esses exemplos têm exatamente a mesma descrição, mas classificações diferentes. Isso acontece quando alguns dos dados estão incorretos, ou seja há ruído nos dados. • Também acontece quando os atributos não dão informação suficiente para descrever a situação completamente, ou quando o domínio é realmente não-determinístico. • Uma saída simples do problema é a utilização de uma votação majoritária.

  13. Gerando Árvores de Decisão a partir de Exemplos Pessoas? Nenhuma Algumas Cheio Não Sim Faminto? Não Sim Não Tipo? Francês Italiano Hambúrguer Tailandês Sim Não Sim Sex/Sab? Sim Não Não Sim

  14. Escolhendo os Melhores Atributos • Qual é o melhor atributo? [29+, 35-] [21+, 5-] [8+, 30-]

  15. Escolhendo os Melhores Atributos • Entropia • Caracteriza a (im)pureza de uma coleção arbitrária de exemplos. • Dado uma coleção S contendo exemplos positivos (+) e negativos (–) de algum conceito alvo, a entropia de S relativa a esta classificação booleana é: • p+ é a proporção de exemplos positivos em S. • p– é a proporção de exemplos negativos em S.

  16. Escolhendo os Melhores Atributos • Exemplo: Sendo S uma coleção de 14 exemplos de treinamento de algum conceito boleano, incluindo 9 exemplos positivos e 5 negativos [9+, 5-]. • A entropia de S relativa a classificação é: • A função entropia relativa a uma classificação varia entre 0 e 1.

  17. Escolhendo os Melhores Atributos • Generalizando para o caso de um atributo alvo aceitar n diferentes valores, a entropia de S relativa a esta classificação de n–classes é definida como:

  18. Medindo Desempenho • Um algoritmo de aprendizado é bom se ele produz hipóteses que conseguem prever a classificação de exemplos não vistos. • A maneira mais simples de se medir o desempenho de um método de aprendizado é realizando a classificação de um conjunto de exemplos de teste.

  19. Medindo Desempenho • Processo de avaliação: • (1) Divide-se o conjunto total de exemplos conhecidos em dois conjuntos: • Conjunto de Treinamento. • Conjunto de Teste. • (2) Gera-se uma hipótese h (árvore de decisão) com base no Conjunto de Treinamento. • (3) Para cada exemplo do Conjunto de Teste, classifica-se o exemplo utilizando a árvore de decisão criada a partir do conjunto de treinamento. • (4) Verifica-se a quantidade de exemplos de teste classificados corretamente e calcula-se a porcentagem de acertos. • (5) Escolhe-se aleatoriamente um novo conjunto de exemplos de treinamento (normalmente com um numero maior de exemplos) e repete-se novamente o processo.

  20. Medindo Desempenho Porcentagem de reconhecimento Tamanho do Conjunto de Treinamento

  21. Leitura Complementar • Russell, S. andNorvig, P. Artificial Intelligence: a Modern Approach, 3nd Edition, Prentice-Hall, 2009. • Capítulo 18: Learning from Observations

More Related