1 / 15

Árvores de Decisão: supervisionado, simbólico, não incremental (?)

Árvores de Decisão: supervisionado, simbólico, não incremental (?). Árvores de Decisão. Pode-se definir formalmente uma árvore de decisão como sendo:. 1.um nó folha - ou nó resposta - que contém um nome de classe, ou

jera
Download Presentation

Árvores de Decisão: supervisionado, simbólico, não incremental (?)

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Árvores de Decisão: supervisionado, simbólico, não incremental (?)

  2. Árvores de Decisão Pode-se definir formalmente uma árvore de decisão como sendo: 1.um nó folha - ou nó resposta - que contém um nome de classe, ou 2.um nó não folha - ou nó de decisão - que contém um teste de atributo que, para cada um dos possíveis valores de atributo, tem um ramo para uma outra árvore de decisão

  3. Representação da AD 1 falso verdadeiro X 2 verdadeiro falso Y X

  4. Temperatura Região Tempo Barometro Predição Acima 0°C Oeste Nublado Baixando Chuva Abaixo 0°C Nublado Fixo Neve Acima 0°C Leste Nublado Aumentando Sol Acima 0°C Parcial Nubl. Fixo Sol Limpo Fixo Sol Acima 0°C Sul Limpo Baixando Chuva 0°C Norte Parcial Nubl. Fixo Neve Árvores de Decisão (Cont) • Padrões no conjunto de amostras são identificados. Conjunto de exemplos experimentais observados

  5. Temperatura Região Tempo Barometro Predição Acima 0°C Oeste Nublado Baixando Chuva Abaixo 0°C Nublado Fixo Neve Acima 0°C Leste Nublado Aumentando Sol Acima 0°C Parcial Nubl. Fixo Sol Limpo Fixo Sol Acima 0°C Sul Limpo Baixando Chuva 0°C Norte Parcial Nubl. Fixo Neve Sol Neve Sol Acima 0°C Aumentando Nublado 0°C Parcial Nubl. Fixo Temp Neve Tempo Barômetro Limpo Baixando Abaixo 0°C Chuva Sol Sem dados Árvores de Decisão (Cont) Exclui Fatores Irrelevantes (Região) Nenhuma solução descoberta: (Mais exemplos requeridos) Escolhe atributo mais relevante primeiro

  6. Regras de Decisão Se Barômetro = Aumentando então Sol. Se Barômetro = Fixo e Tempo = Nublado então Neve. Se Barômetro = Fixo e Tempo = Parcialmente Nublado e Temperatura = 0C então Neve.

  7. Algoritmos da Família TDIDT TDIDT Top Down Induction of Decision Trees Esta família agrupa os algoritmos e sistemas mais representativos que utilizam como algoritmo básico de aprendizado o ID3. Algoritmos: ID3, ID3’, C4, C4.5, ID4, ID5, etc.

  8. Estágios do Processo de Aprendizado da Família TDIDT 2.poda da árvore de decisão para eliminar subárvores não confiáveis 3.processamento da árvore podada para melhorar a sua legibilidade - construção de regras a partir da árvore 1.construção da árvore de decisão para classificar corretamente todos os exemplos

  9. Árvores de Decisão s e x o c i r u r g i a T S H T F I T T 4 T I c l a s s e n e g 5 . 8 6 6 . 2 1 5 6 . 2 f f f n e g 7 . 3 7 0 . 2 1 5 2 . 9 f f v h i p o _ p r i m 8 . 8 6 0 . 2 1 4 8 . 4 m v f h i p o _ c o m p 6 . 9 6 5 . 4 1 3 2 . 7 f f f n e g 5 . 4 6 5 . 2 1 5 0 . 9 m f f . . . . . . . . . . . . . . . . . . . . .

  10. Árvores de Decisão (Cont) T S H < 6 . 0 5 > 6 . 0 5 n e g F T I < 6 4 . 5 > 6 4 . 5 h i p o _ p r i m T I v f n e g c i r u r g i a v f n e g T T 4 > 1 5 0 . 5 < 1 5 0 . 5 h i p o _ c o m p n e g

  11. Regras de Decisão T S H < 6 . 0 5 1 . S e n e g e n t ã o 2 . S e e T S H > 6 . 0 5 F T I < 6 4 . 5 e n t ã o h i p o _ p r i m . . . 6 . S e e T S H > 6 . 0 5 e F T I > 6 4 . 5 e T I = f e c i r u r g i a = f T T 4 > 1 5 0 . 5 e n t ã o n e g

  12. Características Gerais dos Sistemas TDIDT • Sistemas de propósito geral com o objetivo de classificar objetos: Eles produzem regras ou descrições de um determinado número de classes de objetos. Quando novos objetos são observados, estas regras devem predizer a qual classe cada um deles pertence. • Representação do Conhecimento na forma de árvores de decisão. Em geral, realizam aprendizado não incremental. • Constroem a árvore de decisão em forma top-down. • Os exemplos, a partir dos quais são geradas as regras de classificação, são conhecidos somente através dos valores de um conjunto de atributos. Por sua vez, as árvores de decisão são construídas em função destes mesmos atributos.

  13. Esquema Geral dos Algoritmos de Aprendizado por Exemplos O processo de aprendizado e classificação é dividido em: • 1. pré-processamento dos exemplos de aprendizado no qual deve ser considerado o tratamento de: • atributos numéricos; • atributos com valores desconhecidos; • valores irrelevantes; • valores sem significado. Existente para todos os paradigmas • 2. construção de regras de classificação envolve: • escolha do critério de seleção do melhor atributo na construção da árvore de decisão • tratamento de domínios com ruído ou domínios incompletos • poda na árvore de decisão Específico para Simbólico

  14. Vantagens • Podem adquirir e representar facilmente conceitos disjuntos • Podem manusear dados com ruído (dados com erros ou incertezas) • Executam pouca busca • A simplicidade do formato de representação é contrabalanceada por sua eficiência • Têm obtido muito sucesso em diversas áreas de aplicação - vários deles estão disponíveis comercialmente

  15. Desvantagens • Um mesmo conceito pode ser representado por várias árvores de decisão • É difícil entender um conceito representado como uma árvore de decisão grande • Limitados a uma linguagem descritiva baseada em atributos-valores

More Related