1 / 16

Regressão

Regressão. Tarefa preditiva em que as classes são contínuas Objetivo: predizer um valor numérico para a saída: Consumo de um carro em função de suas características Valor de um imóvel em função das características dele e do bairro. Regressão.

Download Presentation

Regressão

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Regressão • Tarefa preditiva em que as classes são contínuas • Objetivo: predizer um valor numérico para a saída: • Consumo de um carro em função de suas características • Valor de um imóvel em função das características dele e do bairro

  2. Regressão Encontrar uma relação entre um conjunto de atributos de entrada e um atributo-meta contínuo da seguinte forma: y = f(x1,x2,...,xd) potência peso aceleração consumo 130 3504 12 18

  3. Conjunto de dados para classificação Dívida o o o x o o x x x o o o o x x x x o o o x x o Renda Dados no formato atributo-valor: Renda Dívida Status

  4. Formas de representação do “classificador” que realiza regressão: • Árvore de regressão • Regras de regressão

  5. Árvores de regressão • As árvores são compostas por dois tipos de nós: • os nós internos da árvore: cada um desses nós corresponde a um teste feito em um dos atributos de entrada do conjunto de treinamento, e • os nós-folha, onde são feitas as predições do atributo-meta. Os nós-folha de uma árvore de regressão possuem uma função matemática (que no caso mais simples pode ser a média dos valores que caem em cada nó-folha) para predizer o atributo-meta

  6. Exemplo • Definição da área • Domínio: carros • Os dados relacionam alguns atributos de carros • Definição do problema • encontrar um padrão que permita predizer o consumo de um carro em milhas por galão de combustível, a partir de outros atributos do carro

  7. potência peso aceleração consumo 1 130.000000 3504.000000 12.000000 18.000000 2 165.000000 3693.000000 11.500000 15.000000 3 150.000000 3436.000000 11.000000 18.000000 4 150.000000 3433.000000 12.000000 16.000000 5 140.000000 3449.000000 10.500000 17.000000 6 198.000000 4341.000000 10.000000 15.000000 7 220.000000 4354.000000 9.000000 14.000000 8 215.000000 4312.000000 8.500000 14.000000 9 225.000000 4425.000000 10.000000 14.000000 10 190.000000 3850.000000 8.500000 15.000000 11 170.000000 3563.000000 10.000000 15.000000 12 160.000000 3609.000000 8.000000 14.000000 13 150.000000 3761.000000 9.500000 15.000000 14 225.000000 3086.000000 10.000000 14.000000 15 95.000000 2372.000000 15.000000 24.000000 16 95.000000 2833.000000 15.500000 22.000000 17 97.000000 2774.000000 15.500000 18.000000 18 85.000000 2587.000000 16.000000 21.000000 19 88.000000 2130.000000 14.500000 27.000000 20 46.000000 1835.000000 20.500000 26.000000

  8. Exemplo • exemplos: 1, 2, ,,,,, 20 • atributos: potência, peso, aceleração • atributo meta: consumo

  9. Exemplo carros • Aplicação do algoritmo de regressão • atributo selecionado: potência • ≤ 96 • > 96 • nesse ponto é encontrada uma expressão que calcula o valor do consumo

  10. Árvore com equações linerares nas folhas • LM1 consumo = -0.0248 * potencia - 0.0036 * peso + 33.4687 • LM2 consumo = -0.0391 * potencia - 0.0014 * peso + 26.7157

  11. Árvore de regressão potencia <= 96 : | peso <= 2251 : LM1 (2/12.257%) | peso > 2251 : LM2 (3/30.575%) potencia > 96 : | potencia <= 206.5 : | | potencia <= 162.5 : | | | potencia <= 135 : LM3 (2/0%) | | | potencia > 135 : | | | | peso <= 3529 : LM4 (3/20.016%) | | | | peso > 3529 : LM5 (2/12.257%) | | potencia > 162.5 : LM6 (4/0%) | potencia > 206.5 : LM7 (4/0%)

  12. Expressões lineares LM num: 1 consumo = -0.0248 * potencia - 0.0034 * peso + 33.1574 LM num: 2 consumo = -0.0248 * potencia - 0.0033 * peso + 32.8537 LM num: 3 consumo = -0.0347 * potencia - 0.0014 * peso + 26.955 LM num: 4 consumo = -0.0342 * potencia - 0.0016 * peso + 27.2618 LM num: 5 consumo = -0.0342 * potencia - 0.0016 * peso + 27.2789 LM num: 6 consumo = -0.0326 * potencia - 0.0014 * peso + 26.5767 LM num: 7 consumo = -0.0296 * potencia - 0.0014 * peso + 25.9602

  13. Árvore com valores constantes nas folhas • (selecionando opção de poda da árvore) • LM1 consumo = 19.2 • LM2 consumo = 16.5333

  14. Regras de Regressão Uma regra na FNC possui a seguinte forma: • if <condição> then <y = f(xi)> Regra 1: potencia <= 96 : LM1 (5/29.452%) Regra 2: potencia > 96 : LM2 (15/20.855%) LM num: 1 consumo = -0.0248 * potencia - 0.0036 * peso + 33.4697 LM num: 2 consumo = -0.0331 * potencia - 0.0014 * peso + 26.7157

  15. Erro e Precisão • Para problemas de regressão o erro pode ser estimado pelo cálculo da distância entre o valor real e o estimado • Erro médio quadrático (MSE) mse(h) = 1/n ∑ (yi ≠h(xi))2 Distância absoluta média (MAD) mad(h) = 1/n ∑ abs((yi ≠h(xi))

  16. Cálculo de erro e precisão potência peso aceleração consumo 150.000000 3433.000000 12.000000 16.000000 170.000000 3563.000000 10.000000 15.000000 97.000000 2774.000000 15.500000 18.000000

More Related