1 / 11

Predição Data Mining Aula 13 Sandra de Amo

Predição Data Mining Aula 13 Sandra de Amo. Predição. O que é Classificação: prevê o valor de um atributo classe Predição: prevê o valor de um atributo qualquer, contínuo Exemplos Predizer o salário dos mestres formados no PPG-CC após 10 anos de experiência.

Download Presentation

Predição Data Mining Aula 13 Sandra de Amo

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. PrediçãoData Mining Aula 13Sandra de Amo Pós-graduação em Ciência da Computação - UFU

  2. Predição • O que é • Classificação: prevê o valor de um atributo classe • Predição: prevê o valor de um atributo qualquer, contínuo Exemplos • Predizer o salário dos mestres formados no PPG-CC após 10 anos de experiência. • Predizer o potencial de venda de um produto dado o seu preço. Pós-graduação em Ciência da Computação - UFU

  3. Tarefa de Predição • Dados: Conjunto de vetores de n+1 variáveis (x1,x2,…,xn,y) dois tipos de variáveis • x1, x2, ..., xn = variáveis explicativas • Y = resposta (variável cujo valor se quer predizer) • Objetivo: “descobrir” uma função “preditora” • f: Rn R Pós-graduação em Ciência da Computação - UFU

  4. Métodos • Regressão • Metodologia estatística desenvolvida pelo matemático Sir Frances Galton (1822-1911) • Tipos de Regressão • Regressão linear • Regressão não linear (polinomial, exponencial) • Outros métodos: • Classificador KNN pode ser utilizado como preditor • Redes Neurais podem ser adaptadas para atuarem como preditores Pós-graduação em Ciência da Computação - UFU

  5. Método da regressão linear simples • Problema (no caso de duas variáveis) • Input: • banco de dados de m amostras completas (X,Y) com valores contínuos. • Output: • Reta F(x) = w1 x + w0 que minimiza o erro quadrático SSE SSE = Pós-graduação em Ciência da Computação - UFU m Σ (yi – f(xi)) 2 i=1

  6. Regressão Linear Y = w0 + w1 X w0 = ? w1 = ? Y’ Pós-graduação em Ciência da Computação - UFU X’

  7. Regressão Linear Função Preditora = reta m w1 = Σ (xi – x)(yi – y) F(x) = w1 X + w0 i = 1 m 2 Σ (xi – x) i = 1 w0 = y – w1 x Pós-graduação em Ciência da Computação - UFU x = média dos valores de x1, ... ,xm y = média dos valores de y1, ... ,ym Equação da reta “preditora” y = w0 + w1x

  8. Exemplo X = anos de experiência y = salário (em R$ 100) 30 57 64 72 36 43 59 90 20 83 3 8 9 13 3 6 11 21 1 16 Pós-graduação em Ciência da Computação - UFU Predizer o salário de um mestre formado no PPG-CC após 10 anos de experiência

  9. Exemplo W1 = (3-9.1)(30-55.4) + (8 – 9.1)(57-55.4) +... + (16-9.1)(83-55.4) = 3.5 (3 – 9.1)2 + (8 -9.1)2 + (16 – 9.1)2 W0 = 55.4 – (3.5)(9.1) = 23.6 Pós-graduação em Ciência da Computação - UFU Equação da reta Y = 23.6 + 3.5 X Usando esta equação, concluimos que depois de 10 anos de experiência, a previsão de salário é de Y = 23.6 + 3.5*10 = 58.6 ou R$ 5860,00

  10. Generalização • Regressão com múltiplas variáveis • Y = w0 + w1x1 + w2x2 • Regressão polinomial • Y = w0 + w1x + w2x + w3x • x = x1, x = x2, x = x3 • Reduz-se a regressão linear a várias variáveis Pós-graduação em Ciência da Computação - UFU 2 3 2 3

  11. Acurácia de Preditores • Seja D um banco de dados de testes da forma (X1,y1), ..., (Xn, yn). • y’1, y’2, ..., y’n : valores preditos • Média do erro absoluto = Σ|yi – y’i| • Média do erro quadrático= Σ|yi – y’i|2 • Erro absoluto = Σ|yi – y’i| • Erro quadrático = Σ|yi – y’i|2 n Pós-graduação em Ciência da Computação - UFU n

More Related