110 likes | 200 Views
Predição Data Mining Aula 13 Sandra de Amo. Predição. O que é Classificação: prevê o valor de um atributo classe Predição: prevê o valor de um atributo qualquer, contínuo Exemplos Predizer o salário dos mestres formados no PPG-CC após 10 anos de experiência.
E N D
PrediçãoData Mining Aula 13Sandra de Amo Pós-graduação em Ciência da Computação - UFU
Predição • O que é • Classificação: prevê o valor de um atributo classe • Predição: prevê o valor de um atributo qualquer, contínuo Exemplos • Predizer o salário dos mestres formados no PPG-CC após 10 anos de experiência. • Predizer o potencial de venda de um produto dado o seu preço. Pós-graduação em Ciência da Computação - UFU
Tarefa de Predição • Dados: Conjunto de vetores de n+1 variáveis (x1,x2,…,xn,y) dois tipos de variáveis • x1, x2, ..., xn = variáveis explicativas • Y = resposta (variável cujo valor se quer predizer) • Objetivo: “descobrir” uma função “preditora” • f: Rn R Pós-graduação em Ciência da Computação - UFU
Métodos • Regressão • Metodologia estatística desenvolvida pelo matemático Sir Frances Galton (1822-1911) • Tipos de Regressão • Regressão linear • Regressão não linear (polinomial, exponencial) • Outros métodos: • Classificador KNN pode ser utilizado como preditor • Redes Neurais podem ser adaptadas para atuarem como preditores Pós-graduação em Ciência da Computação - UFU
Método da regressão linear simples • Problema (no caso de duas variáveis) • Input: • banco de dados de m amostras completas (X,Y) com valores contínuos. • Output: • Reta F(x) = w1 x + w0 que minimiza o erro quadrático SSE SSE = Pós-graduação em Ciência da Computação - UFU m Σ (yi – f(xi)) 2 i=1
Regressão Linear Y = w0 + w1 X w0 = ? w1 = ? Y’ Pós-graduação em Ciência da Computação - UFU X’
Regressão Linear Função Preditora = reta m w1 = Σ (xi – x)(yi – y) F(x) = w1 X + w0 i = 1 m 2 Σ (xi – x) i = 1 w0 = y – w1 x Pós-graduação em Ciência da Computação - UFU x = média dos valores de x1, ... ,xm y = média dos valores de y1, ... ,ym Equação da reta “preditora” y = w0 + w1x
Exemplo X = anos de experiência y = salário (em R$ 100) 30 57 64 72 36 43 59 90 20 83 3 8 9 13 3 6 11 21 1 16 Pós-graduação em Ciência da Computação - UFU Predizer o salário de um mestre formado no PPG-CC após 10 anos de experiência
Exemplo W1 = (3-9.1)(30-55.4) + (8 – 9.1)(57-55.4) +... + (16-9.1)(83-55.4) = 3.5 (3 – 9.1)2 + (8 -9.1)2 + (16 – 9.1)2 W0 = 55.4 – (3.5)(9.1) = 23.6 Pós-graduação em Ciência da Computação - UFU Equação da reta Y = 23.6 + 3.5 X Usando esta equação, concluimos que depois de 10 anos de experiência, a previsão de salário é de Y = 23.6 + 3.5*10 = 58.6 ou R$ 5860,00
Generalização • Regressão com múltiplas variáveis • Y = w0 + w1x1 + w2x2 • Regressão polinomial • Y = w0 + w1x + w2x + w3x • x = x1, x = x2, x = x3 • Reduz-se a regressão linear a várias variáveis Pós-graduação em Ciência da Computação - UFU 2 3 2 3
Acurácia de Preditores • Seja D um banco de dados de testes da forma (X1,y1), ..., (Xn, yn). • y’1, y’2, ..., y’n : valores preditos • Média do erro absoluto = Σ|yi – y’i| • Média do erro quadrático= Σ|yi – y’i|2 • Erro absoluto = Σ|yi – y’i| • Erro quadrático = Σ|yi – y’i|2 n Pós-graduação em Ciência da Computação - UFU n