130 likes | 217 Views
Previsão de consumos. Modelos de regressão Cláudio Monteiro. Modelos de Regressão. Se conhecer uma relação linear entre as variáveis dependentes e independentes podemos estimar o valor de Z em cada ponto. Valor estimado da variável dependente. Variável dependente para o ponto Pj.
E N D
Previsão de consumos Modelos de regressão Cláudio Monteiro Distribuição de Energia II 5º ano da LEEC - ramo de Energia (FEUP)
Modelos de Regressão Se conhecer uma relação linear entre as variáveis dependentes e independentes podemos estimar o valor de Z em cada ponto. Valor estimado da variável dependente Variável dependente para o ponto Pj Variáveis independentes Vi, no ponto Pj Parâmetros da regressão para a variável Vi A estimativa da variável dependente, com base na regressão, terá um erro (resíduo):
Modelos de RegressãoMínimos quadrados Consideremos um problema com 3 pontos P1,P2 e P3 e 2 variáveis independentes V1 e V2. Para encontrar os parâmetros usamos o método dos mínimos quadrados, que consiste em minimizar o quadrado dos resíduos.
Modelos de RegressãoMínimos quadrados A derivada parcial em ordem a cada um dos parâmetros será: Resolvendo o sistema de equações temos: Exemplo: DE2_A3_MQ.xls
Modelos de regressãoComo escolher variáveis • Seleccionar uma grande lista de variáveis • Com base na experiência escolher variáveis que estão relacionadas com a grandeza a prever • Decompondo o modelo em vários • Decompor por tipo de consumidor (industrial, doméstico, comercial, etc.) • Decompor por sazonalidade (por trimestre, por dia da semana, por hora do dia , etc.) • Estruturar os modelos • Analisar as dependências entre as variáveis e recalcular as séries de forma que as dependências sejam mais evidentes (ex. prever o consumo per-capita em vez de prever o consumo global) • Analisar dependências temporais entre as variáveis (desfasamentos temporais, médias móveis, etc.)
Modelos de regressãoComo escolher variáveis • Visualizar gráficos ZXi • Observar a relação entre as variável dependente e independente, se não existir relação elimine a variável • Visualizar gráficos XiXj • Observar a relação entre as variáveis explicadoras, eliminar variáveis em pares altamente correlacionadas evitando colinearidade • Testes de significância • Fazer a regressão, observar estatísticas e significâncias (R, t-teste, F-teste), excluir variáveis sem significância. • NOTA: Existem métodos formais implementados em software para a escolha das variáveis (ex. “subset regression”, “stepwise regression”, etc.)
Modelos de regressãoFerramentas úteis Gráficos “scaterplot” ZXi e XiXj. Fornece informação visual sobre as correlações entre as várias variáveis independentes XiXj e entre estas e a variável dependente ZXi. Também é possível observar estas relações por classes (na figura vemos diferentes cores para cada trimestre)
Modelos de regressãoFerramentas úteis Gráficos CCF (Cross-correlation funtion) Permitem avaliar as dependências temporais (atrasos e avanços) entre a variável dependente e as variáveis explicadoras. NOTA: é necessário ter prática e cuidado na interpretação destes gráficos.
Modelos de regressãoFerramentas úteis Coeficiente de determinação R2 Desvio explicado R2 representa a proporção da variável dependente Z que pode ser explicada pela regressão (valor entre 0 e 1 em que valores mais elevados correspondem a melhores regressões). Desvio não explicado R2 ajustado é o valor ajustado de R2 tendo em conta o nº de pontos e o número de variáveis independentes Desvio total
Modelos de regressãoFerramentas úteis F - teste É a razão entre a variância devida à regressão e a variância devida ao erro. Já tem em conta o número de pontos n e o número de variáveis k. F deve ser elevado e a significância de F deve ser inferior a 0.05 (teste de hipótese: probabilidade dos parâmetros da regressão serem 0). ANOVA (ANalysis Of VAriance) Analisa a variância verificando a aceitabilidade do modelo do ponto de vista estatístico
Modelos de regressãoFerramentas úteis t - teste Permite avaliar a importância de cada variável independente no conjunto de variáveis do modelo. Cada coeficiente de regressão tem uma variância associada É com base nesta variância que é calculado t A significânciade t é uma medida da importância (<0.05) relativa da variável (teste de hipótese: probabilidade desse parâmetro ser 0) % não explicável por outras variáveis Análise de colinearidade
Modelos de regressãoFerramentas úteis Transformações de funções não lineares em lineares
Modelos de regressãoMedidas de erro Erro médio (ME) Erro médio absoluto (MAE) Erro médio quadrático (MSE) Erro médio percentual (MPE) Erro médio absoluto percentual (MPE)