450 likes | 576 Views
Séries. Temporais. de Previsão. Prof. Mirtênio. Introdução. Uma Série Temporal é um conjunto de observações tomadas em tempos determinados, comumente em intervalos iguais. Informações medidas ou coletadas com o decorrer do tempo, com valores de vendas semanais ou níveis de consulta mensais.
E N D
Séries Temporais de Previsão Prof. Mirtênio
Introdução Uma Série Temporal é um conjunto de observações tomadas em tempos determinados, comumente em intervalos iguais. Informações medidas ou coletadas com o decorrer do tempo, com valores de vendas semanais ou níveis de consulta mensais.
Modelos Temporais Lineares Em muitas situações de negócios nas quais estão envolvidas variáveis, os valores de modelos temporais lineares indicam algum tipo de padrão marcado no decorrer do tempo. Os dados coletados no decorrer de um período de tempo geralmente são chamados de séries temporais. Esses tipos de dados normalmente são exibidos em um gráfico de linha com período de tempo formando o eixo x e valores de dados exibidos no eixo y.
EXEMPLO - Modelos Temporais Lineares Exemplo 1: Faça o gráfico dos dados contidos na tabela a seguir que indicam o número de licenças de televisão em cores possuídas no final de cada ano, de 1991 a 1998.
Tendência em Séries Temporais A palavra tendência normalmente é usada para descrever a direção oculta de uma série temporal. No exemplo 1, os dados possuem uma tendência ascendente, já que claramente aumentam com o tempo. Além disso, a tendência é razoavelmente linear nesse caso. A estimativa de linhas retas que passem pelos dados com o padrão linear utilizando Regressão linear já discutida no Módulo C. Encontre um modelo de regressão linear que se encaixe aos dados do Exemplo 1 e adicione-o ao gráfico. Ao modelar dados de séries temporais, é comum utilizar uma série ordenada para substituir os anos, dias da semana etc., nos cálculos – isso evita problemas ao encaixar os dias da semana ou trimestre na estrutura do Modelo.
Período de tempo Nº de Licenças Tendência em Séries Temporais Assim como com todos os modelos de regressão, x é a variável independente e y é a variável dependente. Obviamente, aqui o período de tempo é a variável x, e o número de licenças de TV em cores é a variável y. Os coeficientes de regressão linear podem, então, ser calculados como de costume:
Equação de Regressão Linear A equação de regressão linear é y = 0,59x + 17,94. Isso também poderá representar o Número de Licenças = 17,94 + 0,59 * período de tempo (com os valores finais arredondados para duas casas decimais, em cada caso) e onde o “período de tempo” simplesmente representa a variável ordenada utilizada na construção do modelo.
Fazendo Previsões utilizando Modelos Lineares Simples Uma vez que o modelo linear tenha sido estimado, a produção de previsões é relativamente direta. Entretanto, deve-se lembrar que na previsão para o futuro utiliza-se a extrapolação – supõe-se que o padrão visto no passado continuará no futuro. Para modelos de séries temporais, isso normalmente é razoável. Utilizando o mesmo exemplo para prever as licenças de TV em cores possuídas nos próximos três anos. O modelo produzido foi: Número de Licenças = 17,94 + 0,59 * período de tempo Como os períodos de tempo considerados nos dados originais vão até 8, os três seguintes serão 9, 10 e 11. Substituindo isso na equação, teremos:
Componentes de uma Série Temporal O modelo linear simples considerado anteriormente é adequado para Prever dados de série temporais que indicam um forte padrão linear ao longo do tempo. E se a série temporal não indicar esse tipo de crescimento ou declínio, mas, em vez disso, indicar algum tipo de padrão repetido? Por exemplo, é fácil imaginar uma situação em que o valor de uma variável Sistematicamente muda no decorrer de um ano, como ilustrado no gráfico:
Componentes de uma Série Temporal Os tipos de modelos lineares discutidos anteriormente claramente não seriam adequados a essa situação. Em vez disso, a série temporal é dividida em vários componentes, e eles são cada um previstos separadamente . Dois modelos desse tipo são discutidos neste texto: em um, os elementos são somados para formar a série de dados (e é, portanto chamado de modelo aditivo). No outro, eles são multiplicados ( e é chamado um modelo multiplicativo). O modelo aditivo geralmente é considerado mais adequado para os dados em que flutuações sazonais permanecem aproximadamente do mesmo tamanho com o tempo (conforme gráfico a seguir). Enquanto o modelo multiplicativo é normalmente aplicado a dados em que o tamanho dos efeitos sazonais aumenta (conforme gráfico a seguir).
Gráfico: Exemplo de dados de série temporal para o uso em um modelo Aditivo.
Gráfico: Exemplo de dados de série temporal para o uso em um modelo Multiplicativo.
Médias Variáveis Médias variáveis são freqüentemente utilizadas para atenuar variações em um conjunto de dados com o objetivo de isolar a parte da tendência dos dados para que possam ser feitas previsões de valores futuros dessa tendência. As médias são geralmente tomadas ao longo do período natural dos dados (a quantidade de tempo na qual o padrão sazonal repete-se). Para dados trimestrais, ele é normalmente 4, para dados diários, 5 ou 7, dependendo do número de dias sendo considerado etc. A média variável é chamada de média variável de n-pontos, com n sendo o número de valores que entram para formar a média, exemplo, uma média variável de 4 pontos para dados trimestrais. Geralmente, ela é encontrada calculando-se a média de cada n observações que se formam, sucessivamente, a cada vez que se “suprime” o primeiro ponto da seqüência e se “inclui” o próximo. A tendência é calculada de modo um pouco diferente, dependendo de se os dados possuem um período ímpar ou par. As diferentes abordagens serão ilustradas por exemplo.
Médias Variáveis de um Número Ímpar de Pontos Exemplo 2: Considere o seguinte conjunto de dados, que representa o número de consultas recebidas por operadores de telefone trabalhando em uma linha de auxílio ao cliente: Utilize médias variáveis para produzir valores de tendências para esses dados. Fazer um gráfico inicial dos dados é sempre uma boa idéia, para identificar padrões claros, para identificar o período dos dados (se houver algum) e geralmente ter uma idéia do que está acontecendo. Veja o gráfico a seguir:
Médias Variáveis de um Número Ímpar de Pontos Com base nisso, pode-se ver que existe um padrão claro repetindo- se a cada cinco dias, confirmando que uma média variável de cinco pontos deve ser utilizada. Observe a posição dos resultados na tabela seguinte: como a média variável é uma medida de tendência central, os resultados são colocados no meio do conjunto de cinco valores que entram para formar cada média. Assim, devem ser deixados espaços na parte superior e na inferior da coluna. O gráfico mostra que as médias variáveis possuem um padrão linear ascendente, isto é, a tendência nos dados é, de modo geral, ascendente.
Gráfico: As médias variáveis, que representam a tendência (T) dos dados podem ser adicionadas ao gráfico abaixo:
Nomenclaturas Os componentes utilizados para criar esses modelos geralmente são chamados de tendência, fatores sazonais, fatores cíclicos e fatores residuais ou aleatórios. Tendência (T) - Como já discutido para os dados lineares simples, a tendência é o movimento oculto nos dados – ela pode ser ascendente, descendente ou estacionária. Fatores Sazonais (S) – Essas são flutuações regulares dentro de um período completo de tempo (um dia, uma semana, um mês etc.). O importante sobre os fatores sazonais é que eles representam um tipo de padrão que se repete; nesse exemplo os picos e depressões são associados a cada trimestre e repetem-se uma vez por ano. Fatores Cíclicos (C) – Estas são flutuações a longo prazo nos dados e são similares aos fatores sazonais. Eles podem ser difíceis de ser identificados, a menos que uma longa série de dados esteja disponível. Eles podem estar relacionados a fatores econômicos, exemplo, as vendas de pacotes de feriados podem reduzir durante períodos de recessão.
Nomenclaturas Fatores Aleatórios ou Residuais (E) – Como em qualquer análise estatística, haverá algum elemento imprevisível nos dados. Nos dados mostrados no exemplo anterior, isso pode ser devido a algo como condições de tempo incomuns que afetem as vendas de pacotes de feriados. Como, por sua natureza, os efeitos não podem ser previstos, eles estarão presentes nos modelos desenvolvidos aqui, mas não serão previstos de nenhum modo. Como os elementos críticos não serão considerados detalhadamente neste módulo e os elementos aleatórios são impossíveis de se prever, construir o modelo consiste em isolar os dois componentes previsíveis: a Tendência e os efeitos sazonais. Estes serão considerados separadamente.
Prevendo os Efeitos Sazonais Uma vez que a tendência tenha sido isolada e prevista de acordo com um modelo de regressão linear baseado em médias variáveis, o problema que permanece é como identificar e prever os efeitos sazonais (a parte flutuante dos dados). O uso da regressão dos quadrados mínimos para produzir um modelo linear de séries temporais já foi discutido no módulo anterior, utilizar os valores de médias variáveis (tendência) como os dados y, e o período de tempo como os dados x produzirá uma equação que pode ser, então, utilizada para prever a tendência. Daqui em diante, T será utilizada para representar a tendência (encontrada por meio das médias variáveis), e y será reservado para representar os dados originais não trabalhados. Logo, a equação de regressão para explicar a parte da tendência dos dados terá a forma: T = ax + b Onde T é a média variável centrada, e x é o período de tempo. Vamos calcular a e b, utilizando a regressão linear.
O modelo Aditivo Neste modelo, supõe-se que os componentes da série são somados para formar os dados, isto é, y = T + S + C + E A previsão dos efeitos cíclicos não será considerada aqui, o modelo reduz-se efetivamente a: y = T + S + E O componente de tendência já foi encontrado com o uso de médias variáveis - então, os termos sazonais (e de erros) podem ser isolados, subtraindo-se a tendência dos dados originais, isto é: S + E = y – T Como afirmado anteriormente, o componente de erro não pode ser isolado diretamente. Entretanto, ele pode ser minimizado calculando-se a média dos efeitos sazonais para cada período de tempo, para obter-se um conjunto de fatores para previsões.
Observação As médias variáveis, mais do que uma tendência calculada com base na equação, são utilizadas para dar maior precisão. É feito, então, um resumo desses efeitos sazonais. Existem três valores para quarta-feira (10,8; 10,2 e 9,4); dois para terça-feira (13,6 e 14,6) etc. Eles são diferentes porque o efeito aleatório ainda está presente. Para minimizá-lo, é feita a média dos valores de cada dia da semana.
Soma dos fatores. Número de fatores = 5 Dias da semana, aqui. Em um modelo aditivo, a soma dos fatores finais deve ser 0 (zero). Aqui, eles somam -1,06667 (o efeito aleatório total), então é necessário ajustar cada fator um pouco, “compartilhando” este total entre os efeitos sazonais. O valor a ser ajustado em cada fator é As médias ajustadas são, então:
A soma final não é exatamente 0 (zero) devido aos erros de arredondamento (passando de quatro a duas casas decimais), mas –0,01 é aceitável. Para encontrar as previsões finais, a tendência (da equação de regressão) e os efeitos sazonais são combinados: como o modelo é aditivo, eles são somados um ao outro. Como segunda-feira da semana 1 = período de tempo 1, continuando a contagem, temos segunda-feira da semana 4 igual ao período de tempo 16.
Gráfico: As médias variáveis, que representam a tendência (T) dos dados podem ser adicionadas ao gráfico abaixo:
Médias Variáveis de um Número Par de Pontos Exemplo 3: Produza estimativas da tendência para os seguintes dados sobre vendas trimestrais de pacotes de feriado. Veja a seguir o gráfico referente a esses dados:
Gráfico Nesse caso, fica claro, pelo gráfico, que os dados se repetem em quatro trimestre – então, é necessária uma média variável de quatro pontos. Se o período dos dados for par, como aqui, é necessário um passo extra. Isso porque para quatro números, o “centro” é entre dois pontos de dados e, portanto, encontra-se fora da linha dos valores originais – então, nenhuma comparação direta é possível. Para superar isso, os valores das médias variáveis ainda são calculados da mesma forma, mas são utilizados, então, para formar uma média variável centrada ou de dois pontos, que então é utilizada para representar a tendência.
=(3.576 + 2.927 + 2.710 + 2.364)/4 =(2.927 + 2.710 + 2.364 + 3.462)/4 =(2.894,25 + 2.865,75)/2 =(2.865,75 + 2.790,75)/2 E assim por diante ...
O modelo Multiplicativo Aqui, o modelo oculto supõe que os componentes são multiplicados um pelo outro, para formar os dados gerais: y = T * S * C * E Como com o modelo aditivo, nas situações simples examinadas aqui, os efeitos cíclicos serão descartados, assim: y = T * S * E Logo, em vez de subtrair a tendência dos dados originais para deixar os termos sazonais (e erros) para trás, neste modelo, os dados originais são divididos pela tendência: Novamente, os termos de erros são minimizados de forma similar à do modelo aditivo e, uma vez que esses efeitos sazonais tenham sido isolados, eles são previstos separadamente da tendência. Os dois componentes são, então, multiplicados para fornecer uma previsão final para os dados originais. Veja os detalhes dos cálculos:
2.710 / 2.880,000= 2.364 / 2.828,250= 3.462 / 2.741,375= E assim por diante ...
Como no modelo aditivo, é necessário obter um valor médio para cada período de tempo, já que haverá algum elemento aleatório presente (o que explica porque os fatores de cada um dos quatro trimestres não são Idênticos).
Novamente, as médias são somadas umas às outras. No modelo multiplicativo, elas devem ser somadas ao número de períodos (quatro, aqui), e o ajuste “compartilhado” é feito multiplicando-se cada uma das médias sazonais originais por: Então, aqui: Número de períodos = 4 Soma dos efeitos sazonais = 3,9980 O fator de ajuste é:
=1,2482 * 1,0005 =1,0087 * 1,0005 =0,9457 * 1,0005 =0,7954 * 1,0005 Checando os valores sazonais para somar a quatro: ∑ (efeito sazonais) = 1,249 + 1,009 + 0,946 + 0,796 = 4,000
Assim, em média, no trimestre 1 os dados são 1,249 vezes da tendência, no trimestre 2 são 1,009 vezes o valor da tendência etc. As duas partes dos dados (a tendência e efeito sazonais) podem, então, ser combinados em uma previsão para os dados originais. A única diferença do modelo aditivo é que os valores são multiplicados uns com os outros para fornecer as previsões finais (em vez de somá-los). Dado que em 1996, trimestre 1 = período de tempo 1 e prosseguindo a contagem, temos 2000, trimestre 1 = período de tempo 17, então:
Gráfico Gráfico original
Gráfico Gráfico com médias variadas
Gráfico Gráfico com médias variadas e com previsões.