Séries Temporais

Conjunto de observações ordenadas no tempo.

Séries Temporais

Se n>=50, chame-se sucessão cronológica.

Elementos de uma série temporal:

Medida (indice, preço, temperatura...)
Fato (Ibovespa, Saca do cafe, temperatura de uma cidade...)
Unidade de tempo (hora, dia, mês, ano...)
Univariadas: Apenas uma variável conectada ao tempo
Multivariadas: DUas ou mais variáveis conectadas ao tempo

Objetivo do estudo de séries temporais

Investigação do mecanismo gerador dos dados;
Fazer previsões de valores futuros;
Descrever apenas o comportamento da série;
Procurar periodicidades relevantes na série;

Classificação das séries temporais

Determinísticas: Modelo determinístico, onde o valor futuro é determinado por um modelo matemático.
Estocásticas: Modelo estocástico, onde o valor futuro é determinado por um modelo probabilístico.

Media móvel

Media que se desloca ao longo do tempo.

Componentes de uma série temporal

Tendência: Crescimento, decrescimento ou estacionalidade da série temporal.
Sazonal*: Padrões que se repetem em intervalos regulares (dia, semana, mes...).
Cíclica: Padrões que se repetem em intervalos não regulares (sem período fixo e longos).

Muitas series apresentam junto a tendência, variações cíclicas e sazonais. Se estiverem presentes, a série é chamada de aditiva. Se a tendência for multiplicativa, a série é chamada de multiplicativa.

Aditiva:

Y = T + S + C + E

Multiplicativa:

Y = T * S * C * E

Onde:

Y: Valor da serie no tempo t
T: Componente de tendência para o instante t
S: Componente sazonal para o instante t
C: Componente cíclica para o instante t
E: Componente de erro para o instante t

O modelo aditivo é mais apropriado quando as variações sazonais são constantes ao longo do tempo. O modelo multiplicativo é mais apropriado quando as variações sazonais são proporcionais ao nível da série.

Decompondo uma serie temporal

Decompor a série temporal em:

Componente de tendencia
Componente de Sazionalidade
Residuos

Estatisticas de erro das previsões

-ME: Mean Error - é a média da diferença entre realizado e o previsto

erro_t = X_t - x_t
ME = (SUM erro_t)/h

**MAE: Mean Absolute Error **- é a média da diferença absoluta entre realizado e previsto

MAE = (SUM |erro_t|)/h

RMSE: Root Mean Square Error - É o desvio padrão total da amostra da diferença entre o previsto e o realizado

RMSE = sqrt(SUM (erro_t)^2)/h)

MPE: Mean Percentage Error - é a diferença percentual do erro

MPE = (SUM(erro_t/X_t)/h)*100%

MAPE: Mean Absolute Percentage Error - É a diferença absoluta percentual do erro

MAPE = (SUM(|erro_t/X_t|)/h)*100%

TIC: Theil Inequality Coefficient - Theil's U - É o grau de ajuste da previsão. Quanto menor, melhor. Zero é o ideal.

Theil's U = sqrt(SUM((x_t+1-X_t+1)/X_t)^2)/SUM((X_t+1-X_t)/X_t)^2))

ACF1: First-Order Autocorrelation Function - Autocorrelação dos residuos

ACF_k = cov(R_it, Ri,t-k)/variancia(Rit)

Metodos Simples

NAIVE: Projeta o último valor para o futuro
NAIVE SAZONAL: Considera o último valor no mesmo período de tempo (para séries com sazonalidade)
Média: usa a média histórica como previsão para o futuro
Drift: faz uma previsão que acompanha a tendência da série (equivale a traçar uma renta entre o primeiro e o último ponto)

Metodos mais complexos

Modelos de Suavização Exponencial (SES): Série temporal que não apresenta tendência e nem sazonalidade;
Suavização Exponencial de Holt (SEH): Série temporal com Tendência mas sem sazonalidade;
Suavização Exponencial de Holt-Winters: Série temporal com Tendência e Sazonalidade;

A característica principal da suavização exponencial é dar pesos maiores às observações mais recentes, captando melhor as mudanças de comportamento. Ao atribuir pesos maiores aos dados mais recentes, o modelo se torna mais sensível a mudanças recentes no comportamento da série temporal, adaptando-se melhor a tendências e variações.

O componente de tendência pode ser definido pelas médias móveis, sendo α um coeficiente entre [0, 1] que pondera a contribuição dos valores passados. O parâmetro α, de fato, controla o peso dado às observações passadas no cálculo da tendência. Valores de α mais próximos de 1 atribuem mais peso aos dados mais recentes, enquanto valores mais próximos de 0 dão mais peso aos dados mais antigos. A escolha de α influencia diretamente a suavidade da tendência estimada.

A suavização exponencial, como outros métodos de previsão, funciona melhor com um número razoável de observações. Com poucos dados, a estimativa dos parâmetros do modelo pode ser instável e as previsões menos precisas. É recomendado ter um histórico de dados suficientemente longo para obter resultados confiáveis.

O método de Suavização Exponencial de Holt é semelhante ao método de Suavização Exponencial Simples, mas, em vez de suavizar apenas o nível, ele utiliza uma nova constante de suavização para modelar a tendência da série.

O método de Holt é uma extensão do método de suavização exponencial simples. Enquanto o método simples considera apenas o nível da série, o método de Holt incorpora um componente de tendência, permitindo modelar séries com um comportamento crescente ou decrescente ao longo do tempo. A introdução de uma nova constante de suavização (β) permite ajustar a suavidade da tendência estimada.

O método de Suavização de Holt-Winters pode também ser chamado de método de Suavização Exponencial Tripla, pois é muito utilizado quando há necessidade de calcular previsões em séries temporais que possuem tendência e sazonalidade.

O método de Holt-Winters é frequentemente chamado de método de suavização exponencial tripla porque ele incorpora três componentes: nível, tendência e sazonalidade. Essa característica o torna uma ferramenta poderosa para modelar séries temporais com padrões sazonais, como dados de vendas mensais ou dados climáticos anuais.

Existem tanto modelos de Holt-Winters aditivos quanto multiplicativos. A escolha entre os dois depende do tipo de sazonalidade presente na série.

Modelos aditivos: A componente sazonal é adicionada ao nível e tendência. São mais adequados quando a magnitude da sazonalidade permanece relativamente constante ao longo do tempo. Modelos multiplicativos: A componente sazonal é multiplicada pelo nível e tendência. São mais adequados quando a magnitude da sazonalidade varia proporcionalmente ao nível da série.

Modelos ARIMA (Box-Jenkins)

Robusto: pode ser aplicado em praticamente qualquer tipo de série temporal
Funciona melhor com dados estáveis, com poucos outliers (embora podemos removê-los) - tsclean
Requer dados estacionários
Pode ser transformada usando diferenciação: remove tendências
Diferenciação: subtrai a observação atual da anterior
Diferenciação pode ser feita 1x: diferenciação de primeira ordem
Diferenciação2x:diferenciação de segunda ordem(mais raro)

ARIMA = (p,d,q)

ARIMA

p: Ordem do componente autoregressivo (AR). Indica a dependência do valor atual da série em relação a seus valores passados.
d: Ordem de diferenciação. Indica o número de vezes que a série é diferenciada para torná-la estacionária. -q: Ordem do componente de média móvel (MA). Indica a dependência do valor atual da série em relação aos erros de previsão passados.

Tipos de moelos ARIMA

Modelos autorregressivos (AR): avalia a relação entre os períodos (lags): autocorrelação – extrai a influência;
Integrado (I): Aplicado à diferenciação, quando necessário
Modelos médias móveis (MA): avalia erros entre períodos e extrai esses erros;
Modelos autorregressivos e de médias móveis (ARMA)
Modelos autorregressivos integrados e de médias móveis (ARIMA)

Teste de Ljung-Box

Após estimar um modelo ARIMA, é crucial verificar se os resíduos do modelo apresentam as características de um ruído branco. Um teste comumente utilizado para avaliar a autocorrelação dos resíduos e, consequentemente, a adequação do modelo, é o teste de Ljung-Box.

Por que o teste de Ljung-Box é importante?

Ruído branco: Se os resíduos forem um ruído branco, significa que eles são independentes e identicamente distribuídos, ou seja, não há nenhuma informação relevante nos resíduos que não tenha sido capturada pelo modelo. Autocorrelação: Se houver autocorrelação nos resíduos, isso indica que o modelo não capturou todas as dependências presentes nos dados, e portanto, o modelo não é adequado. Como o teste de Ljung-Box funciona?

O teste de Ljung-Box verifica se a autocorrelação dos resíduos é significativamente diferente de zero em um conjunto de defasagens. A hipótese nula do teste é de que não há autocorrelação nos resíduos até determinada defasagem. Se o valor-p do teste for menor que o nível de significância escolhido (por exemplo, 5%), rejeita-se a hipótese nula, indicando que há evidências de autocorrelação nos resíduos.

Outros testes para verificar a adequação do modelo ARIMA:

Teste de Durbin-Watson: Embora menos poderoso que o teste de Ljung-Box, o teste de Durbin-Watson também é utilizado para verificar a autocorrelação de primeira ordem nos resíduos. Análise gráfica dos resíduos: Gráficos como o gráfico de autocorrelação (ACF) e autocorrelação parcial (PACF) dos resíduos podem fornecer informações visuais sobre a presença de autocorrelação. Teste de normalidade: Os resíduos de um modelo ARIMA idealmente seguem uma distribuição normal. Testes de normalidade, como o teste de Shapiro-Wilk, podem ser utilizados para verificar essa suposição. Em resumo:

O teste de Ljung-Box é uma ferramenta fundamental na avaliação da adequação de um modelo ARIMA. Ao verificar a autocorrelação dos resíduos, ele ajuda a determinar se o modelo captura adequadamente a estrutura da série temporal.

Escolha dos Modelos

Critério de AIC – Critério de Informação de Akaike
O AIC estima a quantidade relativa de informações perdidas por um determinado modelo: quanto menos informações um modelo perde, maior a qualidade desse modelo e menor a pontuação AIC.
Critério de BIC – Critério de Informação Bayesiano
BIC mais baixoimplicaem melhor ajuste.

Critério de Informação de Akaike (AIC): O AIC é uma métrica utilizada para comparar e selecionar modelos estatísticos. Ele busca encontrar um equilíbrio entre a complexidade do modelo e sua capacidade de ajustar os dados. Informações perdidas: Quanto menor a quantidade de informação perdida por um modelo, melhor ele se ajusta aos dados. O AIC penaliza modelos mais complexos, evitando o overfitting (ajuste excessivo). Menor AIC: Um valor menor de AIC indica que o modelo é mais parcimonioso (simples) e explica os dados de forma mais eficiente.

Tanto o AIC quanto o BIC são critérios amplamente utilizados para seleção de modelos. BIC significa Critério de Informação Bayesiano e é diferente do AIC. Embora ambos busquem a mesma finalidade (seleção de modelos), possuem formulações e penalidades distintas.

Teste de Estacionariedade

[...] um processo estocástico é estacionário se suas média e variância forem constantes ao longo do tempo e o valor da covariância entre dois períodos de tempo depender apenas da distância ou defasagem entre os dois períodos, e não do período de tempo efetivo em que a covariância é calculada (ENDERS, 2003).

Teste de Dickey-Fuller (ADF):

Teste feito porque não se sabe se a série temporal possui mais de uma raiz unitária, pois o número de termos de diferenças defasadas é, muitas vezes, determinado empiricamente.

Hipótese nula: A série possui raiz unitária (ou seja, é não estacionária).
Hipótese alternativa: A série é estacionária (sem raiz unitária).
Objetivo: O teste ADF busca evidências para rejeitar a hipótese nula de raiz unitária, indicando que a série é estacionária.

Teste KPSS:

Hipótese nula: A série é estacionária em torno de uma tendência determinística ou em torno de uma média.
Hipótese alternativa: A série é não estacionária.
Objetivo: O teste KPSS busca evidências para rejeitar a hipótese nula de estacionariedade, indicando que a série é não estacionária.

Teste de Phillips-Perron (PP):

Hipótese nula: A série possui raiz unitária (ou seja, é não estacionária).
Hipótese alternativa: A série é estacionária.
Objetivo: Similar ao teste ADF, o teste PP busca evidências para rejeitar a hipótese nula de raiz unitária, indicando que a série é estacionária.

Para saber mais

Moderem Time Series Forecasting with Python
Forecasting: Principles and Practice, de Rob J Hyndman e George Athanasopoulos
Introdução à Séries Temporais
Analise de Séries Temporais

Objetivo do estudo de séries temporais​

Classificação das séries temporais​

Media móvel​

Componentes de uma série temporal​

Decompondo uma serie temporal​

Estatisticas de erro das previsões​

Metodos Simples​

Metodos mais complexos​

Modelos ARIMA (Box-Jenkins)​

Tipos de moelos ARIMA​

Teste de Ljung-Box​

Escolha dos Modelos​

Teste de Estacionariedade​

Teste de Dickey-Fuller (ADF):​

Teste KPSS:​

Teste de Phillips-Perron (PP):​

Para saber mais​