Séries temporais — definições e características

Jéssica Assunção
Dadosfera
Published in
6 min readMay 21, 2020

Estimativas de incertezas, prever o futuro baseado em dados, antecipar acontecimentos para tomada de decisões assertivas — esses são alguns dos poderes da estatística que mais encantam e despertam interesse de diversas áreas.

Pense na crise mundial que estamos vivendo devido à pandemia do Covid-19. À medida que o vírus foi se espalhando ao redor do mundo, previsões, gráficos, estimativas e análises foram sendo produzidos e divulgados para conhecimento da população em geral.

Tudo isso para ajudar no combate a essa pandemia!

Para que todas essas análises fossem possíveis, foi preciso estudar o comportamento da variável referente ao número novos de casos de Covid-19 registrados. A análise dessa variável nada mais é que a chamada análise de séries temporais em estatística.

O que são séries temporais?

Quando utilizamos um modelo de regressão linear para fazer previsões, a ordem com a qual as observações são inseridas no modelo é irrelevante. Ou seja, a variável de interesse é independente e não tem nenhuma estrutura de correlação associada.

Em séries temporais, é importante destacar que a correlação dos dados não pode ser desconsiderada, devido a uma possível dependência dos dados que estão organizados no tempo. Essa organização ou estrutura dos dados é gerada uma vez que os dados variam no tempo.

A variável referente ao número de casos do Covid-19 é uma série temporal por se referir a um conjunto de dados ordenados no tempo. Ou seja, se eles forem apresentados de forma independente, sem levar em consideração o tempo, eles não fazem sentido. Isso porque o número de casos de um determinado dia é dependente do dia anterior, e podemos aprender com esse passado.

A apresentação gráfica de uma série temporal é bem familiar, como vemos a seguir:

Figura 1: Série temporal do número de casos do Covid-19 no Brasil em 2020

Podemos enumerar muitas outras áreas onde este tipo de dado pode aparecer e ter destaque devido a essa capacidade preditiva.

Na economia, com dados semanais referentes a bolsa de valores e taxas de interesse, vendas mensais e índices de preços. O comportamento e possíveis previsões de uma série temporal da bolsa de valores pode movimentar e estimular investidores. Os dados econômicos de um país como IPCA, índice nacional de preços ao consumidor amplo, organizados em uma série temporal, podem fornecer insights econômicos e movimentar tomadas de decisões do governo.

Em climatologia, quando observamos a temperatura diária ou índice pluviométrico mensal estruturados em uma série temporal e observando seu comportamento a longo prazo, pode ajudar nas medidas protetivas contra desastres naturais, em tomadas de decisões para um agricultor determinar a melhor hora de colher e plantar.

Uma lista extensa de outras áreas, geofísica, engenharia, controle de qualidade e etc, podem ser beneficiadas com a análise de séries temporais.

Características de uma série temporal

Uma série temporal sempre carrega consigo componentes associados como tendência e sazonalidade, e podem ser estacionárias ou não estacionárias. A forma de análise dessa série, isto é, o tipo de modelo a ser utilizado, é dependente dessas características. Vamos entender cada um desses componentes a seguir.

  • Tendência

A tendência de uma série temporal é definida com base em seu crescimento/decrescimento em um determinado período de tempo. Isto é, para esse período de tempo estabelecido, a tendência indica se a série cresce, decresce ou permanece estável.

Para o número de casos do Covid-19, é de extrema importância saber qual a sua tendência a curto, médio e longo prazo e, assim, ter um insight sobre a demanda hospitalar, por exemplo.

  • Sazonalidade

Quando é possível identificar na série temporal padrões de comportamento, ou seja, oscilações de subida ou descida, que ocorrem em períodos específicos, seja semana, mês ou ano.

Ainda não se tem registros a longo prazo do Covid-19 e também não se sabe muito do que esperar do seu comportamento a longo prazo. Mas podemos pensar na série temporal referente a uma gripe comum, onde se sabe que de acordo com a queda de temperatura há um aumento no número de casos. Então a série temporal terá um comportamento sazonal, com aumento de casos no outono/inverno e decaimento de casos na primavera/verão.

  • Estacionariedade

Se uma série temporal se comporta de forma aleatória ao longo do tempo e em torno de uma média constante, ela é dita estacionária.

Na prática, é mais comum que encontremos séries não estacionárias, como a série do Covid-19 apresentada na Figura 1, que não tem um comportamento sazonal, mas tem uma tendência crescente.

Séries temporais que possuem algum tipo de tendência e/ou sazonalidade são não estacionárias!

Antes da modelagem, além de entender as características descritas acima antes da modelagem é preciso entender a função de autocorrelação de uma série temporal.

A autocorrelação indica o valor de correlação de variável da série temporal em um determinado instante de tempo com as demais observações. A função de autocorrelação, FAC, contém os valores da autocorrelação em função do intervalo de tempo em que foi calculado.

Ou seja, os valores da função de autocorrelação são organizados em ordens, de acordo com a distância entre as observações. A autocorrelação de primeira ordem indica a dimensão da correlação se as observações estão distantes em uma unidade de tempo e a correlação de segunda ordem indica a dimensão da correlação com as observações distantes em duas unidades de tempo. A unidade de tempo seria o período no qual a série está sendo observada.

No exemplo apresentado do Covid-19, em que temos uma série temporal diária, a unidade de tempo é o dia. Mas a unidade de tempo pode ser a semana, mês, ano, etc.

Análise de Séries Temporais

A análise de uma série temporal significa descrevê-la e verificar suas características mais importantes, tendo em vista dois objetivos principais: modelagem e previsão.

Modelar significa descrever um fenômeno através de um modelo matemático. Prever significa usar o entendimento dos dados históricos para descobrir os próximos valores da série.

Existe uma literatura extensa de análise de séries temporais focada em desenvolver modelos apropriados, que podem variar desde os mais simples e intuitivos e chegar até modelos complexos que demandam um maior tempo de trabalho.

Temos os chamados modelos ingênuos, onde assumimos que o valor previsto é igual ao último valor observado. Modelos automáticos que incorporam modelos de regressão, de médias móveis, ajustamento sazonal e alisamento exponencial. Temos também a popular classe de modelos conhecida como ARIMA, modelo autorregressivo integrado de médias móveis.

Aplicando o ponto de vista Bayesiano a séries temporais, temos também metodologias desenvolvidas como a classe de modelos lineares dinâmicos, onde os parâmetros podem variar com o tempo.

Pontos de Mudança / Quebras estruturais

Uma série temporal pode ser afetada por eventos externos, chamados de intervenções, que afetam o valor e o comportamento da variável referente a uma série temporal.

Esse comportamento é visto recorrentemente para o caso da série temporal do Covid-19, quando observamos mudanças no comportamento que já vinha sendo observado. E sabemos que essas mudanças são resultado de fatores externos, como. por exemplo, um maior nível de isolamento social que implica em uma mudança na tendência de crescimento da série, fazendo com que ela cresça mais lentamente.

Essas intervenções que ocorrem podem alterar a estrutura da série e resultar em um problema de ponto de mudança ou quebra estrutural.

Esse problema também ocorre em diversas outras áreas, como por exemplo, a eleição de um novo presidente, que pode mudar a forma como as taxas econômicas se comportam, ou o anúncio de uma nova medida protetiva de trânsito, que muda o padrão do número de acidentes de trânsito.

Como é um problema recorrente em diversas áreas, os problemas de ponto de mudança também possuem uma volumosa literatura que sugere como tratá-los. Geralmente, o que é feito inicialmente é detectar ou estimar aonde estão esses pontos de mudança, para então se usar uma metodologia específica.

Existem vários métodos que podem ser explorados envolvendo Algoritmos Sequenciais, Decomposição Wavelet, Monte Carlo, Abordagem Bayesiana, Teste de Taxa de Probabilidade Sequencial, Cartas de Controle CUSUM, Redes Neurais, Cadeia de Markov, entre outros.

Assim, uma vez que o estudo de séries temporais é uma tema amplo e profundo da estatística, há uma literatura muito vasta sobre o assunto que fornece para diversas áreas uma forma eficiente de fazer previsões e tomar decisões.

O real e precioso impacto de tomar decisões baseadas em dados já mostrou seu valor para o mercado. Para também se aprofundar no tema você pode começar por: Análise de Séries Temporais, Pedro A. Morettin , Clélia M. C. Toloi.

DataSprints é um consultoria de inteligência de dados que utiliza estatística e ciência de dados em conjunto com Inteligência Artificial para responder essas questões para sua empresa.

--

--