Séries Financeiras Correlacionadas em Operações de Arbitragem: Cointegração em Séries Temporais.

Gabriel Guilherme
Gabriel Guilherme
Published in
5 min readJan 15, 2019

Uma breve análise de dois ativos e sua correlação e cointegração no processo de decisão para operações do tipo Long & Short.

É comum observarmos, dentro do âmbito do processo decisório de operações de arbitragem (Long & Short) de que, a correlação é um dos fundamentos iniciais para operações na BOVESPA.

Iremos utilizar no exemplo a seguir as séries BBAS3 e BBDC4, que correspondem, respectivamente, aos papeis das empresas Banco do Brasil e Banco do Bradesco. As amostras estão datadas no período de 10/01/2017 à 11/01/2019 totalizando 493 amostras diárias (dias úteis).

Correlação dos papéis

O fato da correlação ter, em suma, grande importância nesse contexto é de que, ao assumir correlação positiva dos ativos (se BBAS3 subir, BBDC4 também sobe e vice-versa) é determinante nesse tipo de operação, pois será feito uma arbitragem, onde teremos, por exemplo, uma compra de BBAS3 e uma venda de BBDC4. Com isso, como são correlacionadas, o risco da operação tende a diminuir, e o ganho seria a diferença entre ambas as operações, tendo em vista que a correlação não pode ser perfeitamente positiva (=1) pois a operação tende a 0. A fatia do lucro (caso tenha, pois é renda variável) seria uma distorção entre os dois papéis, justamente pelo fato da correlação não ser perfeita.

Correlação de Pearson entre BBAS3 e BBDC4

Como podemos observar na figura acima, temos uma matriz, onde a correlação dos papéis é cerca de 93%!

A partir desse pressuposto, a ideia parte de criar um par de papéis, assumindo que um deles será a variável dependente (eixo y) e a outra variável a independente (eixo x). Com isso, é criado o Ratio, uma média móvel do ratio e uma variação entre os períodos médios (geralmente de 21 dias). Dessa forma, os desvios do par de ativos (Ratio maior ou menor) em relação a média, indica uma possível distorção e que possivelmente, em termos probabilísticos, possa voltar a sua média.

É possível fazer esse tipo de análise partindo de uma simples planilha de Excel, ou até mesmo através de plataformas de negociação que disponibilizam par de ativos, médias móveis e desvio padrão (com banda superior e inferior).

Obviamente, existem diversas formas de serem feitas essa análises. O intuito é apenas mostrar uma observação pessoal de uma base comum desse tipo de análise.

Cointegração e Séries Temporais

O fato de um simples teste de correlação (no Excel pode ser feita através da fórmula =CORREL e =PEARSON) determinar que esses pares de ativos possuem relação positiva pode causar um efeito chamado Regressão espúria. Estatisticamente as variáveis possuem relação, mas não causa-efeito, ou seja, pode estar faltando informação, ou até mesmo adicionar outra variável no modelo. Um exemplo cômico, é a comparação de acidentes envolvendo piscina com o número de participações do ator Nicolas Cage em filmes: link

Para avaliarmos se as séries são cointegradas, será feito o uso de alguns testes econométricos. Para isso, inicialmente é necessário avaliar estacionáriedade das séries, onde é desejado que as variáveis financeiras não sejam estacionárias. Isso se dá pelo fato de que será aplicado um modelo de regressão tradicional (mínimos quadrados ordinários), incluindo análises de testes t e f.

Correlogram — Rejeita a hipótese H0 e aceita a hipótese alternativa de que há a existência de raiz unitária. Portanto, nesse teste as variáveis são não estacionarias
Dickey-Fuller — t-Statistic está fora dos valores dos testes críticos, como também p-valor está não rejeitando H0, logo, as variáveis são não estacionarias.
Phillips-Perron — Idêntico ao teste de Dickey-Fuller.

Após a comprovação de não estacionáriedade, será feito uma regressão linear do tipo simples:

Variável dependente: BBAS3 — Variável independente: BBDC4

De inicio, podemos afirmar que a regressão trouxe resultado significativos. p-valor está abaixo de 1%, r-quadrado mostra um ajuste de curva significante, mas a regressão é espúria.

Existe uma regra de bolso para esse diagnóstico inicial proposta por Yule 1974 , onde temos inicialmente, uma regressão espúria quando R-quadrado > test D. Mas ainda é necessário reforçar essa evidência.

Análise dos resíduos

O ponto mais importante da cointegração em séries temporais é a análise dos resíduos. Esse, necessariamente, deve ser estacionário. Para isso, além do teste de Dickey-Fuller, é feito o teste de Engle-Granger.

Correlogram — Não estacionário
Dickey-Fuller — Não estacionário

A não estacionáriedade das séries demonstram que trata-se de uma regressão espúria.

Engle-Granger

O teste de Engle-Granger mostra que as séries não são cointegradas.

Mais um teste de cointegração — Johansen (VAR)

Nesse teste, a metodologia parte agora de análises em séries defasadas. Para o mais, é necessário verificar o nível ótimo de “Lags”

Foram realizados, do menor para o maior, diferentes estimações com distintas defasagens. Pelo asterisco, podemos ver que o maior número de critérios estatísticos é de até 1 defasagem. Seguiremos com esse modelo.

Na figura acima, podemos ver total falta de evidência estatística. Novamente, outro teste aponta a falta de cointegração dos ativos, mesmo possuindo uma forte correlação inicial!

Ok, e ai…

Todas as análises são feitas com o intuito de provar que a regressão não seja espúria, que as variáveis sejam de fato cointegradas e, com tudo isso, podemos utilizar os resíduos estacionários para futuras análises acerca das operações.

Na imagem abaixo temos um gráfico de dispersão, onde ele tende a voltar para a reta estimada (os coeficientes estimados).

Exemplo retirado da internet

Abaixo temos o exemplo gráfico das variáveis de regressão espúria, não cointegradas e com raiz unitária nos resíduos. Mas, apenas como exemplo da utilização desse mecanismo para operações de arbitragem.

Criação própria

Portanto, a ideia é tentar encontrar os desvios dos resíduos em relação aos coeficientes estimados para realizar operações.

Também tem o fato de realizar testes de cointegração e de estacionariedade em períodos distintos, melhorando a eficácia dos diagnósticos ao longo da amostra.

--

--