Evolução do COVID-19 no Brasil

Escrito por Fernando Nagano, Luiz Yamaoka e Pedro Seiler

Luiz Yamaoka
luizalabs
5 min readApr 17, 2020

--

Introdução

Desde o início da pandemia, acompanhamos de perto a evolução do COVID-19 para apoiar decisões de negócio no Magalu e a primeira delas que precisávamos responder era quais lojas fechar por causa da expansão da pandemia. Afinal, temos lojas ou centros de distribuição em mais de 700 municípios e uma das 3 missões que definimos como empresa foi de cuidar da saúde dos nossos colaboradores e clientes.

Com a primeira pergunta, enfrentamos o desafio de obter dados por município. O Ministério da Saúde divulga os resultados consolidados por UF e, no início, as secretarias de saúde de alguns estados não divulgavam com frequência diária ou não apresentavam a quebra por município. Com o passar dos dias, os estados se organizaram e passaram a publicar boletins epidemiológicos mais estruturados. Alguns estados lançaram dashboards, permitindo o download dos dados e análises mais detalhadas.

Com a missão de cuidar da saúde dos nossos colaboradores e clientes, tomamos a decisão de fechar todas as lojas. Durante esse período, continuamos a acompanhar diariamente a evolução do COVID-19 para apoiar diversas decisões de negócio.

Alinhado à nossa cultura, decidimos divulgar as bases de dados que coletamos e as análises que acompanhamos diariamente para ajudar a todos a enfrentar essa crise epidemiológica e econômica.

Visão geral da evolução no país e comparativo com outros países

Uma visão geral da evolução de casos e mortes no Brasil indica um crescimento relevante, mas inferior aos EUA e principais países da Europa, provavelmente pelo lockdown ter começado mais cedo do que em outros países. Considerando a subnotificação de casos confirmados, complementamos as análises com as informações de mortes.

Evolução de casos confirmados no Brasil

Número de casos confirmados no Brasil dia a dia
Número de novos casos confirmados no Brasil dia a dia

Quantidade de casos confirmados após o 100º caso em comparação com outros países

Número de casos confirmados após o 100º caso no Brasil em comparação com outros países

Quantidade de mortes após a 30ª morte em comparação com outros países

Número de mortes confirmadas após a 30ª morte no Brasil em comparação com outros países

Visão por UF

No início, São Paulo foi o epicentro do COVID-19 no país, mas hoje outros estados preocupam, principalmente quando relativizamos a informação ao medir a quantidade de casos por milhão de habitantes, como Amapá, Amazonas, Roraima, Ceará, Rio de Janeiro e Pernambuco.

Número de casos por UF

Mapa da distribuição dos casos pelos estados do Brasil

Comparativo das UFs com mais casos

Número de casos confirmados após o 100º caso por estado do Brasil

Evolução de casos confirmados por UF

Número de casos confirmados por estado e previsão de casos para os próximos 50 dias

Evolução de mortes por UF

Número de mortes por estado do Brasil

Modelagem para previsão de casos

Algumas perguntas que sempre surgem quando discutimos sobre o coronavírus giram em torno da previsibilidade da pandemia:

  • Já atingimos o pico do avanço da doença?
  • Quando será o pico?
  • Quantos casos teremos no pico?

Modelo desenvolvido

Como o coronavírus é uma doença nova e o Brasil e seus municípios ainda estão em fase inicial da enfermidade, observamos escassez de dados sobre a sua progressão. Desse modo, optamos por utilizar dados de outros países que já estão em estágios mais avançados da pandemia, como China, Itália, Espanha e Alemanha, entre outros.

Além disso, o comportamento do COVID-19 é bem distinto em cada lugar em função de diversos motivos, como população, densidade demográfica, grau de isolamento, estilo de vida das pessoas e velocidade na tomada de decisão anti-propagação da doença. Isso torna a previsão muito difícil e a chance de erro é relativamente grande — e que aumenta quanto mais tempo para frente tentamos prever. Por isso, optamos pela utilização da regressão linear, um modelo mais simples, que permite uma interpretabilidade um pouco maior dos parâmetros.

Como queremos prever qual a quantidade diária de casos confirmados de COVID-19 pelos próximos 30/60 dias, utilizamos um modelo iterativo para prever sempre o próximo dia e então utilizar o valor previsto para tentar prever o seguinte, e assim por diante, até chegarmos no período de tempo que queremos prever.

Isso gera uma fórmula com o formato abaixo, na qual multiplicamos cada variável por um coeficiente e somamos todos os resultados para obter o valor previsto de casos de coronavírus do próximo dia.

Ilustrativo do funcionamento da regressão linear para prever o número de casos de d+1

Para ilustrar, as principais variáveis e os respectivos coeficientes obtidos para o modelo foram os seguintes:

  • Quantidade de casos em d0: 1,39 — ou seja, se não tivéssemos outras informações a previsão inicial que daríamos utilizando o número de casos de hoje para prever o dia de amanhã seria que o número de casos cresceria em 39%;
  • Variação de casos de d-1 para d0 (quantidade de casos d0 / quantidade de casos d-1): -32,45 — ou seja, quanto maior é a variação de casos de um dia para o outro, maior é a chance desse crescimento começar a desacelerar, por isso, um coeficiente negativo;
  • Quantidade de casos em d0 por mil habitantes: -293,65 — ou seja, quanto mais casos por mil habitantes, menor é o crescimento de número de casos, o que faz sentido já que o número de pessoas que podem ser infectadas é limitada pela população do local;

Performance do modelo

* Análise de resultados realizada no dia 20-abril

Para calcular a performance do modelo, utilizamos a métrica de erro RMLSE (Root Mean Squared Logarithmic Error) e atingimos as seguintes métricas:

Prevendo o número de casos de 7 dias (13-abr a 19-abr)

  • RMLSE (todos os municípios com mais de 100 casos): 1,0007
  • RMLSE (São Paulo, Rio de Janeiro, Fortaleza): 0,3074

Prevendo o número de casos de 14 dias (06-abr a 19-abr)

  • RMLSE (todos os municípios com mais de 100 casos): 1,4703
  • RMLSE (São Paulo, Rio de Janeiro, Fortaleza): 0,5949

Com isso podemos ver que o modelo construído possui, como esperado, uma performance pior quanto mais dias no futuro queremos prever. Também mostra que em cidades em estágios um pouco mais avançados da disseminação do coronavírus a previsão é um pouco mais assertiva.

Apenas como referência de RMLSE, o líder da competição do Kaggle COVID19 Global Forecasting (Week 2) possui no dia 20 de abril, com 17 dias previstos, um RMLSE de 0,4841.

Visão por município

A cada dia, mais de 50 municípios confirmam seus primeiros casos. Atualmente temos quase 1.500 municípios com casos. No mapa, vemos que o estado de São Paulo está bem atingido pelo COVID-19.

Número de casos por município

Mapa da distribuição dos casos pelos municípios do Brasil

Evolução da quantidade de municípios com um caso confirmado

Número de municípios com pelo menos 1 caso confirmado

Evolução de casos confirmados por município

Número de casos confirmados por município e previsão de casos para os próximos 50 dias

Evolução de mortes por município

Número de mortes por município

Dados

Para construir as visões utilizamos 3 bases de dados:

  • Johns Hopkins University: bases de casos confirmados e óbitos por dia e por país;
  • Magazine Luiza: base produzida internamente e disponibilizada para acesso geral com as informações de casos confirmados e óbitos por dia e município do Brasil;
  • Brasil.io: essa é uma outra base de dados com casos e óbitos por dia e município do Brasil, que passamos a utilizar no meio do projeto em conjunto com os dados coletados diretamente das secretarias de saúde;

A base de dado de casos e óbitos por município que consolidamos está disponível neste link do Github: https://github.com/luizalabs/covid-19. Esta base será atualizada 3 vezes por semana, nas segundas, quartas e sextas. Além disso, todos os gráficos deste artigo serão atualizados com a mesma frequência. Caso encontrem algum erro, pedimos que nos avisem.

Esses são os dados e visões que temos acompanhado no Magalu para nortear as decisões e ajudar a empresa a seguir o melhor caminho para passar por esta crise. Esperamos que compartilhando essas informações possamos ajudar outras pessoas, companhias e instituições a superarem este momento difícil e que, em breve, estejamos de volta às nossas vidas normais.

--

--