Entendendo os números da Covid no Brasil

Luigi Pontello
luigipontello
Published in
7 min readMar 30, 2021
https://www.paho.org/pt/news/30-1-2020-who-declares-public-health-emergency-novel-coronavirus

O que é a SARS-CoV-2 ou Covid-19, como é popularmente conhecida?

A COVID-19 é uma doença causada pelo coronavírus, denominado SARS-CoV-2, que apresenta um espectro clínico que varia de infecções assintomáticas a quadros graves. De acordo com a Organização Mundial de Saúde, a maioria (cerca de 80%) dos pacientes com COVID-19 podem ser assintomáticos ou oligossintomáticos (poucos sintomas), e aproximadamente 20% dos casos detectados requerem atendimento hospitalar por apresentarem dificuldade respiratória, dos quais aproximadamente 5% podem necessitar de suporte ventilatório.

Definição extraída do: https://coronavirus.saude.gov.br/sobre-a-doenca

Apesar de parecer ser uma doença com uma baixa letalidade, o covid-19 tem uma extrema facilidade de transmissão, e junto dessa facilidade de transmissão, ocorrem as superlotações de hospitais. Não é segredo para ninguém que o Brasil sempre sofreu com problemas de leitos em hospitais, porém, dessa vez temos uma agravante mais expressiva, que causa um colapso no nosso já frágil sistema de saúde de maneira mais rápida.

Como as atenções do mundo, hoje, giram em torno dos números da doença e seus impactos, resolvi fazer uma análise dos números até o dia de hoje, 28/03/2021.

Para esta análise, irei utilizar o dataset https://github.com/owid/covid-19-data/tree/master/public/data.

Este dataset é fornecido pelo Our World in Data, um projeto do Global Change Data Lab, organização sem fins lucrativos com sede no Reino Unido.

O objetivo dela é tornar o conhecimento dos grandes problemas acessível e compreensível. Como eles dizem em sua página inicial, Our World in Data é sobre pesquisa e dados para fazer progresso contra os maiores problemas do mundo.

Dados do Brasil

https://olhardigital.com.br/2021/03/23/coronavirus/covid-19-brasil-tem-novo-recorde-de-mortes-nas-ultimas-24h-total-ultrapassa-298-mil/

O Brasil ainda não possui uma forte cultura de dados, consequentemente temos grandes conflitos de informações aos reais números da Covid-19 em nosso país. Estes conflitos de informações e divergências geraram ate mesmo aos jornalistas criarem uma base de dados para fazerem os relatórios dos números da Covid-19.

A Our World in Data deixa alguns alertas sobre seu dataset se tratando do Brasil:

Os números dos casos relatados em uma determinada data não mostram necessariamente o número de novos casos naquele dia — isso se deve a atrasos na notificação.

O número real de casos provavelmente será muito maior do que o número de casos confirmados — isso se deve aos testes limitados.

Vamos iniciar nossa análise, realizando a importação das bibliotecas a serem utilizadas.

A Our World in Data disponibiliza vários tipos de datasets, sejam eles referentes ao número de vacinados ou mesmo a números gerais da Covid-19. Neste análise utilizei o owid-covid-data.csv

Em toda análise utilizei poucas colunas, sendo assim irei descrever o significado de cada uma delas em um dicionário:

date : Data de observação

continent :Continente da localização geográfica;

location :Localização geográfica;

total_cases : Total de casos confirmados de COVID-19;

new_cases : Novos casos confirmados de COVID-19;

total_deaths : Total de mortes atribuídas a COVID-19;

new_deaths : Novas mortes atribuídas a COVID-19;

total_deaths_per_million : Total de mortes atribuídas a COVID-19 por 1.000.000 de pessoas.

Sendo assim, vamos iniciar as respostas das nossas perguntas.

Quais são os cinco países que possuem mais casos de covid?

Primeiramente necessitei filtrar quais dados eu iria utilizar. Usando o comando loc, filtrei primeiramente a data mais recente ao dia de hoje, 28–03–2021, ordenando o total de casos do maior para o menor.

Porém eu havia notado que existia a informação do total do mundo e dos continentes, também. Desta forma, o método que utilizei para fazer o tratamento foi limpar as linhas onde a coluna continent fosse NaN. Feita essa tratativa, utilizei simples head() para limitar o top 5 países com mais casos. Finalizando todo processo de tratar os dados, realizei a visualização dos mesmos, e infelizmente notamos que nosso país é hoje o segundo com maior número de casos.

Quais são os cinco países que possuem mais mortes por Covid?

Seguindo o mesmo exemplo de citado anteriormente, utilizei o comando loc para filtrar a data mais recente ao dia de hoje, em seguida ordenando do maior para o menor através do sort_values. Mantendo o padrão de exclusão dos continentes e do valor World.

Novamente nosso países figura a segunda colocação em um número ainda mais triste, o número de mortes.

É possível visualizarmos alguma subnotificação apenas com estes dados?

Nossa próxima questão é um pouco mais complexa, é saber se existe subnotificação visível neste dataset. Para fazer essa checagem eu utilizei um padrão, total de mortes e total de casos. Minha razão para fazer esta checagem por estes dados é buscar discrepâncias quanto a diferença de números.

A melhor forma que eu pensei de checar alguma subnotificação nos primeiros 15 países com maior número de mortes é checar a taxa de letalidade. Entendendo que a letalidade do covid-19 figura entre 2–4%, é bem perceptível que não estão realizando testes com toda a população da mesma forma que realizam com os que morrem com sintomas.

Nitidamente conseguimos observar um padrão, menos em um país, México, que possuí uma taxa de letalidade totalmente discrepante das demais, o que indica bastante uma grande subnotificação nos números de casos.

O fato dessa observação mostrar o México como grande exemplo de subnotificação, não exclui os demais países. Porém no México observamos um exemplo claro de falha no número de casos. Em outros países a subnotificação pode afetar ambos os dados(mortes/casos), como no Brasil, e consequentemente não faz alterar tanto a taxa de letalidade.

Quais são os top 20 países com mais mortes por milhão de habitantes?

Certo dia no supermercado com meu pai, comentei que o Brasil deveria ser um dos primeiros em número de mortes por milhão de habitantes, meu pai disse que o Brasil estava na posição 26, naquela data. Eu logo questionei e disse que provavelmente ele viu isso de alguma fonte errônea.

Este diálogo com meu pai foi há 1 mês mais ou menos, e nas últimas semanas o Brasil vive seu pior momento em números de mortes. Quando resolvi realizar a checagem dos dados, notei que realmente a afirmação do Brasil, um mês atrás figurar no top 26, fazia sentido, é, meu velho estava certo.

Neste caso mantive o padrão quanto aos filtros, apenas preferi resetar o index para poder visualizar melhor os países por colocação de forma mais simples.

Comparando a evolução de novos casos por dia entre os três maiores países da América do Sul.

Nesta comparação resolvi analisar como são os picos de cada país. Algo que percebi é que o Brasil teve um aumento do número de casos por dia em Outubro, e deste então este número não para de subir, ou seja, quase 6 meses em uma crescente. Em contrapartida Uruguai possui um pico referente aos últimos 30 dias, e a Argentina segue um padrão semelhante.

Com isso podemos notar como faz diferença uma gestão de controle da Pandemia, visto que nosso país, extremamente mal gerido nesta fase, tem um total descontrole em números de casos, o que apenas reflete o caos que hoje vivemos com o nosso sistema de saúde, com quase todos os estados em Onda Vermelha.

Comparando a evolução de novas mortes por dia entre os três maiores países da América do Sul.

Um exercício que me propus a fazer é entender como estão comportando se as evoluções de mortes por dia, nos maiores países da América do Sul. Minha ideia era entender se realmente somos esse desastre todo no controle da Covid, e a resposta é que sim.

É extremamente perceptível nossa curva de evolução de mortes. Apesar da curva do Uruguai estar bem próxima, os números de mortes são brutalmente menores, e o Uruguai aparenta estar no pico da sua segunda onda. Comparando com a Argentina tomamos goleada, a Argentina se mostra extremamente controlada quanto ao avanço do número de mortes por Covid-19, enquanto o Brasil bate recorde de mortes semana pós semana.

Conclusão

Após toda essa análise conseguimos perceber o tamanho do real problema da Covid-19, tanto do Brasil quanto no mundo, e seus enormes impactos.

Falando do nosso país, é um pouco assustador a forma como os números vem evoluindo e como o sentimento de “normalidade” vem encontrando as pessoas.

Com isso, vamos nos cuidar, #FiqueEmCasa e use mascara. A mudança desses números depende de todos nós.

LinkedIn

GitHub

--

--