Contra dados não há argumentos… mas há interpretações

Rickson C. Mesquita
8 min readMar 26, 2020

--

Recentemente tenho visto uma enxurrada de gráficos e dados, de todos os lados, sobre como crescem os números de casos diagnosticados com COVID-19 no Brasil e no mundo, e como estes números se comparam uns com os outros. A grande maioria destas análises "informativas" buscam usar alguma informação gráfica ou, em casos ainda piores, pontos de um gráfico, para ratificar um determinado argumento. Por melhor que sejam as intenções, é importante pensar na interpretação dada, e principalmente nas limitações provenientes dos dados. Dados são dados, mas não são porque são números (na imensa maioria das vezes) que são absolutos. Dados são, na verdade, mais próximos de medidas experimentais, coletados sob certas circunstâncias e com erros associados à tarefa de medir — e, portanto, têm incertezas que precisam ser consideradas. Esta foi a principal razão que me levou a escrever este texto.

Primeiramente, acho difícil comparar o número de casos entre diferentes países, como tenho visto em vários lugares — incluindo a mídia. Cada país tem adotado formas diferentes de confirmar a doença, muito devido à sua infraestrutura disponível. O Brasil, por exemplo, terá uma quantidade muito pequena de testes se comparado com países menores e com mais infraestrutura em saúde. Logo, olhar para o número de casos ao longo do tempo e compara-lo com outros países não me parece ser uma boa estratégia de acompanhar o desenvolvimento da doença.

Na minha visão, o número de mortes é mais representativo do que o número de casos. Afinal, este número deveria ser mais comparativo, uma vez que a morte é um fato consumado e depende menos da infraestrutura de cada país (embora ainda tenha forte correlação com o acesso à assistência médica e com o perfil de saúde da população, que varia drasticamente entre países). Mesmo os países sem capacidade de testar exaustivamente poderiam contabilizar o número de mortes com síndromes respiratórias agudas nesse momento, que me parece a estratégia que o Brasil tem adotado até então. É por este motivo que prefiro analisar os dados de mortes, e não de casos diagnosticados, entre os diferentes países.

A Figura 1 mostra o número de mortes por dia, desde o dia da primeira morte confirmada, para diferentes países. Os números reportados foram extraídos da página da European Center for Disease Control, que mantém uma atualização diária dos números de todos os países que confirmaram a doença. A partir deste gráfico é possível ter visão de onde cada país está em relação ao seu estágio de contaminação local. Ele também mostra o efeito final de cada uma das diferentes ações dos diferentes países. A China, país que convive com o vírus há mais tempo, passou por seu período mais duro de epidemia cerca de 30 dias após a primeira morte, e este período crítico durou cerca de 15 dias. A primeira morte na China aconteceu no dia 11 de janeiro de 2020, a reclusão total (o chamado lockdown) foi determinado pelo governo chinês em 23 de janeiro, quando haviam 17 mortes no país. Ainda assim, o pico de mortes ocorreu em 13 de fevereiro, quando o país registrou 254 mortes em 24 horas.

Figura 1. Números de mortes por dia desde o dia da primeira morte confirmada em diferentes países.

A boa notícia quando olhamos para o gráfico da Figura 1 é que, a exemplo da China, o Irã também parece ter ultrapassado seu pior momento, e agora tem caminhado em direção ao final do período caótico de saturação de mortes. Na contramão, Espanha, Estados Unidos, Reino Unido e os Países Baixos (ainda mais conhecida como Holanda) parecem estar apenas no começo de viver seus piores dias de pandemia. Os dois últimos, que tentaram uma espécie de isolamento seletivo inicialmente, perceberam nos últimos dias sua ineficácia e agora forçam o isolamento horizontal. Talvez tenha sido um pouco tarde para evitar o pico de mortes que deve vir nos próximos dias. Mas ao menos retardaram o número inicial de mortes, coisa que nem a Itália nem a Espanha conseguiram fazer. Um caso interessante é o da França, que após passar mais de um mês controlando o número de mortes, de repente explodiu e a cada dia aumenta mais, numa taxa similar à da Espanha.

Já a Figura 2 contabiliza o número total de pessoas mortas desde a primeira morte confirmada para diferentes países. Nela é possível perceber o estrago total feito por esta pandemia. Os números no gráfico colocados ao lado de alguns países são uma projeção do total de mortos, calculados por um modelo de ajuste dos dados (os números em parênteses são a incerteza obtida com o modelo, que pode variar para cima ou para baixo). Esta projeção é mais precisa depois que os países conseguem estabilizar o crescimento inicial de mortes por dia, e por isso a projeção só está feita para os países que convivem com a doença há mais tempo. Mas o início da curva serve para compararmos a situação entre diferentes países. O Brasil, por exemplo, tem uma curva de mortes acumulada mais similar à da Espanha, que até o momento é o local do planeta onde o número de mortes cresceu de forma mais acelerada. Mesmo com o esforço de autoridades de vários Estados, a projeção para o que está por vir não é nada boa, e o número total de mortos em 17 de abril, 30 dias após a primeira morte, pode ultrapassar a escala do gráfico abaixo se continuarmos no mesmo ritmo.

Figura 2. Número total de mortes em diferentes países desde a primeira morte confirmada por COVID-19. Nos países que já conseguem caminhar para uma estabilidade

Também tenho visto várias pessoas solicitando para ver o gráfico da densidade de mortes por país, ou seja, o número de mortes considerando o número total de habitantes. Em minha opinião, essa é uma tentativa quase desesperada de se auto-acalmar, pois obviamente países com uma quantidade maior de habitantes (como o Brasil) apresentará números menores de mortes do que a Espanha, a Itália e até mesmo o Irã. No entanto, os dois gráficos contém informações diferentes, e não devem ser usados para o mesmo fim. O número absoluto de mortes, tal como o da Figura 2, diz muito sobre a perda de pessoas e famílias, que não devem ser relativizadas pelo tamanho da população. Seja grande ou pequeno quando comparado com a população do país, este é o número total de caixões necessários, vagas em cemitérios e certidões de óbitos que o país terá que criar. Pensar em termos relativos quando o tema é morte talvez diga mais sobre um país que se diz cristão do que sobre a epidemia em si.

Mas, para os que fazem tanta questão de relativizar os números, então proponho a interpretação correta: o número de mortes em relação ao total da população diz mais sobre o potencial para estrago do que do estrago em si. Em outras palavras, o número de mortes ponderado pela população fornece o número de quantas outras pessoas podem morrer ainda. E, ao menos para mim, é um dado ainda mais assustador do que o da Figura 2. Afinal, um total de 60 mortes para 200 milhões de habitantes (dados aproximados para o Brasil na data de hoje) só mostra que há ainda 199 milhões 999 mil 940 habitantes que podem contrair o vírus, e que deste espaço amostral, vários precisarão ser internados, e que dos internados, muitos outros morrerão. Isso não muda o fato de que o pior ainda está por vir; pelo contrário, evidencia que, se nada for feito para diminuir a propagação, um número ainda maior de mortes ocorrerá por aqui. Todos de uma só vez, ao contrário dos que morrem por qualquer outra doença (ou mesmo assassinatos, como tenho visto alguns compararem.).

Um outro cuidado que precisa ser tomado é que, em países com dimensões continentais como o Brasil, a densidade populacional varia enormemente, de poucos habitantes por km² no Norte até centenas de habitantes por km² nas principais cidades brasileiras. Não adianta dividir tudo pelo número total de habitantes, sabendo que há uma variabilidade enorme em como estes habitantes estão distribuídos Brasil afora, e que a taxa de transmissão do vírus é proporcional à densidade populacional.

Por isso mesmo, qualquer análise cuidadosa sobre a situação no Brasil deve ser feita separadamente. Como o número de mortes no Brasil ainda é baixo (estamos no início da epidemia, apenas 9 dias após a primeira morte), fica difícil fazer qualquer comparação. Mas, como o Brasil é uma república federativa, a forma de contabilizar o número de casos é igual em todos os Estados, pois os mesmos obedecem à mesma determinação do Ministério da Saúde (isto não é verdade, por exemplo, nos Estados Unidos, onde cada Estado tem autonomia para elaborar suas próprias determinações). Por este motivo, comparar os dados dos números de casos diagnosticados dentro do Brasil é algo mais preciso do que entre diferentes países. Como, infelizmente, nossas instituições não mantêm um banco de dados detalhado e completo, os dados para os casos brasileiros foram retirados retrospectivamente dos informes diários feitos pelo Ministério da Saúde em cadeia nacional. Os dados representam, portanto, os números oficiais do Ministério da Saúde, apesar das divergências entre estes e os dados reportados pelas secretarias de Estado da Saúde.

A Figura 3 mostra exatamente o número total de casos diagnosticados, desde o primeiro caso, para cada um dos Estados da Federação. Por causa da maior densidade populacional, maior mobilidade entre as pessoas e maior poderio financeiro, os primeiros casos foram diagnosticados nos dois principais Estados do Brasil: São Paulo e Rio de Janeiro. Mas, aos poucos, o vírus tem se espalhado por todo o país, e todos os Estados já têm ao menos um caso diagnosticado. A taxa de aparecimento e crescimento do número de casos segue também os principais índices de densidade populacional e mobilidade. A região Norte, por estar mais afastada, foi a última a ter casos confirmados de COVID-19, está 20 dias atrás de São Paulo e tem um crescimento de casos novos menor que outras regiões por enquanto. Exceção feita ao Amazonas, cuja capital, Manaus, é o principal polo da região. O mesmo pode ser dito, de uma forma generalizada, para a região Nordeste, onde Ceará, Bahia e Pernambuco, principais Estados do ponto de vista de produtividade e mobilidade no Nordeste, despontaram na taxa de casos confirmados.

Figura 3. Número total de casos diagnosticados desde o primeiro caso, separado por Estados da Federação.

Em suma, é importante, sim, olhar para os dados e interpreta-los para poder entender, de fato, o que está ocorrendo, em que direção estamos indo, e quais serão as consequências devido à pandemia, não só no Brasil como no mundo. Mas também é muito importante entender de onde saíram os dados, como são computados, quais são suas hipóteses e suas imprecisões, para que interpretações não sejam equivocadas e/ou interpretadas de forma a causar ainda mais desinformação. A frase, tão utilizada, de que contra fatos não há argumentos, precisa ser sempre considerada à luz da sabedoria. Fatos vêm de dados, que são medidas e portanto têm incertezas. E argumentos deveriam vir, sim, de interpretações destes dados.

--

--

Rickson C. Mesquita

Professor e Pesquisador da Universidade Estadual de Campinas. Cria equipamentos para Medicina e trabalha com modelos para análise de dados em Neurociências.