Vacinas contra a COVID19 — Entenda o Estatistiquês dos Experimentos e Modelos

Larissa Sayuri Futino Castro Dos Santos
rladiesbh

--

Você também só pensa em vacina?

Incrível como o tempo pode passar rápido e devagar, né? Devagar para o fim dos riscos da COVID19 e rápido na perspectiva de tudo o que aconteceu desde a chegada da doença.

Você também só pensa em vacina? Além das expectativas de controle da doença, viver as experiências que só a aglomeração proporciona ou viajar… eu passei um tempo considerável pensando nos dados da vacina.

Assisti à Reunião Extraordinária da Diretoria da Anvisa de 17 de Janeiro de 2021 em que ocorreu a aprovação do uso emergencial de duas vacinas contra a COVID19 e achei incrível conhecer/reconhecer partes da metodologia usada. (Você já viu? Se não viu… Fica o meu convite). Além, é claro, de me orgulhar dos pesquisadores e servidores envolvidos com ênfase para o time de profissionais da Estatística. Tive muito orgulho da minha classe poder contribuir em uma decisão tão estratégica e fiquei super feliz de ver o R citado como um dos softwares para a as análises que a ANVISA fez.

Esse post é, portanto, meu conjunto de anotações com conceitos sobre os experimentos e modelos do Estudo: COV-02-IB Ensaio Clínico Fase III duplo-cego, randomizado, controlado com placebo para Avaliação de Eficácia e Segurança em Profissionais de Saúde da Vacina Adsorvida COVID 19 (Inativada) produzida por Sinovac-PROFISCOV (vou me ater a esse por simplicidade).

Obs.: Estatistiquês em Negrito e Itálico ao longo do texto.

Por quê precisamos de uma vacina?
Porque é a alternativa mais barata especialmente por não existir alternativa terapêutica para a COVID19.

Além disso, perseguimos uma vacina produzida no Brasil por terem menor custo de produção e armazenamento mais fácil.

Lembrando que: ‘vacinas evitam de 2 (o que daria uma média de 4 por minuto) a 3 milhões de mortes anualmente’ segundo dados da OMS. Uma estimativa cautelosa considerando que a Varíola matou 300 milhões de pessoas no século 20, como dados dessa reportagem da BBC.

Existem muitas vacinas contra a COVID19 sendo desenvolvidas concomitantemente, com diferentes tecnologias, metodologias e origens.

METODOLOGIA

Conceitos (Estatistiquês)
Vou me referir aos conceitos apresentados na Reunião Extraordinária da Anvisa de 17 de Janeiro de 2021.

Infográfico 01: Conceitos do Estudo em análise.

Objetivos
Em um Estudo como esse intui-se responder algumas questões principais:

  1. Qual a eficácia de duas doses (duas semanas depois da 2ª dose)?
  2. Qual a segurança da vacina?

E também explorar aspectos secundários:

  • A vacina funciona para pessoas já expostas ao vírus?
  • Qual a eficácia da vacina com apenas uma dose?
  • Eficácia das 02 doses com diagnóstico sorológico e fisiológico?
  • Casos graves com diagnóstico virológico
  • Qual o nível de resposta imune em adultos e idosos? (não pode ser binário)

MODELOS & RESULTADOS

Participantes

Como o uso pretendido da vacina é em trabalhadores da Saúde (dentre outros) os participantes do Estudo são pessoas que atuam na área da Saúde. Além de representarem a população prioritária para tomar a vacina essas são pessoas que tem mais exposição ao vírus e cujo isolamento social é mais ‘controlado’, uma vez que são pessoas com rotinas de trabalho durante a pandemia.

Tabela 01: Disposição dos Participantes no Estudo, discutida em 1h05min na Reunião.

Observe:

  • O conceito de proporção 1:1 fica evidente na caixa vermelha. O número de pessoas em cada grupo (pessoas que tomaram vacina e que tomaram placebo) se assemelha.
  • Há uma informação inesperada: Existe um pequeno grupo de 18 pessoas que tomaram 3 doses da vacina. Na reunião a ANVISA afirma que pediu esclarecimentos sobre esse fato.
  • Das 12.571 pessoas que consentiram com a partipação no estudo 9.242 delas participaram até o fim seguindo todos os protocolos. Ou seja, cerca de 27% dos participantes não fizeram a participação completa no estudo.

Além disso, são apresentadas mais características dos participantes:

Tabela 02: Dados Demográficos dos Participantes no Estudo.
  • É evidente o predomínio de mulheres como participantes do estudo, como demarcado em roxo.
  • Cerca de 5% dos participantes são pessoas com mais de 60 anos. A ANVISA pediu para que nos estudos futuros esse grupo, tão importante de ser observado, seja ampliado.

Eficácia Total — A pergunta que não quer calar

RISCO

Podemos dizer que, simplificadamente, o que queremos responder é ‘vale a pena tomar a vacina?’ ou ‘pessoas que tomam a vacina tem resposta mais rápida e/ou mais forte à doença do que as pessoas que não tomaram?’.

É bastante intuitivo responder a essa questão geral comparando a incidência (ocorrência) de casos de COVID19 entre os que tomaram vacina e entre os que tomaram placebo, como ilustrado na imagem abaixo. Dizemos que queremos aferir o risco, a probabilidade de uma pessoa pegar a doença entre os que foram vacinados e entre os que não foram e comparar essas quantidades.

Figura 01: Grupos de participantes que receberam vacina (seringa verde) e que receberam placebo (seringa vermelha). A medida que o tempo passa alguns participantes pegam a doença (marcados com o ícone da COVID19).

MODELO

Gosto de dizer que análises de dados existem para permitir ou facilitar a nossa compreensão de um determinado fenômeno de interesse (variável resposta).

Em geral, esse fenômeno é de difícil compreensão (a vida real, né?) e para isso a gente o estuda considerando também outras características, que se relacionam com o fenômeno de interesse (variáveis explicativas).
Em modelagens Estatísticas, tem-se o interesse também em quantificar o efeito de cada uma dessas características sobre o fenômeno. Por exemplo, queremos entender o quanto a característica de idade (18 a 59 anos e acima de 60 anos) dos pacientes influenciou no risco de serem contaminados com a doença.

Para quantificar o risco de uma pessoa pegar a doença entre os que foram vacinados e entre os que não foram pode-se recorrer a Modelos de Regressão.

CENSURA

O Estudo apresentado começa em 21/07/2020 e ainda está em andamento. No caráter de urgência que o estudo tem foi necessário impor um limite para a coleta de informações inicias. Para a aprovação de uso emergencial pela ANVISA dados foram coletados até 16/12/2020.

Note que, obviamente, dentre os participantes do estudo boa parte deles não pegou COVID19 durante os quase 06 meses em que foram observados. Dizemos que o evento de interesse não ocorreu para todos (graças a Deus, né?) e, mais especificamente, que o tempo entre o início do estudo (21/07/2020) e o evento ‘pegar COVID19’ é maior que o tempo observado (até 16/12/2020). Ocorre, portanto, o fenômeno da Censura a Direita.

MODELO COM CENSURA — MOTIVAÇÃO

Como podemos modelar o fenômeno do nosso interesse incluindo características correlacionadas das quais queremos fazer interpretações úteis nesse cenário com censura?

A opção mais intuitiva seria se ater exclusivamente aos dados dos pacientes que observaram o evento.

Figura 02: Informação disponível caso sejam considerados apenas os pacientes em que o evento foi observado durante o estudo.

Mas… Concorde comigo: Não queremos excluir os dados desses participantes… Afinal, o custo e os esforço do estudo são enooormes e tudo quanto é informação conta. Logo, usam-se os dados de todos. Desse jeito, aproveita-se também a informação do tempo durante o qual a maioria das pessoas esteve sob observação sem que pegasse COVID 19 (o evento fosse observado).

Mas como?

COMO CONCEBER UM MODELO?

De uma forma bem simplificada um modelo é uma equação. No contexto dos modelos para a vacina as equações candidatas a representarem bem essa relação traduzem numa linguagem matemática:

  • o comportamento aleatório/ estocástico da variável resposta ‘tempo até pegar COVID19’
  • a relação entre a variável resposta e as variáveis explicativas

Descrevo a equação geral dessa relação na Figura a seguir:

Figura 03: Equação do Risco em um Modelo como o utilizado na vacina contra a COVID19.

Para que a equação traduza a relação precisamos achar as quantidades que descrevem essa relação. Dizemos que precisamos estimar os parâmetros que descrevem:

  • o comportamento aleatório de risco
  • a intensidade da relação das covariáveis com a variável resposta

Como os dados apresentam Censura, esses parâmetros são estimados segundo o Método de Máxima Verossimilhança. Não vou detalhá-lo mas sugiro as observações dessas Notas de Aula do Prof. Lupércio Bessegato da UFJF:

  • Basicamente o método é concebido tentando responder à seguinte pergunta: Qual seria o valor dos parâmetros que maximizariam a probabilidade de observar os dados que foram observados?

A função de verossimilhança avalia o quanto os dados apoiam, concordam ou suportam cada valor possível do parâmetro a ser estimado e, obviamente, é alterada em função do tipo de Censura. Não serei detalhista com a equação mas note que na Figura a seguir vemos as funções para 02 casos:

Figura 04: Equações de Verossimilhança com modelagem da Censura à DIreita e à Esquerda. f denota função densidade e S função de Sobrevivência, a qual eu não comento nesse post mas que é um conceito recorrente nessa literatura.

Penso como em um problema de Otimização. A ideia é estimar os parâmetros como os valores que maximizam a função de verossimilhança.

A esse modelo dá-se o nome de Modelo de Regressão de Cox ou Modelo de Riscos Proporcionais. Nele, o efeito das covariáveis aumenta ou diminui o risco por uma quantidade proporcional em todas as durações, como citado nas Notas de Aula do Prof. Lupércio Bessegato da UFJF.

Até aqui, discute-se a fundamentação teórica do modelo usado. Na Reunião da ANVISA o profissional de Estatística Leonardo Fábio Filho apresentou o output de um software para o modelo ajustado.

EFICÁCIA TOTAL

O Leonardo deu ênfase a uma informação específica da tabela de output: o Hazard Ratio. Essa quantidade denota o risco instantâneo do evento de interesse ‘pegar COVID19' e aparece na Figura abaixo (persão pela baixa qualidade).

Figura 05: Output do modelo ajustado pela ANVISA com destaque para a Informação Hazard Ratio.

Como o Hazard Ratio é o risco instantâneo, a Eficácia da vacina pode ser mensurada como o complementar dessa medida e, portanto, ela é de 50,39%.

A imagem está muito ruim mas há também uma medida intervalar: IC_0.95(35.26, 61.98). Chamo a atenção para a importância de interpretá-la corretamente… Não é a coisa mais intuitiva do mundo então muita gente acaba falando bobagem. Seria basicamente o seguinte: Se pudéssemos tomar um número muito grande de amostras (não podemos hoje, custa caro… é uma suposição mesmo) dessa população e fizéssemos o Hazard Ratio para cada amostra 95% dessas medidas observadas estariam entre 35,26 e 61,98.

Conclusões

  • A vacina tem eficácia de 50,39%. Há quem argumente que o valor é baixo… Como comentado na Reunião da ANVISA os resultados de hoje permitem dizer que a vacina traz mais benefícios do que malefícios (apenas dores musculares no braço foram relatadas até a data do estudo). O avanço do Estudo exigirá mais análises como essas.
  • Recadinho final, como não poderia deixar de ter:

“É um dever fazer parte da solução”
Gabriel Alves, repórter de Ciência da Folha

Vacine-se!

--

--