Dov’è veramente il picco dei contagi? Analisi dei dati ISTAT sulla mortalità

Paolo Meridiani
7 min readApr 5, 2020

--

Daniele del Re (Università Sapienza & INFN), Paolo Meridiani (INFN)

4 Aprile 2020

La valutazione dell’efficacia della misure di contenimento (lockdown), imposte per arginare la diffusione del Covid-19, si basa necessariamente sul monitoraggio del contagio. Recentemente, si è iniziato a discutere del rilascio di alcune di queste misure. I dati però sembrano mostrare un rallentamento del contagio minore del previsto, inducendo la politica a posticipare tali azioni. Questo studio, basato sull’analisi dei dati anagrafici dei decessi, mostra evidenza del fatto che due dei principali indicatori utilizzati per determinare l’andamento del contagio, il numero dei contagiati e quello dei decessi, potrebbero essere significativamente distorti.

Variazioni nel campionamento dei contagiati e dei decessi influenzano la stima dell’evoluzione temporale dell’epidemia. Il cambiamento delle linee guida con cui si praticano i tamponi al variare del tempo porta inevitabilmente a delle distorsioni. Inoltre, se i deceduti a causa del virus non vengono prontamente identificati, ed in particolare se ciò avviene in modo diverso con il passare del tempo, nemmeno il numero ufficiale dei deceduti permette di seguire correttamente il profilo temporale del contagio.

In questo lavoro abbiamo studiato l’impatto di questi due effetti partendo da due evidenze sperimentali:

  1. vari studi che confrontano i dati ISTAT sulla mortalità complessiva con quelli relativi al Covid-19, indicano che il numero di decessi dovuti al Covid-19 potrebbe essere notevolmente sottostimato, di un fattore che in alcune zone potrebbe arrivare fino a 10. Un esempio è mostrato nel grafico seguente per la città di Genova: i dati indicano che nelle prime 3 settimane di Marzo i decessi effettivi dovuti a Covid-19 (256 nella nostra stima) potrebbero essere 7 volte quelli ufficiali. Anche l’andamento temporale dei decessi sembra diverso.
Eccesso dei dati giornalieri di mortalità anagrafica a partire dal 1 Febbraio 2020 per la città di Genova (dati SiSMG), confrontato con la stima ottenuta a partire dai dati ufficiali (linea verde)

2. il numero di tamponi effettuati è stato incrementato in due momenti specifici (24 e 29 Marzo); tale incremento è stato verosimilmente generato da una variazione dei criteri utilizzati per il campionamento. Questo risulta evidente dal seguente grafico che mostra il numero di tamponi e di positivi al virus in funzione del tempo. In corrispondenza dei due giorni citati si vede un incremento del numero di tamponi, per arrivare ad un aumento complessivo di circa il 100%, e una conseguente riduzione del 50% delle frazione di positivi (ε=campioni positivi/totale campioni) sui campionamenti effettuati.

Campioni giornalieri effettuati a partire dall’inizio dell’epidemia di Covid-19 e frazione di positivi

Studio dei decessi anagrafici dai dati ISTAT

Il set di dati messo di recente a disposizione dell’ISTAT permette di monitorare il numero totale di decessi in 1084 comuni italiani, corrispondenti a circa 12 milioni di persone. Pur essendo molto esteso, il campione manca di grandi città quali Milano, Roma, Torino e Genova. Inoltre, i dati sono stati resi disponibili solo per i comuni con un eccesso di mortalità superiore al 20% rispetto agli anni precedenti (2015–2018), comportando un potenziale bias nei risultati.

Osservando l’andamento temporale dei decessi, è possibile identificare un eccesso concomitante con l’epidemia, e ottenere una stima del numero di decessi dovuti a Covid-19 (sia in maniera diretta che collaterale [Nota del 19 Aprile: qui uno studio dove proviamo a stimare i diversi contributi]). Il grafico sul campione complessivo è mostrato nella figura seguente:

Decessi giornalieri nazionali sul campione dati ISTAT (1084 comuni, corrispondenti a circa 12 milioni di residenti) a partire dall’inizio dell’epidemia Covid-19. A destra i dati sottratti per la media ottenuta nel periodo 2015–2018

A sinistra i decessi di quest’anno sono rappresentati con linea continua e lo storico, ottenuto dalla media dei 4 anni precedenti, in linea tratteggiata. Sottraendo lo storico si ottiene il grafico di destra che evidenzia un eccesso di mortalità molto significativo nel mese di Marzo, che possiamo ascrivere al Covid-19. Il grafico permette di valutare sia il numero totale di deceduti, da confrontare con quello ufficiale fornito dall’ISS, sia l’andamento temporale del contagio. Tale confronto è mostrato nei grafici che seguono, sia per l’andamento giornaliero che per quello cumulativo.

Eccesso delle morti anagrafiche a partire dal 24 Febbraio confrontato con i dati ufficiali forniti dalla Protezione Civile. A sinistra i dati giornalieri, a destra quelli cumulativi

Si può notare che il numero dei decessi totali al 21 marzo (ultimo dato disponibile del campione ISTAT) è due volte quello ufficiale Covid-19, se pur il campione coperto dai dati ISTAT corrisponda solo ad un sesto della popolazione nazionale. Sembrerebbe quindi che almeno in una prima fase dell’epidemia il numero di morti da Covid-19 sia stato notevolmente sottostimato. I dati anagrafici, se pur ritardati rispetto al contagio, avrebbero fornito un monitoraggio più realistico dell’effettiva estensione iniziale dell’epidemia, suggerendo una diffusione del virus ben precedente all’individuazione dei primi pazienti infetti. Inoltre l’andamento temporale delle 2 stime sembra crescere in modo diverso. Dopo un primo ritardo, i dati relativi ai decessi ufficiali sembrano avere una crescita più rapida, verosimilmente a causa di un aumento del campionamento dei contagiati. Questo fatto è mostrato dal grafico seguente, che rappresenta il rapporto tra i decessi stimati ISTAT e quelli ufficiali.

Andamento temporale del rapporto giornaliero tra l’eccesso di decessi anagrafici nazionali sul campione ISTAT e i dati ufficiali

Ciò potrebbe effettivamente indurre un apparente ritardo nella determinazione del picco dei decessi. Lo studio degli andamenti dei decessi è stato effettuato anche per singole regioni, con conclusioni confrotabili con quelle nazionali. In questo caso i dati mancanti di alcuni capoluoghi di regione, Genova, Torino, Milano e Roma, sono stati aggiunti usando i dati resi pubblici dal SiSMG (qui il nostro precedente articolo su questi dati). Il grafico relativo alla Lombardia, la regione, tra quelle studiate, con il campionamento maggiore, pari a circa il 70%, è riportato di seguito:

Eccesso dei decessi anagrafici settimanale per la Lombardia nel periodo 2 Febbraio — 21 Marzo (dati ISTAT+SiSMG, campionamento al 70%), confrontato con i dati ufficiali (in verde dati riscalati per la frazione di campionamento)

Il dato dei decessi ufficiale è stato riscalato per tener conto della parziale copertura dei comuni (in verde), mentre il color magenta mostra l’andamento non riscalato. Anche non correggendo per l’effettiva copertura del campione statistico la discrepanza è di un fattore circa 2. I risultati per altre regioni sono illustrati in appendice.

In generale risulta dunque evidente che l’andamento dei decessi ufficiali Covid-19 è fortemente distorto, cosa che potrebbe comportare una stima non corretta della tempistica di rilascio del lockdown.

Effetto del campionamento dei tamponi

Per valutare l’impatto del cambiamento delle linee guida sui tamponi abbiamo fatto l’ipotesi plausibile che l’efficienza di identificare un contagiato (ε definita in precedenza) sui tamponi aggiuntivi sia minore. Supponiamo che prima del 24 marzo siano state verificate solo persone con sintomi molto evidenti della malattia, mentre successivamente il tampone sia stato fatto anche su pazienti con sintomi più lievi. È ragionevole pensare che su questi nuovi soggetti la probabilità che il tampone risulti positivo sia minore. Nel nostro esempio, abbiamo assunto che questa probabilità sui pazienti con sintomi lievi sia la metà di quella ottenuta sui pazienti con sintomi più gravi. Con questa ipotesi si può riscalare il numero di contagiati per il periodo successivo al 24 marzo. I risultati sono mostrati nei due seguenti grafici, dove viene confrontato il numero di nuovi contagiati prima e dopo la correzione.

Esempio di come una variazione dei criteri di campionamento dei contagiati possa influire sulla stima degli stessi

Come si nota, dopo la correzione, il picco del contagio e il rallentamento del numero dei nuovi casi è molto più evidente rispetto all’andamento originale.

Conclusioni

Nell’emergenza Covid-19 il tema del rilascio graduale del lockdown è cruciale: il momento ottimale dipende dallo stato della diffusione dell’epidemia. Questo studio mostra che due indicatori importanti, l’andamento del numero di contagiati e di quello dei decessi, potrebbero essere fortemente distorti.

Per ciò che riguarda i decessi, il confronto con i dati ISTAT mostra diverse cose:

  • il numero ufficiale di decessi è fortemente sottostimato. L’effetto sembra variare da regione a regione, ma è certamente maggiore di un fattore 2 e può arrivare fino a 10.
  • l’andamento temporale è molto diverso. In generale sembra essere in anticipo rispetto a quello ufficiale con conseguente anticipo del picco dei decessi.
  • l’analisi dei dati ISTAT offre un monitoraggio molto accurato della reale situazione del contagio. È vero, si riferisce al dato di due-tre settimane precedenti, ma è affetto da errori sistematici minori rispetto al dato ufficiale. Si suggerisce perciò di rendere disponibili i dati della mortalità per tutti i comuni italiani in tempo reale. Questo vale certamente in questo periodo di emergenza, ma rappresenta un possibile strumento di monitoraggio per una efficace rivelazione di nuove epidemie.
  • Questa analisi, se ripetuta in altri paesi, potrebbe permettere di chiarire le discrepanze osservate nel tasso di letalità, per esempio con la Germania.

Circa i contagiati mostriamo che è cruciale tenere opportunamente in conto la variazione delle linee guida per i tamponi (ad esempio fornendo i dati dei tamponi separati per categorie, sintomatici gravi, lievi…). Al momento il lento rallentamento dei contagi potrebbe essere dovuto anche a questo effetto distorsivo.

Nota del 17 Aprile: qui l’aggiornamento dello studio sui nuovi dati rilasciati da ISTAT e SiSMG, che conferma le idee presentate in questo studio con i dati aggiornati al 4 Aprile

Appendice

Decessi totali stimati dal campione ISTAT+SiSMG e dai dati ufficiali per Covid-19 al 21 Marzo per alcune regioni italiane
Eccesso dei decessi dal campione ISTAT+SiSMG fino al 21 Marzo 2020, confrontato con i dati ufficiali della Protezione Civile

--

--