Come sono andati i contagi durante le vacanze di Natale? Capiamolo attraverso gli OpenData dell’ISS

Da inizio pandemia l’Istituto Superiore di Sanità (ISS) registra ed elabora dati epidemiologici che di recente ha finalmente reso disponibili in forma di open data. L’importanza di questi dati e delle curve che ne derivano, come vedremo di seguito, dipende dal fatto che sono molto più “stabili” e significativi dei normali dati giornalieri comunicati dalla Protezione Civile, e quindi descrivono meglio la situazione epidemica in Italia. Il prezzo da pagare per una maggiore accuratezza è però quello di un maggior ritardo, perché occorre più tempo per accumulare questi dati. Questo è il motivo per cui ci è possibile soltanto adesso analizzare, attraverso queste curve, l’andamento dei contagi durante il periodo delle festività natalizie.

Prima, però, andiamo brevemente a descrivere che tipo di dati mette a nostra disposizione l’ISS per questa analisi:

1. Sintomatici alla data di inizio sintomi

Questa è forse la curva più “famosa” tra quelle messe a disposizione dall’ISS, attraverso cui si calcola il numero medio di riproduzione Rt. Questi dati rappresentano i soli pazienti sintomatici, datati non al momento della scoperta della positività (della “notifica” come si dovrebbe dire) ma al momento dell’inizio dei sintomi. Proprio per questo si tratta di un dato “ripulito” da arretrati e conguagli successivi, e il fatto di restringere la raccolta ai soli sintomatici dovrebbe renderlo meno suscettibile rispetto alla variazione dei tamponi.

La Figura (alto) ci mostra l’andamento della curva dei sintomatici durante la seconda ondata: il picco dei casi arriva intorno alla prima settimana di novembre, poi i casi cominciano a calare in maniera abbastanza netta fino a ridursi a circa un terzo del valore del picco. Se notate c’è stata una piccola inversione di tendenza con un picco secondario nell’ultima settimana dell’anno, su questo ci torneremo dopo.

2. Ricoveri alla data del ricovero

I parametri ospedalieri dovrebbero essere ben più solidi rispetto a quelli dei casi positivi per quanto riguarda il numero di tamponi effettuati. Possono invece variare a causa del cambio di policy per i ricoveri (in situazioni di emergenza magari). Come per i casi positivi alla data di inizio sintomi, anche in questo caso è bene non riferirli alla data di notifica ma a un parametro che protegge dagli arretrati, come lo è la data del ricovero.

3. Decessi alla data del decesso

Seguendo lo stesso metodo adottato per i ricoveri, i decessi dovrebbero essere il dato più sicuro in assoluto. I deceduti comunicati dalla Protezione Civile sono sempre stati affetti da un ormai noto problema di ritardi e conguagli successivi, problema che però può essere risolto alla radice se ridatati correttamente alla data del decesso, invece che a quella di notifica. Molti altri Paesi oltre all’Italia producono una curva analoga.

Da queste tre serie di dati alla data del contagio

Queste serie di dati, come già detto, hanno il vantaggio di essere collegabili a una data precisa in stretta correlazione con il momento del contagio, e cioè di avvenire dopo un determinato lasso di tempo dal momento dell’infezione. Stiamo chiaramente parlando di tempi medi, tuttavia attraverso questa informazione è possibile, da tutte e tre le curve, provare a ricostruire delle informazioni sull’andamento dei casi positivi rispetto alla data dei contagi.

In particolare, sappiamo che la comparsa dei sintomi in media segue di 5 giorni il contagio, per cui se retrodatiamo di 5 giorni la curva dei “sintomatici alla data di inizio sintomi” dovremmo ottenere una stima dell’andamento dei contagi alla data del contagio. Allo stesso modo possiamo imporre un ritardo medio di circa 9 giorni tra contagio e ricovero ospedaliero, e di circa 15 giorni tra il contagio e il decesso.

Di tutti questi dati occorre poi tener presente, come precedentemente anticipato, che serve del tempo per racimolarli. Se voglio sapere quanti sintomatici hanno avuto l’inizio dei loro sintomi il 20 gennaio, non posso saperlo il 21 o il 22. Il 25 gennaio ad esempio mi aspetto di scoprire ancora molti casi con inizio sintomi al 20 gennaio. Ad esempio caso dei sintomatici è necessario aspettare un paio di settimane prima di ottenere un dato consolidato (le nostre stime al riguardo per tutte e 3 le serie sono riassunte in figura in basso).

Ripercorriamo l’andamento della seconda ondata

Una volta spiegato il meccanismo, andiamo a stimare l’incremento o il decremento medio settimanale dei casi su tutte e 3 queste serie (figura giù). Se il rapporto dei dati di una settimana rispetto alla precedente è maggiore di 1 allora i casi sono in incremento (e lo sono tanto più quanto è più alto il valore); se minore di 1 allora sono in decremento. Guardando alla figura sotto balza subito all’occhio la coerenza tra le tre curve, segno della bontà dei dati e del metodo utilizzato per l’analisi.

La forte crescita della seconda ondata comincia a fine settembre, quando negli ultimi 10 giorni del mese il contagio prende a correre velocemente, al punto da avere più che un raddoppio ogni settimana. Con ogni probabilità la cosa è dovuta al ripristino delle normali attività (lavoro, scuola, etc), con la fine completa delle vacanze.

Qui notiamo anche che la curva degli ingressi ospedalieri non raggiunge la velocità delle altre perché probabilmente va in saturazione: quando gli ospedali si riempiono cambiano i protocolli e vengono ospedalizzati solo i casi più gravi; se poi i posti letto finiscono per forza di cose non viene ospedalizzato più nessuno.

Per le prime 3 settimane di ottobre il contagio prosegue in media con un tempo di raddoppio di circa 7 giorni: siamo in piena fase esponenziale.

Arrivano poi le misure di contenimento, tra queste:

22 ottobre, coprifuoco in Lombardia, poi esteso alle altre regioni

26 ottobre, attività ridotta per bar, pub e ristoranti, 75% DAD superiori

6 novembre: zone rosse, arancioni e gialle

Nel giro di due settimane l’incremento dei contagi perde progressivamente di forza. Dopo la prima settimana di novembre, quindi in corrispondenza con le prime zone rosse (soprattutto Lombardia e Piemonte, regioni epicentro del contagio) la curva comincia a scendere. La decrescita si protrae per più di un mese fino alla settimana prima di Natale, quando inizia una nuova risalita (tranne che per la curva dei decessi che comunque cresce fino a raggiungere la stabilità).

Dopo Natale però si torna a scendere, calo che sembra proseguire, almeno così ci dice la curva dei sintomatici, anche nella prima settimana dell’anno. Qui si chiude la finestra temporale che per ora queste curve sono in grado di mostrarci.

Per riassumere

Da inizio novembre, salvo che per una decina di giorni prima e a cavallo di Natale, siamo sempre stati in una situazione di diminuzione dei contagi. Tuttavia i numeri accumulati a causa dei contagi di ottobre erano molto alti e la decrescita, ormai lo sappiamo, è sempre molto più lenta della crescita e ci vuole molto tempo per tornare a valori “accettabili”, ovvero sicuri.

Per quando riguarda l’ultimo periodo del 2020, sul quale si è parlato e polemizzato molto, vediamo che nella settimana prima di Natale c’è effettivamente stata una crescita dei casi, dopo varie settimane di calo, dovuta con ogni probabilità alla zona gialla a livello nazionale. Questa crescita dei casi è arrivata fino a Natale.

Nei giorni successivi invece, le zone rosse nazionali hanno portato a un calo dei contagi, che è continuato anche nei primi giorni del 2021. Sicuramente non c’è stata nessuna visibile esplosione di casi riconducibili a capodanno o ai giorni precedenti. Anzi, la buona notizia è che finora il sistema a colori giallo, arancione e rosso ha funzionato quantomeno nel tenere sono controllo la curva, a differenza di quanto avvenuto in altri Paesi europei dove si è indetto il secondo e in alcuni casi addirittura il terzo lockdown.

Francesco Luchetta è l’autore di questo articolo. Redazione a cura di Giorgio Sestili. Articolo apparso originariamente sulla pagina “Coronavirus Dati e Analisi Scientifiche”

--

--

Francesco Luchetta
Coronavirus — Dati e Analisi Scientifiche

Fisico, calabrese, romano di nascita E di adozione, data analyst, drogato di caffeina, editor di “coronavirus dati e analisi scientifiche”, movies addicted.