Le morti correlate al Covid-19

Paolo Meridiani
7 min readApr 20, 2020

--

Daniele del Re (Università Sapienza & INFN) e Paolo Meridiani (INFN)

20 Aprile 2020

È oramai assodato che ci sia un notevole eccesso di mortalità dovuta al Covid-19 e che il numero di decessi dai dati anagrafici risulti essere più che doppio rispetto a quello ufficiale della Protezione Civile [1],[2]. La domanda che ha senso porsi a questo punto è: si tratta di morti dovute direttamente al contagio oppure morti correlate al virus? Fino ad ora ci siamo occupati semplicemente di determinare i decessi Covid-19 come un eccesso rispetto ai dati storici attraverso un semplice conteggio dai dati anagrafici. In questi dati non viene specificato se la morte è avvenuta per il Covid-19 oppure no e pertanto sembra difficile disaccoppiare le diverse cause.

Nonostante ciò, mostreremo che il fatto che questi dati siano relativi a zone in cui il virus ha colpito in modo molto differente, può permettere di estrarre informazioni sulla tipologia di decessi che caratterizzano l’eccesso di mortalità.

Iniziamo con il definire cinque diverse categorie relative ai decessi:

  1. Decessi ufficiali Covid-19. Questa componente è nota piuttosto bene. Dai dati della Protezione Civile e dell’Istituto Superiore di Sanità ne conosciamo l’andamento temporale, la distribuzione in età e in sesso (a livello nazionale). Possiamo ulteriormente conoscere i dati relativi alla singola regione, ma non è del tutto noto (se non per casi specifici) il numero di decessi per città. È possibile però stimarlo per ogni città a partire dai decessi regionali, correggendo per il numero di contagi provinciali e poi per la popolazione del comune in esame.
  2. Decessi in eccesso dovuti direttamente al virus ma non identificati. In questa categoria rientrano tutte le morti di persone decedute da infette ma alle quali non è stato fatto un tampone (e che per questo motivo non vengono conteggiate nei dati forniti dalla Protezione Civile). Tra esse vi sono, per esempio, le persone decedute nelle RSA o le persone morte in casa senza essere mai giunte in ospedale. È ormai di dominio pubblico il fatto che questa componente, in particolare quella dovuta alle RSA, sia tutt’altro che trascurabile. Per questi decessi la distribuzione in età e in sesso non è nota a priori. Dovrebbe essere vicina a quella ufficiale Covid-19 ma, verosimilmente, spostata a età maggiori e, di conseguenza, arricchita di decessi di donne, visto che gli ospiti delle RSA sono molto anziani.
  3. Decessi in eccesso correlati al virus e proporzionali all’estensione del contagio. Si tratta delle persone malate di altre malattie e non contagiate, giunte in ospedale per curarsi ma che, a causa del sovraccarico delle strutture sanitarie, sono decedute perché non sono state curate in modo adeguato o almeno in modo equivalente a periodi senza il virus. Si potrebbe provare a predire la distribuzione in età e in sesso per questi decessi, ma introducendo delle forti assunzioni.
  4. Decessi in eccesso correlati all’epidemia, ad esempio dovuti alla paura di recarsi nelle strutture sanitarie o alla procrastinazione di interventi chirurgici programmati. Questa componente rappresenta l’effetto collaterale più subdolo ed è dovuta, per esempio, al timore di contrarre il contagio negli ospedali o nei pronto soccorso. Dal momento che i provvedimenti relativi al lockdown sono stati sostanzialmente gli stessi in tutto il territorio italiano, è ragionevole pensare che questo genere di comportamento sia stato simile in ogni regione e che l’effetto sia proporzionale alla popolazione stessa. In questa categoria finiscono altri possibili decessi che crescono per il lockdown, ad esempio quelli relativi agli incidenti domestici.
  5. Riduzione per alcune tipologie di decessi. La riduzione del traffico automobilistico, per esempio, implica una minore mortalità. Lo stesso vale per gli incidenti sul lavoro. Anche questa tipologia è proporzionale alla popolazione, visto che le misure di contenimento della fase 1 sono state applicate in modo uniforme sul territorio italiano. Essa però, a differenza della precedente categoria, fornisce un contributo negativo e non un eccesso di mortalità.

Questa categorizzazione è ovviamente arbitraria ma ci aiuta a separare le diverse componenti. La componente 1) è nota (di seguito indicata come “official”). Le componenti 2) e 3) possono essere messe insieme (definite “undetected”) perchè sono entrambe numericamente proporzionali alla diffusione del contagio e quindi alla componente 1). Ci aspettiamo dunque che questi decessi siano molto più presenti nelle città ad alto contagio. Le ultime componenti 4) e 5) (“correlated”) sono invece proporzionali alla popolazione e quindi dovrebbero essere diverse passando da una zona molto colpita dal contagio a una regione con un numero piccolo di casi Covid.

Sulla base di queste considerazioni abbiamo studiato l’andamento del contagio in alcune città italiane, per le quali sono presenti i dati SiSMG sulla mortalità, che arrivano fino al 3 aprile di quest’anno. I risultati in termini di eccesso di mortalità fino al 3 Aprile, confrontati con i dati ufficiali, sono elencati nella tabella successiva.

Eccessi di mortalità ottenuti per alcune città al Nord e al Centro-Sud stimato dai dati SiSMG. L’eccesso viene confrontato con le stime ottenute a partire dai dati ufficiali della Protezione Civile.

Come si nota anche solo guardando i dati ufficiali, le città del nord Italia hanno un impatto dovuto direttamente al contagio da Covid-19 molto forte, mentre quelle del sud sono state colpite più lievemente. Le abbiamo quindi ulteriormente raggruppate in due macro aree separate, indicate come “Nord” e “Centro-Sud”. La prima ha una letalità ufficiale dovuta al Covid-19 di circa lo 0.44‰, mentre la seconda dello 0.03‰, circa un fattore 10 più piccolo. Similmente, anche l’eccesso di morti ottenuto con l’analisi dei dati anagrafici passa dallo 1.1‰ per il “Nord” allo 0.16‰ per il “Centro-Sud”.

Idealmente, potremmo ricavare dal confronto con i dati le normalizzazioni di ciascuna componente avendo a disposizione per ogni componente una stima della distribuzione temporale, età e potenzialmente anche il sesso, ad esempio tramite un algoritmo di minimizzazione. Come abbiamo già fatto notare, per alcune di queste componenti non è possibile modellizzare a priori queste distribuzioni. Procederemo quindi per iterazioni.

Come ipotesi iniziale, è ragionevole supporre che le morti di tipo “undetected” siano di gran lunga dominanti per il Nord, mentre quelle di tipo “correlated” minoritarie in questo momento del contagio. Al contrario, per le città del Centro-Sud, il secondo contributo potrebbe non essere trascurabile.

Alla prima iterazione quindi si è assunta trascurabile (nulla) la componente “correlated” per le città del Nord e si è ricavata la componente “undetected” per semplice sottrazione dall’eccesso anagrafico della componente di morti ufficiali Covid-19. Quindi si è inclusa questa componente “undetected” nelle città del Centro-Sud, semplicemente scalandola al rapporto di decessi ufficiali Covid-19. Qui c’è un altro punto chiave di questa procedura, ossia che l’assunzione che il rapporto tra la componente “official” e “undetected” sia uniforme sul territorio italiano, cosa che è possibile solo in parte verificare nelle regioni ove il contagio sia stato maggiore (al Nord). Questo limite invece potrebbe essere superato utilizzando informazioni che non abbiamo a disposizione, come ad esempio la causa del decesso (secondo la nostra classificazione le morti “undetected” sono da ascrivere agli effetti diretti del Covid-19). Per differenza tra il dato anagrafico e la somma dei contributi di morti ufficiali e “undetected”, si è quindi ricavata la componente “correlated” per le città del Centro-Sud.

Nella seconda iterazione si è preso il contributo “correlated” derivato al Centro-Sud e incluso nelle città del Nord, scalando al rapporto tra le popolazioni.

Questo metodo si può reiterare più volte fino ad ottenere risultati stabili. Poichè le differenze tra Nord e Centro-Sud ora sono molto marcate, le iterazioni successive alla seconda portano a variazioni minime.

Di seguito riportiamo i risultati di questo metodo sulle distribuzioni temporali e di età dei due campioni. Manca l’informazione sul sesso dei deceduti poichè non è riportata nei dati SiSMG per le singole città. Questo dato è presente nei dati dell’ISTAT, ma al momento questi risultano fortemente distorti al centro-sud a causa della selezione applicata nella scelta dei comuni (i dati ISTAT riportano solo comuni che abbiano avuto un eccesso di mortalità pari al 20% nel mese di Marzo rispetto agli anni precedenti).

Stima delle diverse componenti di mortalità legate al Covid-19 ottenute con il metodo iterativo descritto nel testo in funzione del tempo e dell’età riportati separatamente per le città del Nord e del Centro-Sud

Dall’andamento temporale, si può notare subito come il contributo “correlated” sia inferiore al 10% al Nord, mentre al Sud sembra più significativo, con un andamento piatto. L’andamento temporale della componente di morti “undetected” risulta ben determinato dalle città del Nord.

Dal confronto della distribuzione per età, risulta invece evidente come questa sia significativamente differente al Nord e al Centro-Sud. Questo implica che le diverse componenti di mortalità contribuiscano in modo diverso in zone che presentino un diverso impatto del Covid-19.

Abbiamo confrontato le distribuzioni di età per le singole componenti da noi stimate. Notiamo che la distribuzione in età per gli “undetected” risulta più anziana rispetto a quella ufficiale Covid-19 e concentrata ad età maggiori di 85 anni. Viceversa quella “correlated” è spostata ad età inferiori sia rispetto alla distribuzione Istat nazionale per il 2019 che a quella dei decessi del mese di febbraio 2020 per gli stessi comuni. Tutto ciò è mostrato dai due grafici successivi.

Confronto delle distribuzioni di età tra le diverse componenti di mortalità legate al Covid-19 identificate nel testo per le città da noi studiate. L’eccesso delle morti “correlated” è confrontato anche alla distribuzione di età che si può ottenere a partire dai dati ISTAT nazionale per il 2019 e per le stesse città nel mese di Febbraio 2020

Conclusioni

  • Questo studio mostra che il dato anagrafico permette di ricavare anche informazioni relative non solo alla diffusione del virus ma anche a suoi effetti collaterali.
  • La distribuzione in età mostra notevoli differenze tra Nord e Centro-Sud. Questa è una chiara indicazione che l’eccesso di mortalità sia di natura diversa tra i due campioni.
  • La componente di decessi correlata al virus, dovuti ad esempio alla maggiore difficoltà o alla paura di accedere alle cure, è attualmente una componente molto minoritaria al Nord ma potrebbe non essere trascurabile (con grandi incertezze) al Centro-Sud.
  • Questa informazione fornisce ulteriori indicazioni per determinare le strategie di riapertura delle attività nel nostro paese.

Questa analisi rappresenta un primo tentativo di utilizzo dei dati relativi ai decessi anagrafici per identificare i diversi contributi della mortalità dovuta al Covid-19. Il metodo iterativo utilizzato si basa su alcune assunzioni che sono potenzialmente affette da errori sistematici, anche significativi. Per esempio, per una misura più precisa del contributo “correlated” è necessario determinare nel modo più accurato possibile la baseline dal dato storico. Al contempo, abbiamo assunto che il rapporto tra le morti Covid ufficiali e “undetected” sia uniforme in media su tutto il territorio italiano. Per migliorare questo studio, è necessario avere a disposizione maggiori informazioni, in particolare dati relativi a tutto il territorio italiano che contengano ad esempio la causa del decesso ed il sesso.

--

--