Cosa dovresti sapere sui dati COVID-19

Essere in grado di comprendere le carenze dei dati di COVID-19 e le ragioni che ne stanno alla base è essenziale per potersi proteggere.

francesco miglietta
COVID-19 DATA
19 min readApr 5, 2020

--

Nota: Questa è una traduzione dell’articolo originale in inglese “What is wrong with COVID-19 data?” di Deniz Altınbüken.

Dalla fine di febbraio, ho guardato i grafici per poter ragionare sulla malattia COVID-19 (pronunciato co-vid-19) causata dal nuovo coronavirus chiamato SARS-CoV-2 (pronunciato sars-co-v-2). Scommetto che anche Voi state facendo la stessa cosa. La rapida diffusione della SARS-CoV-2 sta rendendo la raccolta dei dati un compito estremamente impegnativo, con il risultato di dati scarsi e incompleti. Se non prestiamo abbastanza attenzione, le conclusioni che ne derivano possono essere molto sbagliate. Purtroppo, una quantità considerevole di articoli e post di notizie includono informazioni errate perché trascurano i dettagli su come i dati utilizzati vengono raccolti ed il loro significato. Questo si aggiunge al pool di incognite che dobbiamo affrontare durante questa pandemia in rapida evoluzione.

Per poterci proteggere da informazioni errate, dobbiamo comprendere le carenze dei dati disponibili. In questo modo, possiamo concentrarci sulle questioni reali invece che su quelle false. Dovremmo inoltre capire come e perché una dichiarazione può essere sostenuta da numeri ed essere ancora sbagliata.

DATI ESISTENTI

ARS-CoV-2 ha iniziato a diffondersi tra la popolazione cinese nel mese di dicembre. Il 31 dicembre 2019 la Cina ha segnalato all’Organizzazione Mondiale della Sanità la malattia COVID-19 causata dalla SARS-CoV-2 come polmonite con causa sconosciuta. Di conseguenza, la prima informazione resa pubblica appartiene alla Cina come 548 casi e 17 decessi. La Cina ha fornito questo primo dato il 22 gennaio 2020.

Figure 1 Situazione Italiana aggiornato al 5 Aprile 2020.
Figure 1 Situazione Italiana aggiornato al 5 Aprile 2020. Source: Dipartimento della protezione Civile

A questo punto, ci sono centinaia, forse migliaia di grafici e tabelle disponibili online sulla diffusione di COVID-19. La maggior parte di questi, come quello di cui sopra, utilizza uno dei set di dati disponibili al pubblico. Alcune istituzioni, un paio elencate di seguito, le mantengono utilizzando annunci fatti da funzionari statali e governativi:

Anche se tutti gli articoli di giornale, i post dei blog e i documenti accademici utilizzano lo stesso insieme di dati, a volte giungono a conclusioni molto diverse. Per capire il perché, è importante sapere come vengono raccolti i dati su COVID-19.

RACCOLTA DATI

Per capire come si sta diffondendo COVID-19, i servizi ufficiali stanno raccogliendo e annunciando quanto segue: numero di test, numero di casi, numero di decessi, numero di pazienti in condizioni critiche e numero di recuperi. Per poter dare un senso a queste cifre, dobbiamo guardare come vengono raccolte.

Il numero di test: Il numero di test relativi ad un determinato giorno si riferisce al numero di test la cui elaborazione è stata completata in quel giorno. Per ciascun Paese, questo numero è determinato dalla rapidità con cui vengono prodotti ed elaborati i test. Di conseguenza, quando la velocità di produzione e lavorazione dei test aumenta, aumenta anche il numero di test al giorno. Alcuni paesi (come la Corea del Sud e la Germania) hanno aumentato i test molto rapidamente. Al momento in cui scriviamo, altri paesi (come gli Stati Uniti e l’Italia) sembrano aumentare le capacità di test ad un ritmo più lento. Si noti che, per ora, i numeri intorno ai test non sono pubblicizzati con precisione da molti paesi, rendendo impossibile anche solo includere numeri specifici.

Il numero di casi: Il numero di casi in un determinato giorno è determinato dal numero di risultati positivi dei test raccolti in quel giorno. Un individuo infetto da COVID-19 è incluso nel conteggio dei casi solo se viene sottoposto al test e riceve un risultato positivo. Poiché il numero di test disponibili è limitato e i tempi di elaborazione possono essere lunghi, il test non è disponibile per ogni individuo. Negli Stati Uniti, al momento in cui scriviamo, solo le persone ad alto rischio con sintomi vengono sottoposte al test. Di conseguenza, i casi ufficiali non includono molti individui che contraggono il COVID-19 (principalmente quelli che hanno sintomi più lievi o che non presentano sintomi). L´impatto di questi casi non conteggiati sul totale è ancora sconosciuto.

Il numero di decessi: Il numero di decessi in un determinato giorno si riferisce al numero di pazienti che sono deceduti in quel giorno e che in precedenza avevano ricevuto un risultato positivo del test. Se un individuo ha contratto il COVID-19 ed è deceduto prima di sottoporsi al test, non può essere conteggiato nel numero dei decessi. In alcuni casi, se un individuo non è stato sottoposto al test o se il suo test era in attesa, può essere finalizzato post-mortem. Se un ospedale ha bisogno di utilizzare le proprie risorse per aiutare altri pazienti, potrebbe dare priorità al test di altri pazienti rispetto al completamento dei test post-mortem. Anche se questo escluderebbe alcuni decessi dal conteggio totale dei decessi, sarebbe una scelta ragionevole da fare quando ci sono delle vite in gioco. È anche essenziale pensare al caso opposto di un individuo che è risultato positivo ma che è morto per altri motivi. Non sappiamo se i numeri dei decessi annunciati includano questi rari casi.

Il numero di pazienti in condizioni critiche: Questo numero rappresenta quanti pazienti con un risultato positivo al test mostrano sintomi critici in un determinato giorno. Se una persona è in condizioni critiche, ma non è mai andata in ospedale o ci è andata ma non ha fatto il test, probabilmente non è inclusa in questo conteggio.

Il numero di recuperi: Il numero di recuperi si riferisce ai pazienti il cui test COVID-19 è risultato negativo dopo aver ricevuto una diagnosi positiva in precedenza. I test COVID-19 rilevano i geni della SARS-CoV-2 oppure gli anticorpi che il nostro sistema immunitario produce per combattere il virus. I test COVID-19 esistenti non sono accurati al 100% e possono dare risultati falsi. Per attenuare questa situazione, molti ospedali dimettono i pazienti solo dopo aver ricevuto un paio di risultati negativi consecutivi. Se gli ospedali hanno poche risorse, potrebbero dimettere i pazienti con meno risultati negativi. Come nota a margine, gli esperti indicano questi risultati di test falsi negativi come la ragione dei casi di reinfezione segnalati.

Figure 2 Aggiornamenti per le giornate del 4 e 5 Aprile 2020.
Figure 2 Aggiornamenti per le giornate del 4 e 5 Aprile 2020. Source: Ministero della Salute Italiano. Vedi tabella 4 Aprile e tabella 5 Aprile

Quindi, quando si guarda una statistica come questa e si vedono i conteggi totali, si dovrebbe leggere nel modo seguente:

“I nuovi casi riscontrati in Italia il 5 Aprile ammontano a 4.316 (128.948–124.623) , comparati al giorno precedente. Fra questi, 2.972 sono i nuovi casi positivi, 819 sono stati dimessi poiché guariti, e 525 sono i deceduti”.

Nota: Poiché le cifre giornaliere non sono visibili nelle tabelle soprastanti, é stata fatta una sottrazione dei totali.

CRONOLOGIA DEI DATI

Vi siete resi conto di qualcosa di strano quando abbiamo letto dei casi in Italia? Quando parliamo di casi e di decessi per un determinato giorno, ci riferiamo a fatti accaduti in passato:

  • I risultati positivi dei test che sono stati annunciati il 4 aprile appartengono molto probabilmente a persone che hanno iniziato ad avere sintomi un paio di giorni prima. Considerando quanto tempo ci vuole in media perché le persone mostrino i sintomi di COVID-19 (la media è stimata in 5,1 giorni, e il 97,5% di coloro che sviluppano i sintomi lo fanno entro 11,5 giorni), queste persone probabilmente hanno contratto il virus al massimo due settimane fa.
  • I pazienti che sono deceduti il 4 aprile sono tra gli individui che in precedenza erano risultati positivi. Poiché il numero di giorni in cui questi pazienti hanno combattuto contro il COVID-19 non è stato annunciato, non sappiamo quando hanno contratto il COVID-19 e quando sono stati contati tra i casi ufficiali.

In poche parole, i numeri che vengono annunciati come appartenenti allo stesso giorno non si riferiscono ad eventi (come la contrazione del virus) che sono avvenuti nello stesso giorno. Questo potrebbe soprattutto portare a un tasso di mortalità non corretto: Quando viene calcolato il tasso di mortalità, potrebbero essere utilizzati tutti i dati disponibili fino a quel giorno. Ciò include i casi che hanno portato a decessi o recuperi, nonché i casi in corso. Questa discrepanza temporale, combinata con la disparità dei test, rende il tasso di mortalità una metrica molto difficile da calcolare con precisione.

DIVERSI PAESI

Dall’inizio della pandemia COVID-19, ogni Nazione ha temuto che il primo caso venisse individuato all’interno dei suoi confini. Al momento in cui scriviamo, la maggior parte dei Paesi ha annunciato casi di COVID-19. Tuttavia, ogni Paese ha segnalato diversi tassi di infezione e di decesso.

Questa variazione nei tassi di infezione e di mortalità potrebbe derivare da differenze geografiche, socio-economiche e politiche tra i vari Paesi. Ad esempio, la SARS-CoV-2 si diffonde più rapidamente nelle aree altamente popolate, dove le persone vivono vicine. Pertanto, quando un Paese prende rapidamente decisioni difficili per far rispettare le distanze sociali e le restrizioni di viaggio, anche la diffusione del virus può essere rallentata rapidamente.

Per poter ragionare sull’efficacia e la necessità di queste misure, è fondamentale considerare quanto segue quando si analizzano i dati di diversi paesi:

Il numero di test: Come abbiamo già detto in precedenza, il numero di test che vengono effettuati influenza direttamente il numero di casi riscontrati. Inoltre, man mano che si rende disponibile un numero maggiore di test, al conteggio dei casi si aggiunge un numero maggiore di casi lievi che non si concludono con la morte. Di conseguenza, quando un paese sottopone a test più persone e trova più casi, il tasso di mortalità per quel paese può diminuire. Questo è supportato dai tassi di mortalità che escono da Paesi come la Germania e la Corea del Sud, dove i test sono più diffusi che in altri Paesi.

La popolazione: I numeri che vengono annunciati sono dati come caso e i numeri di decessi per un determinato paese. Tuttavia, i paesi hanno popolazioni drasticamente diverse. Per sottolineare questo: Wuhan è una città della Cina, con una popolazione di 11 milioni di persone. È nella provincia di Hubei che ha una popolazione di 60 milioni di abitanti. A titolo di confronto, è più grande dell’Inghilterra (55 milioni), e un po’ più piccola della Francia (67 milioni). D’altra parte, la Svizzera ha una popolazione di 8 milioni di persone, proprio come New York. Date queste differenze di popolazione, il confronto del numero totale di casi tra i vari Paesi non rappresenta bene la realtà. Invece, guardando il numero di casi per 1 milione di persone, si ottiene un quadro più preciso. Al momento in cui scriviamo, il numero di casi per 1 milione di persone è di 937 negli Stati Uniti, 2061 in Italia e 2699 in Spagna. Se questo numero è utile per capire il passato, se vogliamo ragionare sul futuro, il tasso di crescita dei casi e dei decessi è una metrica migliore. È anche importante tenere presente che il tasso di crescita è influenzato da molti fattori, come la distanza sociale e la densità della popolazione.

Periodo di incubazione COVID-19: Secondo gli ultimi studi, il 97,5% degli individui che mostrano i sintomi della COVID-19 li sviluppa in 11,5 giorni. Dopo lo sviluppo dei sintomi, gli individui potrebbero essere testati e contati come un caso. Quindi, gli effetti di misure come il divieto di uscire iniziano ad emergere nei dati circa due settimane dopo che sono stati applicate. Questo ritardo è stato osservato in Cina, Italia e California: Circa due settimane dopo l’attuazione del blocco, il tasso di crescita dei casi e dei decessi ha iniziato a rallentare. Quindi, quando si valuta l’efficacia delle misure, è essenziale tenere conto di questo ritardo.

Capacità del sistema sanitario: Nei casi gravi, COVID-19 causa danni al tessuto polmonare, rendendo difficile la respirazione dei pazienti. Inoltre, la SARS-CoV-2 infetta le nostre cellule immunitarie, facendole attaccare i nostri tessuti sani. Pertanto, i pazienti il cui corpo non è in grado di sopportare questi sintomi devono essere ricoverati in terapia intensiva, richiedendo un posto letto in terapia intensiva e, nella maggior parte dei casi, ventilatori per continuare a respirare. Quando un’epidemia si diffonde troppo rapidamente, un troppo elevato di pazienti potrebbe necessitare di queste strutture allo stesso tempo, sovraccaricando le capacità degli ospedali. Per spiegare questo con i numeri di New York al momento di scrivere: è stato riportato che vi erano 2.200 ventilatori in riserva nello stato. Ogni giorno 350 nuovi pazienti venivano ricoverati per cure critiche, che necessitavano di ventilatori. Ciò significa che tutti i ventilatori sarebbero stati messi a disposizione nel giro di una settimana se il numero dei nuovi casi fosse rimasto costante. Se i pazienti devono essere collegati ai ventilatori per più di una settimana, non ci saranno ventilatori disponibili per i nuovi pazienti. In una situazione come questa, la mancanza di capacità negli ospedali provoca decessi che altrimenti potrebbero non verificarsi, in effetti, aumentando il tasso di mortalità per il Paese.

Distribuzione dell’età e salute: Infine, i dati esistenti suggeriscono che COVID-19 è più letale per gli anziani. Ci potrebbero essere un paio di ragioni per questo: In primo luogo, il corpo degli individui più anziani potrebbe essere meno resistente nel sopportare le sollecitazioni fisiche causate da COVID-19. In secondo luogo, quando gli ospedali sono sovraccarichi e i ventilatori scarseggiano, i pazienti più giovani hanno spesso la priorità, aumentando il tasso di mortalità dei pazienti più anziani. Di conseguenza, la distribuzione per età di un paese può influenzare il tasso di mortalità che viene attribuito a quel paese. Inoltre, per gli individui più giovani, ci potrebbero essere molti fattori, come il numero di virus che hanno contratto, la loro salute generale e la composizione genetica, che potrebbero determinare il loro successo contro il COVID-19. Al momento, non abbiamo abbastanza conoscenze per capire l’importanza di questi fattori. Quindi, se gli individui più giovani in un paese sono più vulnerabili a causa di un fattore che non conosciamo, questo non si può prevedere guardando i numeri di altri paesi.

Quando si analizzano i dati provenienti da diversi Paesi e si cerca di arrivare a una conclusione sullo stato delle cose nella propria area, è molto importante tenere a mente questi dettagli.

DATI GENETICI

La SARS-CoV-2 continua a diffondersi rapidamente in tutto il mondo. Al momento della stesura della presente relazione, il numero di casi ha superato il milione. I laboratori di tutto il mondo stanno raccogliendo dati genetici sulla SARS-CoV-2 e sono disponibili al pubblico una serie di dati e grafici che ogniuno può esaminare. Analogamente ai numeri raccolti sulla diffusione di COVID-19, è molto importante comprendere questi dati genetici prima di trarre conclusioni.

Per fare un esempio: Ci sono dati che mostrano che durante la sua diffusione, la SARS-CoV-2 sta subendo mutazioni genetiche, e alcuni articoli suggeriscono che queste mutazioni potrebbero cambiare l’infettività e la mortalità del virus, oltre a rendere inutile l’immunità ottenuta contro il virus. La mappa qui sotto mostra il viaggio della SARS-CoV-2 utilizzando campioni provenienti da tutto il mondo.

Figure 3 Mappa del mondo che visualizza la trasmissione del SARS-CoV-2.
Figure 3 Mappa del mondo che visualizza la trasmissione del SARS-CoV-2. Source: Nextstrain

Prima di giungere a conclusioni e diventare ansiosi a causa di una mappa, è importante conoscerne i dettagli. I dati genetici relativi alla SARS-CoV-2 vengono creati mediante il sequenziamento dei codici genetici presenti nei virus che vengono prelevati dagli individui. La molecola di RNA nella SARS-CoV-2 porta il genoma virale che utilizza per riprodursi. La molecola di RNA è circondata da uno strato proteico nucleocapside, che è coperto da una membrana lipidica, che è costellata da proteine di punta. (Ecco perché lavarsi le mani con il sapone ci protegge da COVID-19: Il sapone rompe la membrana lipidica, distruggendo il virus). La SARS-CoV-2 usa queste proteine di punta per legarsi alle cellule epiteliali dei nostri polmoni, infettandole e usandole per copiarsi.

Figure 4 Struttura del SARS-CoV-2.
Figure 4 Struttura del SARS-CoV-2. Source: Economist Illustrator: Manuel Bortoletti

Un individuo acquisisce l’immunità contro la SARS-CoV-2 quando gli anticorpi prodotti dal suo sistema immunitario imparano a legarsi alle proteine del virus. Quando le proteine del picco vengono coperte dagli anticorpi, il virus non può infettare le cellule polmonari e copiare se stesso. Pertanto, se la SARS-CoV-2 volesse sfuggire all’immunità, deve mutare in modo da alterare le sue proteine di picco. È possibile? Per capirlo, dobbiamo capire come i virus mutano.

In Generale: Una volta che un virus infetta una cellula, inizia a replicare parti di virus usando la cellula come fabbrica. I bluerprint delle sue parti sono codificate nell’RNA che porta con sé. Il processo di replicazione è soggetto a errori, soprattutto quando viene utilizzato l’RNA. Questi errori casuali che si verificano durante la replicazione possono avere qualche effetto o non hanno alcun effetto sulla struttura o sulla funzione di un virus appena creato. Se gli errori hanno un effetto, può essere negativo o positivo per il virus. Alcuni errori possono modificarne la struttura o la funzione, impedendo al nuovo virus di diffondersi ulteriormente o aiutandolo a sfuggire all’immunità. È importante notare che, poiché questi errori si verificano in modo casuale, è più probabile che un determinato errore non determini un cambiamento significativo.

Se si tiene conto di questi dettagli sul comportamento dei virus, che non è nemmeno lontanamente completo per quanto riguarda la conoscenza dei virus, la mappa del mondo soprastante inizia a sembrare meno spaventosa. Nella mappa, diversi campioni di SARS-CoV-2 sono mostrati come linee distintive. Tuttavia, le linee distinte non implicano una differenza nella struttura o nel comportamento della SARS-CoV-2 in questi campioni. Infatti, nella versione originale del diagramma qui sotto, che utilizza gli stessi dati, è possibile passare il mouse sui punti e vedere se i diversi campioni avevano mutazioni nucleotidiche.

Figure 5 Diagramma di visualizzazione di diversi campioni di SARS-CoV-2.
Figure 5 Diagramma di visualizzazione di diversi campioni di SARS-CoV-2. Source: Nextstrain.

Tornando alla domanda se la SARS-CoV-2 può mutare per sfuggire all’immunità o diventare più letale: La risposta sembrerebbe essere sì, queste mutazioni sono possibili. Tuttavia, i grafici colorati non implicano che siano già accadute, ed è essenziale capire quanto sia probabile che accadano, dato che questa capacità cambia da virus a virus. Potrebbe anche darsi che la SARS-CoV-2 non siamolto brava a mutare la sua proteina di picco. Per ottenere risposte definitive, dovremo aspettare che escano nuove ricerche. E per questo, abbiamo bisogno di più tempo.

RICERCA E TEMPO

L’epidemia di COVID-19 è una situazione in rapida evoluzione, complicata e senza precedenti. Per poter ragionare su situazioni complesse come questa pandemia, ci affidiamo alla ricerca scientifica. In tutti i campi che sono rilevanti per la COVID-19, come la matematica, la statistica, l’economia, la scienza dei dati, l’apprendimento automatico, la biologia, la genetica, la virologia, la chimica e la medicina, gli esperti usano il metodo scientifico per trovare risposte a domande sconosciute. Ad esempio, quando un team di ricerca di virologia vuole trovare la risposta a una domanda (“In che modo la SARS-CoV-2 è influenzata dalla temperatura?”), conduce centinaia di esperimenti nel suo laboratorio e ne registra i risultati. Molti esperimenti vengono ripetuti decine o addirittura centinaia di volte, e con parametri diversi, per aumentare la fiducia nei dati raccolti. Alla fine, i ricercatori scrivono un articolo che descrive le tecniche che hanno usato, i dati che hanno raccolto e le conclusioni che hanno tratto dai loro dati. Prima che l’articolo possa essere pubblicato, altri esperti del settore lo rivedono, esaminando se i ricercatori hanno utilizzato tecniche corrette, condotto esperimenti in modo corretto e interpretato i dati in modo accurato. Se approvato dai revisori, l’articolo viene pubblicato, diventando di dominio pubblico.

Poiché dobbiamo capire e combattere COVID-19 rapidamente, la ricerca che esamina la diffusione di COVID-19 e studia la SARS-CoV-2 progredisce più velocemente del solito. Questa velocità ha vantaggi e svantaggi.

Le ricerche che vengono condotte e pubblicate rapidamente ci aiutano a controllare l’epidemia di COVID-19. Ci sono alcuni grandi esempi di come una ricerca agile può aiutare. I test SARS-CoV-2 che sono stati sviluppati rapidamente ci hanno aiutato a identificare e isolare i casi. I modelli costruiti per prevedere gli effetti dell’allontanamento sociale ci hanno aiutato a rallentare la diffusione. I nuovi trattamenti stanno aiutando ad alleviare i sintomi per i pazienti. E la rapida ricerca sui vaccini ci sta dando speranza per l’eradicazione del COVID-19.

D’altra parte, gli articoli che vengono pubblicati rapidamente e senza la revisione di altri esperti possono includere errori. Le ricerche che normalmente si basano su dati provenienti da centinaia di esperimenti possono utilizzare i dati di un minor numero di esperimenti, rendendo più probabile che le conclusioni siano errate. Di conseguenza, è molto importante continuare a mettere in discussione e rivedere questi articoli dopo che sono diventati di dominio pubblico. Inoltre, è molto importante tenere presente che gli esperimenti di ricerca sono condotti in contesti di laboratorio specifici; pertanto, per trarre le giuste conclusioni dagli articoli di ricerca, sono necessari contesto e competenza. Gli articoli di attualità e altri contenuti che vengono creati senza consultare esperti possono giungere a conclusioni errate, fuorviando il pubblico.

Il miglior esempio è l’articolo che esamina la stabilità della SARS-CoV-2 su diverse superfici. I ricercatori hanno valutato la stabilità di superficie della SARS-CoV-2 in aerosol e su varie superfici. Per esaminare la stabilità nell’aria, essi iniettano il 50% della dose infettiva tissutale (TCID₅₀) di SARS-CoV-2 in un tamburo di Goldberg, che è fondamentalmente un barile chiuso da 40 litri. Poi contano il numero di SARS-CoV-2 che rimangono vitali.

Figure 6 Viabilità della SARS-CoV-1 e della SARS-CoV-2 negli Aerosol e su varie superfici.
Figure 6 Viabilità della SARS-CoV-1 e della SARS-CoV-2 negli Aerosol e su varie superfici. Source: NEJM

Alcuni articoli di notizie hanno riportato che la SARS-CoV-2 rimane in aria per 3 ore, utilizzando questo articolo come fonte. Questa conclusione non è corretta. Il massimo che possiamo dire, guardando a questa ricerca, è: “In un fusto chiuso da 40 litri che è stato iniettato con l’aerosol di SARS-CoV-2, il numero di virus è diminuito di dieci volte durante le 3 ore di esperimento. Il numero di virus non è sceso a 0”. Non è corretto trarre la conclusione che la SARS-CoV-2 rimane praticabile all’aria aperta dopo 3 ore. Per poterlo dire, avremmo bisogno di condurre esperimenti all’aria aperta in varie condizioni.

Questo, naturalmente, non significa che questo articolo di ricerca sia sbagliato o insignificante. Al contrario, questa ricerca è essenziale per comprendere la stabilità della SARS-CoV-2 su diverse superfici. Come risultato di questa ricerca, ci possono essere piani per utilizzare più spesso il rame per le superfici negli ospedali. Il punto importante è che è fondamentale trarre le giuste conclusioni dagli articoli di ricerca e dirottare il nostro tempo e le nostre limitate risorse verso i problemi giusti.

CONCLUSIONI

In questo articolo, abbiamo trattato il tipo di carenze esistenti nei dati COVID-19 e SARS-CoV-2 e a cosa dobbiamo prestare attenzione quando esaminiamo questi dati. Per un uso corretto è essenziale capire come vengono raccolti i dati e a quali tempi si riferiscono. Gli articoli scritti senza cura per i dettagli potrebbero trarre conclusioni errate e diffondere informazioni errate al pubblico.

La difficoltà nell’uso dei dati COVID-19 non dovrebbe dissuaderci dall’indagare, analizzare e riferire. È essenziale continuare a fare ricerca per tenere sotto controllo l’epidemia, per sviluppare trattamenti e vaccini. Riconoscere le carenze dei dati COVID-19 e le sfumature necessarie per lavorare con essi ci permetterebbe di fare la nostra parte in modo più abile.

Quindi cosa dovremmo fare?

La cosa migliore da fare è riconoscere la complessità della situazione con cui abbiamo a che fare e il fatto che non abbiamo ancora tutti i dati per ragionare. Pertanto, può essere vitale per voi e per le persone che vi circondano ascoltare i consigli degli esperti, scegliere di stare sul sicuro, e a volte fare cose che potrebbero sembrare eccessive. Inoltre, se state creando dei contenuti, sarebbe saggio mettere costantemente in discussione i dati e le conclusioni che ne derivano. Per dare alcuni suggerimenti specifici:

  • Se sei un reporter e vuoi coprire un articolo di ricerca, puoi ottenere più contesto e conoscere i dettagli importanti da sottolineare parlando con un esperto del settore.
  • Prima di condividere contenuti creati da altri, potete verificare se sono stati creati consultando un esperto o se sono supportati da esperti.
  • Se siete più giovani, potreste pensare che COVID-19 non sia pericoloso per voi. Tenendo conto delle carenze dei dati disponibili, potreste voler ripensare a questa ipotesi e prendere precauzioni che potrebbero salvarvi la vita.
  • La SARS-CoV-2 può durare su varie superfici per un certo periodo di tempo. Anche se non ci sono dati precisi sulle superfici con cui si interagisce nella vita quotidiana, è abbastanza concludente che la SARS-CoV-2 rimane valida sulle superfici. Questo è un esempio di un caso in cui non abbiamo bisogno dei dati più precisi. Possiamo ridurre il rischio di contrarre l’infezione semplicemente lavandoci le mani con il sapone più regolarmente.

Per concludere, durante questi tempi senza precedenti e altamente complessi, mettere in discussione i dati che state guardando può salvarvi la vita. In una situazione in rapida evoluzione, in cui ci vorrà del tempo per sviluppare una comprensione completa, essere prudenti e sicuri potrebbe essere la scelta giusta. Quindi, siate cauti, mettete in discussione le cose che leggete, mettete in discussione i vostri pensieri. Lavatevi le mani. Rimanete a casa e state al sicuro.

Condividete

Ho scritto questo articolo per migliorare le conoscenze sui dati del COVID-19. Oltre ad ascoltare gli esperti, noi come individui dobbiamo essere in grado di ragionare su questa situazione che sta influenzando le nostre vite per proteggere noi stessi. Questo può significare vita o morte per molte persone. Per aiutarmi a diffondere la cultura intorno a COVID-19, vi prego di condividere questo articolo. C’è anche una versione in Turco, se voleste condividerlo.

Fonti di dati

Se siete interessati ad analizzare i dati per voi stessi, potete utilizzare i dati disponibili al pubblico per creare i vostri grafici e modelli. Questo esercizio vi mostrerà quanto sia difficile usare i dati COVID-19 e quanto sia facile creare grafici illeggibili come quello qui sotto. Di seguito è riportato un elenco di fonti che uso e che sono disponibili su GitHub:

Figure 7 Grafico che mostra il numero di casi di ogni Nazione utilizzando dati non strutturati.
Figure 7 Grafico che mostra il numero di casi di ogni Nazione utilizzando dati non strutturati. Data source: JHU CSSE Graph by Deniz Altınbüken

Disclaimer

Non sono un esperta in virologia, medicina, biologia, genetica, economia, sociologia, sociologia, politica o statistica. Ho un dottorato di ricerca in sistemi informatici distribuiti, e sono un esperta nella costruzione, comprensione, semplificazione e miglioramento di sistemi complessi che utilizzano la codifica, l’analisi dei dati e i test. Ho fatto ricerca, lavorando con l’apprendimento automatico e l’analisi dei dati per molti anni. Questo articolo non è stato scritto per criticare una persona o un’istituzione specifica. Vuole essere obiettivo e sottolineare la complessità del sistema con cui abbiamo a che fare e le sfumature dei dati disponibili. È stato scritto utilizzando i dati e le fonti disponibili il 4 aprile 2020. Se trovate un errore, potete inviarmi un’e-mail all’indirizzo contact@denizaltinbuken.com.

Fonti Bibliografiche

Il contenuto di questo articolo si basa su centinaia di articoli che ho letto negli ultimi mesi e sui dati pubblicamente disponibili che ho analizzato per molte ore. Riporto le fonti che ricordo di aver letto qui, ma non è un elenco esaustivo.

--

--