Data journalism, come i giornali hanno iniziato ad amare i grafici

Giulia Banfi
Mapping Journalism
Published in
11 min readJun 29, 2023

Le sfide, le opportunità e i primi sviluppi del data-journalism, un’arte ancora tutta da scoprire e sfruttare per rendere i dati sempre più accessibili.

di Martin Miraglia

Le società moderne hanno iniziato a misurare tutti i campi della vita umana e a questo sforzo è seguito quello dei mezzi d’informazione, sia la carta stampata che il giornalismo televisivo che specialmente, a causa della loro interattività, le testate d’informazione su Internet.

In questo contesto si sviluppa anche il data-journalism, ovvero l’arte di promuovere storie con un valore notizia che vengano esposte o che siano state acquisite e svelate dall’elaborazione di un grande set di dati, generalmente tramite un computer o, precedentemente, di un calcolatore di qualche tipo.

Sebbene alcuni ricercatori sostengono che il data-journalism sia il successore del computer-assisted reporting (Cox, 2000), ovvero l’uso di computer per raccogliere dati che hanno un valore notizia quando usati all’interno di una storia, il data-journalism di per sé ha potenzialità molto più avanzate della sola illustrazione dei dati in un prodotto editoriale e non è nemmeno strettamente necessario l’utilizzo di un computer per la fase di acquisizione dei dati: sebbene questo sia il metodo per ottenerli di gran lunga più comune, nel caso della ricerca di dati da fonti cartacee e non digitalizzate il processo di raccolta non può che essere manuale.

Il progresso del data-journalism nel corso del tempo è stato lento e dettato sia dai ritmi del progresso tecnologico ma anche dalla necessità dapprima della generazione dei dati stessi, di abbattere gli alti costi delle memorie di archiviazione e poi dal tempo che è servito per radicarsi all’interno dei processi editoriali vincendo le resistenze delle tradizioni che lo hanno relegato a un ruolo di nicchia o a compiti specifici per diverso tempo — uno su tutti, l’esposizione dei risultati elettorali.

NYTimes dell’8 aprile 2020
NYTimes del 25 febbreio 2021
NYTimes del 22 marzo 2020

La pandemia da Covid-19 nel 2020 ha messo rapidamente e definitivamente fine a ogni tipo di resistenza in merito al valore aggiunto del data-journalism: in un momento storico nel quale in pochi giorni il discorso pubblico è stato rapito da discussioni su tassi di riempimento degli ospedali, tassi di replicazione e indici di correlazione mentre le distorsioni prodotte dalle restrizioni governative hanno prodotto scostamenti mai visti sia sui mercati finanziari che sui tassi di occupazione, la raccolta, la disseminazione e la presentazione dei dati sono diventati imprescindibili per tutti i mezzi di informazione in tutto il mondo. (Dessai et al., 2021)

Cos’è il data journalism

Il data-journalism descrive una serie di competenze intersezionali che di per sé non sono né una pura specialità giornalistica né un medium. Una definizione completa e precisa è sfuggente, tanto quanto è difficile cosa sia un dato. “Qualsiasi cosa contabile può essere un dato”, secondo un articolo di Troy Thibodeaux del 2011, ma una definizione del genere non può che generare confusione: esistono dati geografici che possono essere mappati, esistono dati finanziari, tracciamenti dei movimenti e delle azioni, degli acquisti e via discorrendo. Il data-journalism, secondo Thibodeaux, è quindi sicuramente computer assisted, ma in ogni caso è “una tendenza ad analizzare qualsiasi cosa sia categorizzabile, quantificabile e comparabile in una qualsiasi storia di un mezzo di informazione, e una convinzione che tale sguardo possa indicare cosa sia meritevole di essere conosciuto e inapprendibile in qualsiasi altro modo”.

I primi esempi di data journalism ante litteram si rincorrono nella storia. Sebbene alcuni autori, come Birkhoff nel 1980, collochino temporalmente l’ingresso sulla scena del computer-assisted reporting con le elezioni presidenziali americane del 1952, quando per prima la CBS, grazie a un computer UNIVAC, permise a Walter Cronkite e alla sua redazione di prevedere la vittoria di Eisenhower sulla base dei primi risultati che arrivavano via via dai singoli stati, l’uso su carta di dati grafici compare già nel 1786 quando William Playfair pubblicò il ‘The Commercial and Political Atlas’ a Londra, il quale conteneva al suo interno 43 serie temporale e un grafico a barre.

L’analisi dei dati, una volta che ha svelato qualcosa di nuovo (una tendenza, un fatto, una correlazione con significanza statistica) necessita però di un mezzo per presentare agli spettatori, che siano lettori o telespettatori poco importa, i risultati dell’analisi. In questa fase entrano in gioco i tools, ovvero gli strumenti che permettono una visualizzazione dei dati.

I vantaggi e le opportunità date dal data journalism

L’analisi dei dati permette ai giornalisti (e agli analisti di dati, il cui mestiere è lo stesso fino almeno alla fase di reporting per i quali l’audience è diversa e di conseguenza lo sono i metodi di divulgazione) di raccontare storie in modo più ricco e interattivo, in primo luogo. Gli esempi di questo sono infiniti: notizie sul cambiamento climatico possono essere accompagnate da mappe interattive che ‘giocando’ con i livelli possono insegnare molto del territorio circostante, di quanto spesso è scarsamente percepito nella vita di tutti i giorni. Le analisi e le informazioni basate sui dati, poi, possono spiegare le ragioni di processi decisionali altrimenti difficilmente comprensibili. Storie complicate possono poi fornire prospettive diverse, una volta che i dati sono stati analizzati ed esplicati in modo coerente e comprensibile.

I dati, infine, possono svelare pattern spesso ignorati o preclusi alla vista della popolazione generale, magari perché afferenti alla sfera più profondamente privata delle persone. Un esempio di quest’ultimo caso è l’inchiesta sull’epidemia di morti da overdose per eroina del quotidiano del nord della Florida Palm Beach Post del 2016. Il giornale, in quel caso, raccolse i nomi e le fotografie delle vittime da overdose di eroina dell’anno precedente, insieme alle loro storie personali.

Sul fronte dei dati, il giornale scoprì come la morte per overdose non avesse correlazioni statistiche significative né sul fronte del censo, né dell’età, né della posizione lavorativa o della condizione familiare delle persone coinvolte: morirono padri di famiglia di mezza età e giovani single, senzatetto e assistenti di procuratori, diplomati e laureati abilitati alle più varie professioni di responsabilità. Fu inoltre investigato il sistema dei centri di riabilitazione, negli Stati Uniti notoriamente privati e cari al punto da rappresentare un grosso fardello economico per le famiglie: il sistema, composto di un oligopolio di centri di riabilitazione, tentava in diversi modi di massimizzare i profitti cercando di assicurarsi che i pazienti, dopo un miglioramento o un’astinenza di un tempo variabile, fossero costretti a tornare — e a pagare per un nuovo trattamento.

Il giornale fu inoltre molto abile ad entrare nel discorso pubblico sfruttando la valenza sociale del tema dell’assunzione di droghe e della loro pericolosità, avendo a disposizione abbastanza dati per confutare gli assunti più comuni sul tema che sono parte integrante dello stigma della società nei confronti degli assuntori. E così, la prima pagina del primo giorno di pubblicazione dell’inchiesta fu semplice da costruire ma di forte impatto sociale: il logo della testata, un mosaico di fotografie che intorno alla metà del foglio broadsheet sfumavano verso il bianco. Al centro un quadrato nero per fare uno sfondo al titolo dell’inchiesta — ‘Heroin: Killer of a generation’ — l’incipit del pezzo principale che si svilupperà poi nelle pagine successive.

Sebbene il data-journalism si presti molto bene a questo tipo di indagini sociali, le sue possibilità di applicazione sono tuttavia infinite, limitate solamente dalla fantasia dei suoi applicatori. Se già prima della pandemia da Covid-19 si era infatti già preso i suoi spazi nel reporting dei risultati elettorali, o come mezzo utilissimo per illustrare storie e relazioni di causa ed effetto nel campo economico, l’adozione recente del data-journalism ha abbracciato gli argomenti più disparati, dalla mappatura dell’attività dei cartelli criminali in Colombia all’analisi delle parole più frequentemente usate nei titoli di notizie che hanno come protagoniste le donne, fino al monitoraggio dei prezzi della benzina come conseguenza delle difficoltà di approvvigionamento energetico causate dalla guerra in Ucraina.

Tale livello creatività si spiega considerando che i data-journalists sono, nella gran parte dei casi, figure professionali che non sono nate come tali ma che hanno acquisito competenze di raccolta e analisi dei dati nel corso del tempo per rispondere ad esigenze di organizzazione e tracciamento personali. Molti di loro, infatti, nascono come giornalisti politici o economici che hanno imparato l’arte tramite attività di studio personale o di partecipazione a convegni e seminari; mentre altri sono entrati nel mondo del giornalismo da background accademici o da altre professioni con esperienze di trattamento di dati ma non di giornalismo. Allo stesso modo le specifiche competenze dei singoli data-journalist, unite alle esigenze di medium ma anche di personale delle singole redazioni, hanno un ruolo nel determinare il tipo di presentazione dei dati alla loro audience, dalla predilezione verso l’uso di database interattivi all’uso di cartografie dedicate solo per fare alcuni esempi (Fink, Anderson, 2014).

Il data journalism nel contesto italiano

Sebbene anche in questo caso la pandemia da Covid-19 abbia accelerato l’apertura dei media italiani verso le potenzialità dei nuovi strumenti informatici (Lab24, la struttura di visual reporting del Sole 24 Ore, è infatti un progetto nato come risposta immediata alla prima emergenza e strutturata strada facendo in un giornale prettamente economico e già avvezzo all’uso estensivo di dati), il data-journalism in Italia rimane un campo per certi versi ancora in fasce e di conseguenza dominato da lavoratori freelance, frequentemente slegato da affiliazioni con testate informative tradizionali e reso difficoltoso per i giornalisti a causa della mancanza di accesso ai dati per le ragioni più disparate che vanno dalla loro assenza, dalla loro mancata pubblicazione alla mancata digitalizzazione o anche dalla loro pubblicazione in formati diversi, in posti diversi o in maniera disaggregata.

Si noti, a titolo di esempio, come anche a pandemia conclamata e nonostante le strutture di raccolta e diffusione dati instaurate dalla Protezione Civile e dalle singole Regioni, il rilascio dei dati atomizzati da parte delle singole Asl avveniva solitamente sotto forma di file PDF senza l’inclusione di dati storici o, nei casi peggiori, direttamente tramite messaggi di testo da parte degli uffici stampa ai capiredattori delle testate locali impedendo di conseguenza anche qualsiasi forma di scraping e di aggregazione ed analisi complessiva.

In questo contesto il progressivo inserimento di nuove figure professionali dedicate sia nella pubblica amministrazione che nei media che iniziano a sperimentare le potenzialità del data-journalism, unito a normative come il FOIA, sono benvenute ma insufficienti e il loro impatto reale rimane un tema da attenzionare. Nonostante l’interessamento recente delle testate d’informazione tradizionali, infatti, il data-journalism in Italia viene condotto principalmente da poche agenzie specializzate per quanto votate all’obiettività e alla trasparenza.

Il data-journalism nel contesto italiano, quindi, permane in uno stato di complessiva debolezza, lontano dagli esempi di Paesi vicini e non in grado di fare luce sull’opacità della pubblica amministrazione: la forza dei data-journalist italiani è limitata dallo scarso impiego da parte dei media tradizionali, dalla loro scarsa visibilità — proponendo un prodotto poco conosciuto tra il pubblico generale –, dalla difficoltà di accesso ai dati e dalla necessità conseguente di dover acquisire le competenze necessarie pressoché solamente tramite attività di studio personale (Portezza, Splendore, 2019).

Quali sfide e opportunità attendono il data journalism

Il data journalism è una pratica dalle vastissime potenzialità e in rapida affermazione nonostante ponga le sue radici sul lavoro di alcuni pionieri iniziato ormai oltre mezzo secolo fa. La recente abbondanza di dati disponibili sta via via rendendo questa specialità professionale del giornalismo imprescindibile per l’elaborazione e la presentazione di analisi di alcuni avvenimenti e dei cambiamenti della società che siano al contempo profonde e facilmente assimilabili.

Come conseguenza di questo fenomeno, comunque molto lento, e con la sua accelerazione conseguente alla pandemia da Covid-19 che ha reso lampante la necessità dello svolgimento di un lavoro di questo tipo, si stanno iniziando a vedere impatti reali del data-journalism nella società seppur in modo molto disomogeneo, mentre si sta democratizzando l’accesso se non direttamente alla professione sicuramente alla possibilità di ottenere dati e di analizzarli. Strumenti semplificati, disponibili anche online e gratuitamente, per trattare dati, performare analisi di base e visualizzarne il risultato, permettono a sempre più persone — e non solo a grandi redazioni o collettivi — di trovare modi sempre nuovi per mostrare il mondo con rappresentazioni artistiche di numeri su un numero sempre più elevato di argomenti.

Per quanto come trend generale i dati sono sempre più disponibili e sempre più facilmente, il loro reperimento rimane tuttavia l’ostacolo più grande per i data-journalists, specialmente nei Paesi come l’Italia dove questo metodo giornalistico è meno sviluppato ed è stato scoperto più recentemente che altrove.

A fare il resto ci pensano le difficoltà dell’accesso alla professione a causa della sua frequente scarsa considerazione, specialmente tra le testate tradizionali più piccole sia in Italia che all’estero, e alla conseguente difficoltà di acquisire le competenze necessarie all’analisi e alla visualizzazione dei dati.

Nonostante questo, il data-journalism si sta imponendo come un nuovo e imprescindibile modo di praticare il giornalismo, con impatti sociali non irrilevanti, e i futuri avanzamenti tecnologici non potranno fare altro che renderlo ancora più fondamentale per il giornalismo.

Riferimenti utili

Melisma Cox (17 marzo 2000). The development of Computer-Assisted Reporting, School of Communication — University of Miami

Desai, A., Nouvellet, P., Bhatia, S., Cori, A., & Lassmann, B. (ottobre 2021). Data journalism and the COVID-19 pandemic: opportunities and challenges. The Lancet, vol. 3, e619 — e621

Troy Thibodeaux (2011). 5 tips for getting started in data journalism, Poynter.com. Archiviato presso https://web.archive.org/web/20111009110642/http://www.poynter.org/how-tos/digital-strategies/147734/5-tips-for-getting-started-in-data-journalism/

Harald Sack (22 settembre 2020). William Playfair and the Beginnings of Infographics | SciHi Blog. SciHi. http://scihi.org/william-playfair-and-the-beginnings-of-infographics/ — consultato il 4 aprile 2023

Catherine Gicheru (30 ottobre 2018). 8 reasons why journalists should use data to improve their stories | International Journalists’ Network. Ijnet. https://ijnet.org/en/story/using-data-journalism-to-tell-better-stories -consultato il 4 aprile 2023

Pat Beall et. al (2016). Heroin: Killer of a generation, Palm Beach Post, https://apps.palmbeachpost.com/ourdead/ — consultato il 4 aprile 2023

(16 dicembre 2022). The best data journalism stories of 2022 | DataJournalism.com. European Journalism Centre. https://datajournalism.com/read/blog/best-data-journalism-projects-2022 — consultato il 25 aprile 2023

(25 aprile 2023). Il prezzo della benzina in Italia e in Europa. Lab24. https://lab24.ilsole24ore.com/prezzo-benzina/ — consultato il 25 aprile 2023

Katherine Fink & C. W. Anderson (2014): Data Journalism in the United States, Journalism Studies, DOI: 10.1080/1461670X.2014.939852

Colin Portezza & Sergio Splendore (2019): From Open Journalism to Closed Data: Data Journalism in Italy, Digital Journalism, DOI: 10.1080/21670811.2019.1657778

Le riproduzioni delle prime pagine del New York Times sono state estratte dall’archivio della pubblicazione.

La riproduzione dell’inchiesta del Palm Beach Post è stata estratta da un articolo di Poynter archiviato sulla Wayback Machine dell’Internet Archive. Sebbene il sito dell’inchiesta rimanga accessibile, l’avanzamento delle tecnologie web e l’acquisizione del giornale da parte di una differente proprietà che ha forzato anche il cambio dell’impaginazione web per rispondere ad esigenza di uniformità di brand identity ne ha ridotto di molto la funzionalità.

La riproduzione dell’analisi dei prezzi della benzina è uno screenshot della dataviz di Lab24 del Sole24Ore.

Immagine principale: Freepik

--

--

Giulia Banfi
Mapping Journalism

PhD Student @Unife. Studio la società, analizzando i processi comunicativi e la transizione digitale della PA ✏️ Credo in un’innovazione sociale accessibile.