Open data in un Comune medio-piccolo: il caso di Cento

Udine, 18 Settembre 2017

Sono stato invitato a parlare del caso del Comune di Cento all’evento di ComPA FVG “#OpendataFVG — Dat(t)i da fare” al castello di Udine.

Riassumo qui per punti le mie riflessioni.

Cento

Cento è un Comune di circa 36.000 abitanti, distante circa 30km da Bologna, Ferrara, Modena. Ha una forte e storica realtà industriale (VM/FCA, Fava, Baltur, …), è un centro rurale molto antico (Partecipanza agraria). Tante sono le attrazioni turistiche (Carnevale), storico-artistiche sia del passato (a Cento è nato il Guercino) che più vicine nel tempo (nella frazione di Renazzo è nato e sepolto Ferruccio Lamborghini).

Fortunatamente Cento fa parte di una Regione (Emilia-Romagna) molto avanzata e interessata ai temi dell’innovazione e dell’apertura.

Alcuni degli ostacoli alla diffusione delle culture legate ai dati aperti sono l’età media avanzata e un forte digital divide (aree bianche).

Io ho cominciato a interessarmi di dati aperti anni fa: provengo dalla cultura dell’open-source e la possibilità di poter applicare idee di condivisione simili ai dati e alle nozioni mi è sembrato un’estensione naturale e necessaria.

Mi sono formato prima come civic-hacker in varie iniziative, fra cui sicuramente Spaghetti Open Data, che è più o meno la culla del movimento dei dati aperti italiano, e diverse hackathon in cui ho avuto occasione di confrontarmi con i dati di Camera e Senato e di parlare di emergenze e informazioni nelle stesse. Da queste ultime riflessioni è nata l’impostazione di terremotocentroitalia.info che Matteo Tempestini ed io abbiamo sentito il bisogno di fondare il 24 Agosto 2016, dopo il primo dei terremoti che hanno colpito il Centro Italia nell’ultimo anno.

Da poco più di un anno sono assessore del mio Comune, e ho fra le mie deleghe i sistemi informativi, la trasparenza, la comunicazione, la promozione turistica, i rapporti con il cittadino.

Racconterò brevemente il caso del Comune di Cento, che ritengo non sia molto differente da quello di tanti altri Comuni medio-piccoli, nel suo rapporto con i dati aperti.

Open data: consapevolezza

Il primo problema legato ai dati è quello della consapevolezza.

Cosa sono i dataset?

Rendersi conto che il proprio lavoro comporta la gestione di basi di dati non è immediato. Gli uffici vedono loro stessi come fornitori di servizi e gestori dei beni pubblici, e questo è effettivamente il lavoro che sono chiamati a fare. Che questo richieda tabelle di dati è spesso nascosto dietro a software che vengono utilizzati quotidianamente.

Quali dati “possediamo”? Di chi sono? Ne abbiamo la titolarità?

Le basi dati utilizzate ogni giorno spesso includono dati provenienti da varie fonti. Determinare la proprietà di questi dati e la licenza con cui si ottengono richiede una riflessione approfondita. Emblematico il caso dei beni culturali: in assenza di normative nazionali sulla licenza opportuna, ad esempio, per le fotografie delle opere d’arte, si è esposti a dubbi che tendono a bloccare i tentativi di pubblicazione. Cito l’Istituto Beni Culturali dell’Emilia Romagna ha creato PatER, che permette di consultare riproduzioni delle opere presenti sul territorio, con una licenza CC BY-NC-ND che non è una licenza open data. È un inizio, ma crea anche un forte precedente che rende difficile giustificare aperture maggiori.

Che qualità hanno? Che qualità possiamo mantenere?

Il problema successivo è quello della qualità dei dati. Pubblicare dati significa che probabilmente qualcuno li utilizzerà e ne trarrà delle conseguenze. È importante poter garantire che le informazioni abbiano una buona qualità e che questa possa essere mantenuta nel tempo. Da utilizzatore di dati aperti so quanto sia frustrante dover ripulire, spesso senza certezza del risultato, migliaia di righe di una tabella, oppure fare affidamento su basi di dati che un giorno diventano non più accessibili perché “in corso di aggiornamento”. Come dirò successivamente, gli antidoti a questo problema sono l’automazione e l’inserimento dei dati all’interno di processi.

Open data: competenza

Chi lo deve fare?

Abbiamo un ridottissimo numero di persone competenti nel campo del digitale. Il Servizio Sistemi Informativi, che si occupa di tutti gli aspetti di gestione di ciò che riguarda l’informatica, è composto da un numero minimo di persone, il cui lavoro nella maggior parte dei casi non è stato trattare dati o, ad esempio, analizzare dati geografici. Le mansioni aggiuntive richiedono come sempre studio e tempo, che non si può togliere al lavoro quotidiano.

Il CAD prevede la nomina di un responsabile e di un “ufficio per il passaggio al digitale”. Si tratterebbe di una risorsa preziosissima per un’amministrazione che voglia seriamente modificare il proprio modo di lavorare e abbracciare le nuove opportunità tecnologiche e normative. Non si dice cosa si può fare, in termini di risorse assunzionali, economiche, strategiche, quando le competenze non si trovino già all’interno del Comune. Siamo tristemente in buona compagnia, leggendo che sovente neppure i ministeri, con le loro risorse ben più importanti, hanno nominato tale figura.

In che modo esporre i dati?

Sono consapevole che i Linked Open Data sono il modo più efficace per esporre dati leggibili da una macchina. Tuttavia si deve ricordare che i documenti all’interno dell’ente sono spesso cartacei (sì, ho appena visto dei ruoli che ci sono stati spediti con corriere espresso dall’Agenzia delle Entrate…) e che in generale il massimo strumento che tutti sanno utilizzare è, in alternativa, il programma di videoscrittura o il foglio elettronico. Non è possibile altresì che l’ufficio Sistemi Informativi si faccia carico di tutte le pubblicazioni.

Forse dovremo accontentarci di un file .xls(x) o .doc(x), magari un .csv.

Come farlo diventare parte di un processo?

La tentazione di fare qualcosa nel “tempo libero” è sempre grande e spesso è l’unico modo perché le cose vengano fatte in tempi ridotti e nel modo voluto. Resta il fatto che tutti questi sforzi saranno vani se non saremo riusciti a far diventare l’apertura dei dati parte di un processo e non un lavoro sporadico.

Chi ha la competenza legale?

Con competenza legale intendo: “chi è in grado di determinare con certezza la legalità dell’apertura di un dato o dell’altro?”. È da qualche tempo che ragioniamo anche nella comunità tematica dell’Agenda Digitale dell’Emilia-Romagna sull’opportunità di condividere “atti-tipo” che siano stati almeno visionati da qualche esperto sopra ogni dubbio, in modo da fugare le possibili remore degli uffici ad adottarli. Si tratta di un lavoro spesso duplicato in tutti gli 8.000 comuni italiani, che potrebbe essere collaborativo, soprattutto per quanto riguarda l’adozione delle norme sulle nuove tecnologie.

Open data: domanda

Nessuno in un anno e qualcosa di mandato ha chiesto di aprire dati. Né aziende, né singoli cittadini. La mancanza di domanda rende difficoltoso (e un po’ gramo) chiedere agli uffici di spendere tempo per catalogare, ordinare, pulire, pubblicare dati.

Capacità e qualità dei fruitori

Quando i dati ci sono perché per esempio fanno parte degli adempimenti di legge (sono in Amministrazione Trasparente o contenuti in atti), vengono spesso ignorati, non capiti, strumentalizzati, o non sono considerati validi.

Come generare valore?

Sappiamo tutti che i dati sono considerati l’oro del ventunesimo secolo. Come possiamo generare valore per le nostre comunità, al pari di ciò che fanno i colossi dei social network? Tutto questo come può essere fatto con risorse infinitesime in termini economici e di competenze?

Come generare cambiamento?

Qui parlo da civic-hacker: perché non restino esercizi di stile, gli open data dovrebbero generare cambiamento, anche minimo.

La realtà è che spesso non si va oltre alla citazione sul giornale o al piccolo scandalo, ma ciò non dà il via neppure a movimenti di opinione.

Osservazioni

Gli open data dovrebbero essere una scorciatoia

Il primo vero risultato di una pubblicazione di dati aperti dovrebbe essere evitare tutte le richieste di dati fra uffici e fra enti. Fino a quando gli stessi produttori di dati non faranno affidamento alla versione pubblicata, ma invece utilizzeranno una versione interna, il processo sarà solo parziale e a fortissimo rischio di errori.

Aprire i dati come modus operandi

Ogni volta che ci vengono richiesti dei dati, anziché chiederci se dover fare un’evidenza pubblica per evitare qualche tipo di vantaggio da parte del richiedente, non sia invece più semplice pubblicarli direttamente.

Esempio: Waze ha lanciato il Connected Citizen Program nel quale gli enti possono scambiare i dati sulle chiusure delle strade in un formato stile XML chiamato CIFS. Anziché inviare questi dati soltanto all’azienda, con i relativi rischi di monopolio, perché non pubblicarli per tutti in una parte del sito, comunicando anche a Waze l’indirizzo?

Ragionare con i grandi “player”

Per un piccolo Comune è antieconomico e strategicamente sbagliato affidarsi a sistemi di proprietà per la gestione dei dati aperti. È molto più proficuo appoggiarsi a siti che gestiscono dati aperti e collegarsi a database internazionali, che forniscano una migliore visibilità, ad esempio:

  • OpenStreetMap (OSM): la più famosa mappa libera, raccoglie informazioni geografiche fino a un livello di dettaglio maniacale. Un Ente può così curare la rappresentazione “virtuale” del proprio territorio analogamente a quanto fa per la sua versione reale.
  • Mapillary: un servizio che permette di caricare una propria versione di foto collegate in stile “street view”, consentendo di vedere anche diverse edizioni dello stesso luogo e di analizzare le fotografie con metodi di Intelligenza Artificiale estraendo contenuti
  • Wikipedia: il luogo nel quale inserire e mantenere aggiornate informazioni storiche, geo-politiche, culturali, in modo che siano visibili in tutto il mondo
  • Wikimedia Commons: un sito collegato a Wikipedia che raccoglie fotografie e immagini con licenza libera
  • Archive.org: il più grande catalogo libero di documenti online, permette di inserire documenti e file multimediali e di catalogarli

I dati corretti, utili, “buoni” sono quelli usati nei processi

Quando un dato serve per completare un processo, di solito è corretto e verificato. Quando invece è un dato accessorio, potrebbe essere soggetto a errori.

Faccio sempre l’esempio dei dati del MUDE, il modello utilizzato per la richiesta di contributi del sisma che ha colpito l’Emilia-Romagna nel 2012. La Regione ha pubblicato tutti i dati in formato aperto e, almeno nella prima versione, i codici fiscali indicati sono a volte palesemente errati (non sono neppure validi secondo il metodo di controllo). Mi è stato giustamente fatto notare che evidentemente il codice fiscale non è un dato che venga utilizzato direttamente per il processo. Probabilmente se ci fossero stati i codici IBAN per i versamenti, quelli sarebbero stati sicuramente corretti, siccome c’era una verifica immediata.

Una PA pubblica migliaia di dati per legge: perché non renderli machine-readable?

Mi sono ripromesso di dettagliare questo argomento in un post più lungo. La sostanza è questa: ogni giorno un Ente pubblica nel suo Albo Pretorio tutta una serie di documenti che descrivono minuziosamente il suo funzionamento. Questi documenti andrebbero resi machine-readable, esplicitando una serie di campi fissi, come ad esempio gli importi, che permettano di analizzarli.

Molti degli adempimenti della sezione Amministrazione Trasparente non sono altro che riassunti e raccolte di dati che sono già stati più volte pubblicati all’Albo all’interno di uno o più atti.

Cosa abbiamo fatto a Cento?

Nonostante le difficoltà, a Cento abbiamo cominciato ad impostare alcuni progetti legati ai dati aperti:

OSM: si è curata la mappa, aggiungendo ad esempio gli esercizi commerciali del centro storico.

Mappa DAE: sempre su OSM sono stati caricati i defibrillatori presenti sul territorio

Percorsi cicloturistici su OpenCycleMap: di nuovo su OSM, abbiamo segnato i percorsi cicloturistici da Cento alle città più vicine, per permettere a chi programma un viaggio di passare eventualmente da noi.

Organization su Dati Emilia-Romagna: abbiamo chiesto e ottenuto uno spazio robusto, sicuro, istituzionale, in cui pubblicheremo i nostri dataset

Dati pubblici WiFi (anonimizzati): il nuovo sistema WiFi permette di ricevere la lista di connessioni, disconnessioni e passaggi da un access-point a un altro. I dati raccolti verranno opportunamente anonimizzati e quindi pubblicati, per permettere ulteriori analisi.

AlboPop con feed RSS ufficiale: in molti in Italia abbiamo collaborato per “aprire” gli albi pretori degli enti in modo da renderli più fruibili dai cittadini. Il Comune di Cento, nel regolamento che abbiamo approvato, prevede alcune clausole specifiche per la pubblicazione, quando possibile, dell’Albo anche in formato leggibile da una macchina, per permettere ad esempio notifiche ad ogni emissione.