Quale licenza per gli opendata?

(la storia infinita)

Maurizio Napolitano
open data stories
10 min readMay 17, 2019

--

È inutile nascondersi dietro ad un dito: il primo requisito necessario per definire se è un dataset è in open data, è quello di avere una licenza che ne permetta il massimo riuso.

Le interpretazioni sbagliate più comuni

Si tratta di un requisito più che legittimo e a cui, molti dovrebbero fare molta più attenzione visto che spesso il concetto di open data viene ridotto ai dati della pubblica amministrazione.

Concetto che, inoltre, molto spesso è anche male interpretato visto che, in molti, non si pongono tante domande e non leggono nemmeno quali sono i vincoli e hanno la loro libera interpretazione del cosa è permesso fare e cosa non è permesso.
C’è chi associa la parola open data a pubblico dominio e, pertanto, tutto ciò che è in open data non ha alcun limite legale.
Altri invece che credono che open data sia il crowdsourcing e, pertanto, “ se partecipi a progetti come Waze stai generando open data” senza fare distinzione fra dato e sua rappresentazione.
Discorso analogo per chi considera l’accesso in lettura ad informazioni utili e confezionate dallo strumento di turno (es. Google Maps).
Quelli più “ raffinati” invece raccolgono la grande confusione che si fa sul software libero / open source e cadono nell’errore (sbagliato anche per il software) che sono dati di cui “ non si può fare sfruttamento commerciale perchè devono rimanere gratuiti “.

Altri ancora riducono il tutto a “ Se c’è scritto Creative Commons allora va tutto bene “, senza porsi poi domande su tutte quelle altre lettere che seguono quel simbolo di doppio C che, in realtà, sintetizzano i vincoli (0 = nessuno, by = devi attribuire, sa = condividi allo stesso modo, nc = non farne uso commerciale, nd = non creare opere derivate)

Non c’è ombra di dubbio che, a monte, va chiarito cosa si intende con dati e che, la pigrizia nel leggere e capire non aiuta per niente.

L’insieme delle licenze che si possono applicare agli open data

Per fare un po’ di ordine, la definizione di open di riferimento per l’intero movimento è quella data dal documento Open Definition, dove viene detto

“Open significa che è concesso a chiunque di accedere, utilizzare, modificare e condividere liberamente per qualsiasi scopo (soggetto, al massimo, a requisiti che preservano la provenienza e l’apertura). “

Open means anyone can freely access, use, modify, and share for any purpose (subject, at most, to requirements that preserve provenance and openness) — https://opendefinition.org/

una definizione precisa che spiega, in maniera molto chiara, quali sono i permessi e quali le restrizioni.
Va fatto notare però che le restrizioni sono opzionali e, queste, di fatto, si riducono a due casi:
- citare la fonte
- condividere allo stesso modo
Questo fa si che i modelli di licenza (e quindi il contratto con cui l’autore definisce diritti e dovere di chi usa i suoi prodotti) si riduce a tre famiglie di licenze. Pertanto quelle che:
- non creano alcun vincolo andando sul tema del pubblico dominio (es. pddl e cc0)
- obbligano a citare la fonte (es. cc-by, iodl2.0, cdla-permissive)
- obbligano a mantenere il prodotto e suoi derivati sempre aperti (es. cc-by-sa, odbl, cdla-sharing

Dibattito: quale è la migliore licenza open data per una pubblica amministrazione?

Nonostante il tutto si riduca a tre casi, per ciascuno ci sono comunque tutta una serie di opzioni su quale licenze usare che, a loro volta, generano fiumi di discussione fra almeno tre categorie di persone: chi deve verificarne la validità giuridica, chi invece ha bisogno di riusare i dati e chi deve combattere l’effetto FUD ( paura, incertezza e dubbi) e, infine, chi vuole proteggere un lavoro collaborativo.

Ciascuna delle varie posizioni mette in discussione l’altra.
L’unica su cui in molti concordano è che l’uso delle licenze con restrizione “ share alike” (= “condivisione allo stesso modo”) generano moltissime aree grigie nella reale implementazione per cui, se si guarda ad una pubblica amministrazione che rilascia dati al fine di favorirne la maggiore diffusione, è importante evitare questa tipologia di restrizione.

CC0 gioie e dolori

Archiviato quel caso, che comunque continua ad essere usato e che crea binari paralleli fra dataset che poi, sul piano giuridico sono praticamente difficili da unire fra loro (es. le restrizioni date da una cc-by-sa non sono coerenti con quelle date da una ODbL), il dibattito però prosegue sulla validità della CC0 (quindi rilascio in pubblico dominio)

La CC0, nei fatti, diventa la soluzione che offre il grado di libertà più alto in assoluto per riusare i dati.
Il progetto FreeGIS.net, con la consulenza di due avvocati di settore molto noti come Simone Aliprandi e Carlo Piana, hanno analizzato la questione ed evidenziato più volte il vantaggio offerto — per chiunque — dell’applicazione della CC0.

A Febbraio 2019 la Commissione Europea si espressa dichiarando che le licenze open data suggerite sono la CC0 e la CC-BY.
Individuando anche uno scenario dove la CC0 trova la sua collocazione

“[…] i dati grezzi, i metadati o altri documenti di natura comparabile possono essere alternativamente distribuiti in base alle disposizioni della Creative Commons universale donazione al pubblico dominio (CC0 1.0)”

http://ec.europa.eu/transparency/regdoc/rep/3/2019/EN/C-2019-1655-F1-EN-MAIN-PART-1.PDF — articolo 2

Di contro però la CC0, con la sua rinuncia ad ogni diritto crea una situazione di paure, incertezze e dubbi su chi deve prendere questa decisione.
La frase principalmente incriminata è riportata nel punto 2:

Rinuncia. Nella più ampia misura permessa dalla legge applicabile, e senza contravvenire ad essa

articolo 2 del testo della Creative Commons Zero.

quel “ senza contravvenire ad essa” fa si che molti trovino scenari, anche al di fuori del solo concetto di banche dati, generando molti dubbi e aumentando quindi le perplessità su questa adozione.
Perplessità che fanno perdere tempo e che, quindi, fanno orientare i policy maker verso l’ adozione di licenze di tipo attribuzione.

CC-BY è davvero la soluzione migliore?

Da qui la scelta diventa quella di andare verso una licenza di attribuzione e, visto anche il parere della Commissione Europea, ecco che la scelta ricade verso la CC-BY.
D’altronde, lo studio della Commissione Europea, conclude con una tabella molto significativa dove, la CC-BY 4.0 risulta essere quella che non ha alcun parere negativo nell’insieme delle leggi europee e sul fronte di ulteriori variabili legate al riuso dei dati.

gestire l’attribuzione

Nella realtà dei fatti, anche se citare la fonte è senza ombra di dubbio un atto dovuto nel riuso dei dati sia per dare merito a chi ha gli ha forniti sia per permettere a chiunque di validare i risultati, le modalità con cui viene richiesto di citare la fonte, possono portare spesso a problematiche di gestione.
Uno dei problemi classici è quello legato ai dati geografici attraverso cui si genera una mappa: tantissime fonti diverse che vengono rappresentate su una immagine, e che devono poi trovare un riferimento che permetta di capire la provenienza di ciascuno di questi dati.
Se poi la mappa occupa lo spazio di uno smartphone, la questione si complica ancora di più.
In diversi casi si trova un link con la voce “note legali” da dove, poi, si arriva a tantissime paginate con i nomi dei data provider e di cosa viene usato.
Una soluzione necessaria ma che, quando l’attribuzione impone di rendere questa istruzione ben visibile, non modificabile e quant’altro generano ancora più dubbi.

Il caso più emblematico è quello di OpenStreetMap dove, a causa del fatto che l’attribuzione sulle mappe diventa “ ©OpenStreetMap contributors”, si è stabilito che la CC-BY non è compatibile con il progetto e si propone, a chi vuole importare i dati, di firmare una liberatoria concedendo questo permesso.

Il problema analogo lo si ha poi per un altro progetto di condivisione di dati molto importante: Wikidata — il sistema di archiviazione centrale per i dati strutturati in Wikipedia

Qui, il footer del sito, dichiara che i dati contenuti sono redistribuiti secondo i termini della CC0
“[…] All structured data from the main, property and lexeme namespaces is available under the Creative Commons CC0 License […] “

Qui c’è chi difende la posizione facendo presente che l’attribuzione è garantita nella descrizione del dataset e dividendo il problema fra dati e struttura dati.
Rimane il fatto però che rimane comunque in una zona grigia dove è necessaria una discussione in merito.

I casi poi si moltiplicano (molte PA ricevono chiamate da parte di aziende per sapere come risolvere il problema della gestione della attribuzione).

E sicuramente fa storcere un po’ il naso sapere che l’apertura dei dati non può avvenire in maniera così trasparente e diretta all’interno di progetti open data così importanti, rilevanti e di successo come OpenStreetMap e Wikidata.

le modifiche alle CC-BY con la CCPlus

C’è chi ha provato a risolvere questo introducendo una soluzione che Creative Commons permette. Si tratta di Creative Commons Plus.
Questa soluzione permette di creare un documento un documento che accompagna una licenza Creative Commons permettendo quindi di concedere ulteriori permessi.
Una soluzione che, per quanto interessante, può comunque portare a creare nuovamente delle perplessità:
1. chi legge o vede il logo CC-BY ha subito chiaro come comportarsi e, molto difficilmente andrà a vedere se esiste un documento extra che spiega che il dataset accompagnato può avere ulteriori scenari
2. inoltre, una volta individuato, potrebbe chiedersi come mai quel permesso è dato ad un progetto (es. OpenStreetMap) ma non ad un altro.

Pertanto, per quanto sia una via che risolve dei limiti, da un altro rischia di creare un po’ di confusione e forse anche qualche malumore.

licenze standard scritte da terzi

Sempre nel regno poi della confusione rimane aperta la questione delle versioni delle licenze.
Per molto tempo, in Italia, la licenza CC-BY usata è stata la versione 2.5 nonostante che la versione 3.0 fosse stata resa pubblica.
Il motivo era molto semplice: la versione 2.5 non menzionava il problema del diritto sui generis (il diritto specifico sulle banche dati) a differenza invece della 3.0 dove veniva invece descritto e dove poi, successivamente, si dichiarava anche che la licenza non si interessava, aprendo quindi una lunga discussione per capire il confine del diritto sui generis dal resto.

Il passaggio alla versione 4.0 ha poi risolto questo problema e, con calma, in molti sono andati in quella direzione senza andare a fondo sulla questione.

Nel blog post dove la OpenStreetMap Foundation fra presente del problema della compatibilità fra CC-BY e ODbL, individua una clausola in conflitto fra le due licenze (oltre al già citato problema dell’attribuzione) riguardo la redistribuzione attraverso strumenti che fanno uso di DRM

“[…] CC BY licences contain a strict prohibition on distributing so licensed material with DRM-enabled media/transport. The ODbL contains a similar restriction, but allows parallel distribution of “Derivative Databases” as a way to fulfill the obligation for unrestricted access.”

https://blog.openstreetmap.org/2017/03/17/use-of-cc-by-data/ — OpenStreetMap Foundation

Questo solleva una ulteriore discussione a cui, diversi hanno fatto attenzione e, per cui, abbiamo casi di governi (es. UK , USA, Canada, Germania, Italia …) dove le licenze sugli open data vengono “scritte in casa”.
La motivazione principale è che, se anche una licenza è standard è ben conosciuta, le sue evoluzioni sono definite da chi la governa e, pertanto, uno Stato — con le sue leggi sulla gestione del patrimonio informativo pubblico e del diritto d’autore — potrebbe trovarsi nella situazione di rincorrere il testo di una licenza invece che vederla adattarsi alle sue leggi.

Di certo Creative Commons è una organizzazione che sta attenta a queste indicazioni, di contro però il caso della gestione del diritto sui generis (che è quello che poi ha portato OpenStreetMap a migrare dalla CC-BY-SA alla ODbL) e questo del DRM diventano un campanello d’allarme per chi non vuole trovarsi in quella situazione.

E quindi quale è la soluzione?

Qualcuno potrebbe giustamente dire “ Ma come è possibile che in 10 anni di open data ancora non si è risolta questa questione?”
Prima di tutto va ricordato nuovamente che open data vuol dire permesso di riuso, e il permesso lo si concede attraverso una licenza.
Non c’è alcuna ombra di dubbio che l’applicazione della CC0 sia lo strumento con maggiore successo per permettere che l’open data possa contribuire in maniera più efficace a quella che è la sua missione.
Purtroppo però abbiamo ancora molte resistenze in merito.
La Creative Commons Attribution (cc-by) rimane una soluzione che, attualmente piace a chi ha molti timori ma che, allo stesso tempo crea qualche grattacapo che si risolve nell’esatto contrario di quello che sarebbe la natura dell’open data: contattare il data provider per avere il permesso di superare quel piccolo ostacolo.
L’uso di licenze standard è un tema importante solo che, allo stesso tempo, richiede che nella definizione delle loro evoluzioni siano presenti anche più rappresentati dei data provider.
Forse, una soluzione interessante può essere quella di adottare la CDLA Permissive proposta da Linux Foundation e segnalate fra quelle compatibili con OpenStreetMap dalla stessa OSM Foundation.
Sicuramente anche questa ha i suoi limiti (in particolare non è molto diffusa), ha però un piccolo vantaggio: restringe fortemente lo scenario ai soli dati e quindi individua permessi e restrizioni molto più precise.
Pertanto è molto più probabile che assisteremo sempre di più alla distribuzione di open data con la licenza cc-by che saranno accompagnati da documenti dove sarà dato il permesso di riuso per casi specifici (es. OpenStreetMap o Wikidata) e forse, arrivando a saturazione, nascerà una nuova licenza pensata solo ed esclusivamente per i dati che sia accettata almeno dalle leggi europee.
Di mio continuerò però a fare il tifo per la CC0!!!

Ringraziamenti

Un grazie di cuore (in ordine casuale) a Morena Ragone (in particolare per il suo intervento a ForumPA 2019), Monica Palmirani, Matteo Fortini, Giorgia Lodi, Andrea Borruso, Daniele Crespi, Federico Morando, Simone Aliprandi, Carlo Piana e molti altri ancora per i preziosi spunti che danno e continuano a dare su questo lungo dibattito.

Originally published at http://de.straba.us on May 17, 2019.

--

--

Maurizio Napolitano
open data stories

fbk, openstreetmap, gis, neocartography, okfn italy, open data, open source, software libero, sociologia, trento, pallavolo, digital commons lab