Com millorar l’experiència d’anàlisi de les Dades Obertes

Característiques que haurien de complir els conjunts de dades per a facilitar la seva anàlisi. [Dades Obertes centrades en l’usuari]

Víctor Pérez Berruezo
3 min readApr 7, 2019
Característiques Bàsiques de les Dades Obertes
https://creativecommons.org/licenses/by-sa/4.0/

Normalment l’èxit de les dades obertes es mesura (institucionalment) amb la quantitat de dades publicades (en datasets o Gb).
L’usuari objectiu d’aquestes però, només en necessita un petit conjunt per a respondre la pregunta o inquietud a la qual s’enfronti.
És per això que aquest post recull les característiques que en cas de mancar, dificulten, generen frustració i fan perdre el temps a tot aquell que es disposés a utilitzar-les.

Característiques Bàsiques de les Dades Obertes

a) Característiques inherents, no se n’extreu cap contingut però són necessàries per poder accedir, recuperar i publicar les conclusions.

  • Públiques — No han d’estar subjectes a privacitat.
  • Lliures — No subjectes a regulacions que en restringeixin la utilització.
  • Sense Registre — No has de ser necessari registre per consultar-les.

b) Característiques de contingut, relacionades amb les mateixes dades, i n’hi ha de dos tipus: les d’usabilitat i les d’experiència.

b.1) Característiques d’usabilitat. Hi ha les dades que hauria d’haver-hi i amb la freqüència suficient. Si no es compleixen, l’usuari no podrà extreure cap conclusió que permeti fer pressió per a canviar la manera de fer de l’administració. No serviran com a eina de control.

  • Actualitzades — La freqüència a la qual es publiquen les dades, ha de ser la suficient per poder exigir una correcció en el rumb de les polítiques.
  • Detallades — Si es té la dada “pura” sense tractar (raw data), de manera que l’usuari es pot fer la seva pròpia agrupació.

b.2) Característiques d’experiència. Quan les dades, a banda de ser-hi estan estructurades i ordenades de manera que els usuaris no necessitin un master en anàlisi de dades per poder utilitzar-les

  • Contextualitzades — Si junt amb el conjunt de dades s’explica perquè serveix, com s’ha obtingut, quins són els paràmetres que el conformen i com les identificadors es relacionen amb altres datasets. Inclús s’hi pot adjuntar una previsualització de les dades per a saber la utilitat de les mateixes sense haver d’iniciar un anàlisi complert.
  • 5Stars — Si compleix requisits de format i reutilització. (Les 5 estrelles de Tim Berners-Lee)
  • Harmonitzades — Si els formats de les dades són els correctes. Unitats en format internacional i homogènies. Noms de columnes homogenis entre datasets, noms entenedors, columnes que no cal dividir.

Open Data basic characteristics, User-Centered Open Data

--

--

Víctor Pérez Berruezo

Easy | Enjoy finding solutions · Tecnopolítica · Dades Obertes · Python