permadata — design par la donnée (2/2)

par la DATA

Romaric Ruga
2 min readJan 21, 2019

la complexité de la donnée dans permadata, c’est la rigidité du format de l’input & la nécessairement très fine granularité requise pour l’output

vues PLANT DATA & CONTRIBUTOR

dans la vue PLANT DATA, pour les visiteurs, on veut afficher des données (agrégation de DATAS référençant la PLANT cible) structurées par pertinence, ce qui requiert :

  • un grand niveau de spécificité pour l’indexation de ces informations (liées à la donnée, tags dans l’objet DATA)
  • des motifs pour agréger tels-types de données (liés à la vue, équivalent “nuage de tags”) ensemble, pour produire de nouveaux type d’informations lisibles, cohérentes & utiles

du point de vue CONTRIBUTOR, on veut produire cette même donnée atomique (objets DATAS), à partir de donnée brute (objets EXTRACTS) : scans, textes numériques, screenshots

pour comprendre le mécanisme d’agrégation, il est nécessaire de conceptualiser les différentes entités manipulées par l’application

objets

l’abstraction a permis de dégager trois objets : PLANTS, EXTRACTS & DATAS

PLANTS, référence, peu d’infos

l’un des deux points de référence de la DATA (but/finalité de l’application), c’est les PLANTS

l’objet, avec cette condition, contient les propriétés :

  • special unique identifier, latin taxonomy (source: wikipédia)
  • rank, de la liste (ordre décroissant) : famille, genus, famille & variété
  • parent (si rank < ‘famille’), #plant (référence à un objet plante, ex: genus ‘prunus’, superior : famille ‘rosaceae’)

EXTRACTS, référence, contenu source

les EXTRACTS sont des fragments d’un ouvrage, un PDF, ..etc & peuvent s’organiser en arborescence

  • parent, null : top level extract (livre ou autre), !null : #extract (référence à un extract)
  • content, texte balisé en markdown, formatage manuel depuis le contenu brut extrait de l’image convertie ou du copié-collé
modèle PLANT(S), EXTRACT, DATA

DATAS, jonction & type, valeur: <any>

  • #extract (un seul extrait)
  • [#plants] (une ou plusieurs plantes)
  • type, parmi une liste (exemples: name, calendar, description, cooking receipe, hardiness)
  • value, le format est déterminé par le type, valeur atomique de la donnée
  • [tags], materiel d’indexation

agrégation de la plante

sur la page d’une plante, identifiée par son nom latin, on matche les DATAS dont la propriété ‘plants’ (:: [1..*#plant]) contient son PLANT#ID

à ce stade, bien en amont du server-side-rendering, on dispose alors des données brutes non structurées, sous forme de tableau :: [1..*{DATA}]

il nous incombe alors de les organiser pour trouver l’information pertinente en un nombre d’interactions minimal

perma-data — design (1/2) : par la donnée

le site permadata.net (développement, peut être down)

--

--

Romaric Ruga

je mange des légumineuses car elles sont riches en protéines, et du chènevis car c’est aussi très riche et intense