permadata — design par la donnée (2/2)

par la DATA

Romaric Ruga

la complexité de la donnée dans permadata, c’est la rigidité du format de l’input & la nécessairement très fine granularité requise pour l’output

vues PLANT DATA & CONTRIBUTOR

dans la vue PLANT DATA, pour les visiteurs, on veut afficher des données (agrégation de DATAS référençant la PLANT cible) structurées par pertinence, ce qui requiert :

  • un grand niveau de spécificité pour l’indexation de ces informations (liées à la donnée, tags dans l’objet DATA)
  • des motifs pour agréger tels-types de données (liés à la vue, équivalent “nuage de tags”) ensemble, pour produire de nouveaux type d’informations lisibles, cohérentes & utiles

du point de vue CONTRIBUTOR, on veut produire cette même donnée atomique (objets DATAS), à partir de donnée brute (objets EXTRACTS) : scans, textes numériques, screenshots

pour comprendre le mécanisme d’agrégation, il est nécessaire de conceptualiser les différentes entités manipulées par l’application

objets

l’abstraction a permis de dégager trois objets : PLANTS, EXTRACTS & DATAS

PLANTS, référence, peu d’infos

l’un des deux points de référence de la DATA (but/finalité de l’application), c’est les PLANTS

l’objet, avec cette condition, contient les propriétés :

  • special unique identifier, latin taxonomy (source: wikipédia)
  • rank, de la liste (ordre décroissant) : famille, genus, famille & variété
  • parent (si rank < ‘famille’), #plant (référence à un objet plante, ex: genus ‘prunus’, superior : famille ‘rosaceae’)

EXTRACTS, référence, contenu source

les EXTRACTS sont des fragments d’un ouvrage, un PDF, ..etc & peuvent s’organiser en arborescence

  • parent, null : top level extract (livre ou autre), !null : #extract (référence à un extract)
  • content, texte balisé en markdown, formatage manuel depuis le contenu brut extrait de l’image convertie ou du copié-collé
modèle PLANT(S), EXTRACT, DATA

DATAS, jonction & type, valeur: <any>

  • #extract (un seul extrait)
  • [#plants] (une ou plusieurs plantes)
  • type, parmi une liste (exemples: name, calendar, description, cooking receipe, hardiness)
  • value, le format est déterminé par le type, valeur atomique de la donnée
  • [tags], materiel d’indexation

agrégation de la plante

sur la page d’une plante, identifiée par son nom latin, on matche les DATAS dont la propriété ‘plants’ (:: [1..*#plant]) contient son PLANT#ID

à ce stade, bien en amont du server-side-rendering, on dispose alors des données brutes non structurées, sous forme de tableau :: [1..*{DATA}]

il nous incombe alors de les organiser pour trouver l’information pertinente en un nombre d’interactions minimal


perma-data — design (1/2) : par la donnée

le site permadata.net (développement, peut être down)

Romaric Ruga

Written by

je mange des légumineuses car elles sont riches en protéines, et du chènevis car c’est aussi très riche et intense

Welcome to a place where words matter. On Medium, smart voices and original ideas take center stage - with no ads in sight. Watch
Follow all the topics you care about, and we’ll deliver the best stories for you to your homepage and inbox. Explore
Get unlimited access to the best stories on Medium — and support writers while you’re at it. Just $5/month. Upgrade