Apprendre avec les données numériques, les datasprints pédagogiques : le cas de Traces de Soldats

Franck Bodin
Digital Praxis
Published in
13 min readMay 29, 2018
Travail de data-art réalisé à partir du réseau social formé par les poilus campinois. Les points sombres représentent les régiments dans lesquels étaient incorporés les soldats. Les points jaunes situés à l’extrémité des traits matérialisent les individus. Travail réalisé par les médiateurs de l’Atelier Canopé 94.

Traces de soldats le datasprint pédagogique né à l’Atelier Canopé 94, propose aux élèves de travailler différents points des programmes d’histoire, de géographie, de mathématiques, de technologie… par la recherche et l’exploitation de données numériques à travers un dispositif limité dans le temps : une course d’un mois pour construire des visualisations de données. Ce sprint avec les datas pour matériau engage les participants à analyser, trier, sourcer, compléter et augmenter un jeu de données fourni par l’Atelier Canopé du Val-de-Marne. Ce fichier, enrichi par un travail de crowdsourcing effectué en classe, sert de source à la production de cartes, de graphiques, d’infographies réalisés par les élèves et leurs enseignants, accompagnés par des médiateurs de Réseau Canopé en territoire.

Un datasprint pour quoi faire ?

Actualité des données et l’école dans tout ça ?

Protection des données — affaire Cambridge Analytica -mise en place du RGPD, intelligence artificielle et deep-learning — AlphaGovoitures autonome — SmartCities… les questions posées par l’exploitation des données numériques font régulièrement débat. Elles concernent autant nos expériences connectées, que nos choix de société et nos devenirs individuels. De fait, ces problématiques prégnantes traversent l’École. Elles concernent très directement les élèves, leurs environnements numériques de travail, de loisir, de socialisation, leurs manières de s’informer et d’apprendre. À titre d’exemple, les élèves de l’école d’aujourd’hui sont pour beaucoup des usagers de Youtube et de son algorithme de suggestions reposant sur l’exploitation des données des usagers du réseau… Déjà, les actions conduites par les enseignants dans le champ de l’EMI ouvrent des pistes de réflexion et d’actions pédagogiques.

Au delà de l’exploitation de nos traces numériques et des quantités massives de données que nous générons par nos épisodes de connexion, il semble important, à l’École, de comprendre que le travail avec les données numériques renseigne les savoirs eux-mêmes. Souvent citée en exemple, l’expérience de la Venice Time Machine démontre que les travaux de numérisation et d’exploitation des données peuvent être des éléments de conservation et d’intelligence du patrimoine. Plus proche de nous, le cours “enseignement de la cartographie des controverses

propose d’entraîner les étudiants à la navigation dans l’univers des débats technoscientifiques par l’utilisation créative d’outils numériques d’analyse et de représentation.

Ce programme concerne aujourd’hui un certain nombre de lycéens dans l’académie de Créteil. Le numérique appelle à la maîtrise de nouvelles littératies. À la fois pour comprendre l’envers du décor en soulevant le capot des algorithmes à l’oeuvre dans nos sphères numériques, selon l’idée de Dominique Cardon. Mais aussi pour rechercher, traiter des données pertinentes et utiles à la production d’informations venant éclairer notre compréhension de phénomènes ou de savoirs académiques. Cette logique n’est pas nouvelle. Elle sous tend notamment l’introduction du code dans les programmes. La proposition d’un datasprint comme cadre d’un apprentissage par la pratique, reposant sur la recherche et le traitement de données, s’inscrit dans ce prolongement. Elle fait par ailleurs écho à un questionnement toujours plus grand sur nos vies et expériences connectées.

Loi pour une République Numérique et directive européenne

L’idée de datasprint pédagogique s’enracine dans le cadre des savoirs et savoirs-faire définis par les programmes scolaires. Elle puise également son inspiration au coeur de la loi “Pour une République Numérique. Ce texte se fixe comme objectif premier de “favoriser une liberté accrue pour la circulation des données et du savoir”. En effet, au-delà du levier économique créer par la mise en ligne de données ouvertes offertes à la réutilisation, cette loi porte les valeurs d’une forme de transparence utile à l’exercice citoyen, à la prise de décision et à la production d’éléments d’intelligences. Elle rejoint ici des objectifs aux fondements des missions éducatives. Ce souci trouve une traduction sur les pages du portail opendata.gouv.fr sous les termes suivants :

Répondre à des questions,

Prendre des décisions, pour soi, sa commune, son association ou son entreprise,

Bénéficier de services utiles au quotidien : pour se déplacer, éviter le gaspillage alimentaire, connaître les services publics à proximité de son domicile,

Encourager la transparence démocratique des institutions et des élus.

Force est de constater que les conditions d’émergence d’une société apprenante sont favorisées par l’ouverture des données publiques ouvertes : diffusion, interopérabilité, réutilisation, structuration en réseau, bien communs, coopération, créativité sont des mots clés communs au vocabulaire de loi et au fruit de la réflexion menée dans le cadre du rapport commandé par le Ministère de l’Éducation Nationale.

Les enjeux pédagogiques

Construire une culture du numérique nécessairement critique

Au delà des questions de fond sur la manière dont le numérique impacte notre société et en particulier l’École, il existe de réels enjeux pédagogiques autour d’une proposition d’apprentissage par le travail avec les données numériques. Paradoxalement les compétences les plus largement travaillées à travers le datasprint relèvent moins des habiletés numériques que des compétences critiques. Travailler avec les données c’est avant tout constituer un corpus sourcé et exploitable. Ces opérations de recherche, d’agrégation et d’ordonnancement des données reposent essentiellement sur des savoirs-faire documentaires régulièrement travaillés par le professeur documentaliste. Dans une telle démarche il est indispensable de distinguer le document primaire (le jeu de données original et fiable, proposé par une source identifiée) du document secondaire (jeu de données crowdsourcé, visualisation issu d’un traitement…). Repérer la donnée fiable, connaitre les sources primaires, vérifier, croiser les informations secondaires sont des compétences développées à travers le datasprint.

L’objectif de développement de l’esprit critique l’objectif se retrouve également dans l’exploitation et le traitement de la source. Il faut être en mesure d’analyser les données disposnibles, de leur donner un sens, de formuler des hypothèses, puis de les vérifier en opérant des choix : quelles données garder, quelles données compléter, quelles données vérifier, croiser. Cette démarche s’apparente aux expériences d’éducation par la recherche.

Le travail de visualisation des données appelle également à développer les compétences de distanciation critique. D’une part, l’analyse d’informations proposées sous forme visuelles : graphiques, cartes, dendogrammes, diaagrammes, histogrammes, infographies en tous genres, requiert ders compétences de lecture pointues. D’autre part, ces éléments souvent synthétiques jalonnent les communications digitales et physiques auxquelles sont confrontés élèves, parents et enseignants. Attractifs , ils recèlent néanmoins de nombreuses difficultés de lecture et traduisent de forts partis-pris. Inviter les élèves à produire ce type de restitutions, c’est les aider à comprendre de l’intérieur la manière dont est produite l’information à l’ère du numérique. C’est aussi les contraindre à la prise de distance par la prise de décisions collectives autour de choix éditoriaux et esthétiques mesurés. Les inviter à différencier subjectivité et visée objective.

Construire des compétences numériques

En 2016 l’enseignement du code entrait à l’École. De l’élémentaire au lycée, l’objectif poursuivi est d’:

apprendre à traiter et résoudre de nombreux problèmes en transformant les données en informations, puis concevoir des algorithmes permettant de traiter ces informations et d’obtenir la solution à notre problème”.

C’est dans cette visée que s’inscrit la proposition de datasprint. A la différence des compétences de codage classiques, le travail avec les données repose essentiellement sur la mise en forme et l’articulation de données brutes. Les opérations d’enrichissement donnent lieu à la création et à la publication d’un document secondaire. Cet effort de crowdsourcing permet de produire les éléments de compréhension visuels dans un format numérique. Ici les élèves manipulent les datas à travers des tableurs. Ils articulent ces éléments avec des outils de visualisation en prenant en compte les contraintes d’échange. Ils se familiarisent alors aux notions de formats et de comprennent les modalités d’exploitation des données qui font le matériau des applications que nous utilisons chaque jour. Il s’agit bien de sortir de la boite noire.

Le travail avec le données contraint les participants à agir au coeur des environnements numériques. Seule cette immersion permet d’appréhender ce en quoi la sphère numérique fait sens à l’École : en temps qu’environnement de travail privilégié de la recherche, de l’analyse, de la collaboration, de la production, de la communication et la publication.

Le datasprint est un dispositif qui engage la classe dans une modalité de pédagogie, nécessairement médiée par le numérique. Selon les repères fixés par le modèle SAMR, travailler en classe avec les données, c’est se placer dans un contexte de redéfinition. Cette redéfinition est la condition d’un développement des compétences en matière de littératie numériques des élèves. Déjà, Louise Merzeau posait condition la nécessité d’évoluer en milieu numérique pour travailler ces habiletés. Enfin, face aux usages de divertissements et aux logiques de consommation propres à la sphère numérique, il est crucial de proposer aux élèves une approche émancipatrice du monde connecté, en l’installant comme espace dialogue de production partagée des savoirs et des savoirs-faire.

La donnée numérique comme matériau pédagogique

Données et savoirs

Dans la littérature scientifique sur l’information et la connaissance le modèle DIKW pour Data, Information, Knowledge, Wisdom est l’un des plus connu. Cette hiérarchie représentée le plus souvent sous forme de pyramide, ou de diagramme de flux, trouve une traduction française sous les termes : donnée, information, connaissance, compétence. Bien que discutée, cette représentation de la structuration des savoirs, introduit la donnée comme niveau de granularité fondamental de la compétence acquise. Fort de cette approche, comment cerner la donnée.

Selon wikipédia la donnée peut-être définie comme

“une description élémentaire d’une réalité. C’est par exemple une observation ou une mesure. La donnée est dépourvue de tout raisonnement, supposition, constatation, probabilité. Étant indiscutable ou indiscutée, elle sert de base à une recherche, à un examen quelconque”.

Cette définition se réfère au travail de Serge Abiteboul et à son ouvrage Sciences des données : de la logique du premier ordre de la toile qui précise le caractère éminemment numérique de la donnée. La donnée est aussi comprise comme un élément brut, premier, autrement dit un signe encore dépourvu de sens c’est à dire d’intentionnalité.

Replacé dans le contexte pédagogique, travailler avec la donnée numérique suppose donc de dépasser le contexte de la donnée personnelle envisagée comme propriété. En effet, le travail sur les données numérique repose en premier lieu sur le travail de collecte et de mise en forme de ce matériau pour produire du sens et construire un premier niveau d’information. Les opérations de recherche, d’agrégation et d’ordonnancement des datas ne peuvent s’effectuer qu’au sein d’un milieu ouvert garantissant aussi bien le libre accès que l’autorisation de leur traitement. C’est ce cadre qui est aujourd’hui défini par l’Open Data.

Par Jonathan Gray — Photo on flickr: https://www.flickr.com/photos/jwyg/4528443760/The simple image on the stickers can be found here: http://opendefinition.org/buttons/, CC0, https://commons.wikimedia.org/w/index.php?curid=16007995

Open Data, de quoi parlons-nous ?

Avant d’être définie, la notion d’open-data mérite d’être distinguée d’autres termes avec lesquels elle est parfois confondue :

L’Open Data n’est pas le Big Data.

Sur le site Eduscol l’Open Data est présenté de la manière suivante :

“Une donnée ouverte (en anglais open data) est une information publique brute, qui a vocation à être librement accessible et réutilisable. La philosophie pratique des données ouvertes préconise une libre disponibilité pour tous et chacun, sans restriction de copyright, brevets ou d’autres mécanismes de contrôle. En informatique, une donnée ouverte est une information structurée ou pas, publique ou privée et généralement non utilisable par un humain mais interprétable par une machine.”

Les données publiques sont considérées comme ouvertes si elles répondent à ces 8 principes (2007, Open Government Data, USA) : complète, primaire, opportune, accessible, exploitable, non discriminatoire, non propriétaire, libre de droit. L’ouverture des données permet d’étendre la construction d’un nouveau modèle d’échanges entre le citoyen, les politiques, et l’administration. Autrement dit, l’Open Data renoue avec les idéaux de l’invention du web.

L’Open Data ça sert à quoi :

Le Big Data se distingue de l’Open Data au sens où il ne comporte aucune règle contraignante en terme d’ouverture, d’accessibilité ou de ré-exploitation possible. Il n’est pas dans le champ des communs du numérique. Le site Le Big Data.fr propose la définition suivante en associant rapidement le terme aux géants du numérique :

“Littéralement, ces termes signifient mégadonnées, grosses données ou encore données massives. Ils désignent un ensemble très volumineux de données qu’aucun outil classique de gestion de base de données ou de gestion de l’information ne peut vraiment travailler. En effet, nous procréons environ 2,5 trillions d’octets de données tous les jours. Ce sont les informations provenant de partout : messages que nous nous envoyons, vidéos que nous publions, informations climatiques, signaux GPS, enregistrements transactionnels d’achats en ligne et bien d’autres encore. Ces données sont baptisées Big Data ou volumes massifs de données. Les géants du Web, au premier rang desquels Yahoo (mais aussi Facebook et Google), ont été les tous premiers à déployer ce type de technologie.”

Le Big-Data n’est pas le Small-Data

Ces données, souvent privées et massives, ne peuvent être traitées que par des machines. Proposer un travail intellectuel s’apuyant sur les données numériques, même ouvertes, suppose donc d’opérer avec des corpus restreints et intelligibles. L’idée du Small Data :

des corpus de données qui tiennent dans des tableurs.

Selon les journalistes du site MetaMedia, ce sont bien ces corpus qui permettent de tenir un propos, de “raconter une histoire”

Une proposition de datasprint pédagogique s’appuie donc sur une collecte de données issues de l’Open Data. Ces données sont mises en forme pour alimenter un fichier de type Small Data, appréhendable par l’intelligence de ceux qui le manipule : élèves et enseignants.

Classe contributive et datasprint

Le datasprint pédagogique s’inscrit dans le cadre d’une idée née lors d’écriTech 2018, celle de la Classe Contributive. La Classe Contributive prend racine dans le foisonnement de réflexions autour de la forme scolaire à l’ère du numérique. Elle se situe à l’articulation des pédagogies actives, des compétences du 21ème siècle, des humanités numériques et des biens communs de la connaissance.

La contribution aux communs du numérique dont l’Open Data fait partie est un moyen de participer positivement au mouvement de disruption provoqué par “le tsunami numérique”. Cette participation à l’entretien et à l’enrichissement de biens de la connaissances relève d’une construction collective facilitée par le numérique. Selon le philospohe Bernard Stielgler, pour le contributeur, elle constitue un mouvement de transindividuation, c’est à dire de réalisation de soi par la participation à une oeuvre qui dépasse la seule dimension individuelle. Ce travail suppose notamment le compréhension, le respect et à la participation à des règles communes. Ces règles de gouvernance sont au coeur de la réflexion sur les communs.

Le travail de crowdsourcing, en temps qu’expérience collective d’enrichissement d’une source primaire, est au coeur du dispositif. Il suppose donc une compréhension claire des licences d’accès, d’exploitation et de publication de communs du numérique. En ce sens l’organisation d’un datasprint ne peut en aucun cas relever du concours. Cette une contribution qui fait sens en elle-même. C’est un don.

Scketchnote Marine Bantignies https://twitter.com/MarineBtgs

Par ailleurs, l’idée de la classe contributive et avec elle le dispositif de datasprint pédagogique rompent avec l’approche en silot des savoirs. Ici terrain d’action est interdisciplinaire. Le datasprint mobilise les compétences et les savoirs développés dans de multiples disciplines. Il s’agit d’un travail relevant du champ des humanités numériques. C’est à dire de la rencontre des savoirs. Dans le cas de Traces de Soldats les expertises de tous sont invitées et se complètent : mathématiques, technologie, arts-plastique (design), lettres (storytelling), habiletés documentaires (recherche), domaines spécifiques en fonction du sujet concerné (ici l’histoire). La place de l’enseignant est elle aussi interrogée. Au sens où la construction des savoirs pour soi ne repose plus sur un modèle de transmisison classique. Un datasprint pédagogique est un dispositif qui intègre les éléments de la culture digitale : horizontalité, créativité, tatonnement, fact-checking…

En ce sens, les compétences développées par les élèves dans la classe contributive, notamment à travers la proposition de datasprint relèvent également des compétences douces. Ces compétences “comportementales, transversales et humaines” qui deviennent essentielles à l’heure du digital et qui intègrent les “compétences du 21ème siècle” : résolution de problème, pensée critique, collabation, créativité… Ces compétences peuvent être travaillées à la fois de au sein des environnements connectés mais également lors des phases de travail débranché. En effet si le datasprint et la classe collaborative intègrent pleinement le numérique, c’est notamment parce qu’ils se déroulent en milieu hybride. Autrement dit, il ne s’agit pas d’évoluer en permanence en mode connecté mais bien de prévoir un scénario pédagogique qui articule numérique et analogique, synchrone et asynchrone.

Traces de soldats un datasprint pédagogique et historique

Traces de soldats convoque essentiellement les programmes de CM2, de troisième et de première qui tous abordent la question de la Première Guerre et de l’expérience combattante.

Le tableur est appréhendé en mathématiques et en technologie dans les classes de 4eme et de troisième. Traces de Sodats s’inscrit pleinement dans le cadre des programmes des discilplines qu’il convoque en premier lieu

Quel calendrier pour Traces de Soldats ?

Mai / Juin 2018

  • Pré-recrutement des classes
  • Prise de contact avec les collectivités territoriales concernées en vue de la valorisation locale des travaux
  • Communication du guide d’accompagnement Traces de Soldats

Septembre 2018

  • Recrutement définitif des classes
  • Médiation autour du kit d’accompagnement
  • Mise en oeuvre d’animations autour des questions de l’open-data en Atelier Canopé
  • 21 septembre Communication des jeux de données par l’équipe de l’Atelier Canopé 94
  • 24 lancement du datasprint

Octobre 2018

  • Exploitation des jeux de données en classe
  • Accompagnement des classes par les médiateurs de l’Atelier de proximité
  • Finalisation des datavisualisations par les classes (si possible au court d’un événement en Atelier)
  • 20 octobre fin du datasprint — retours des jeux de données et des datavisualisations

Novembre 2018

  • Valorisations locales des livrables
  • Valorisation des travaux et des jeux de données « améliorés » en liaison avec Étalab et la Mission Centenaire

Pour quelles réalisations ?

Qui est le poilu campinois : Infographie réalisée par les médiateurs de l’Atelier Canopé 94.
Le réseau social des poilus campinois : infographie réalisée par les médiateurs de l’Atelier Canopé 94 à l’aide du logiciel libre Gephy
Sociologie militaire des poilus campinois tombés lors de la Première Guerre Mondiale : Infographie réalisée par les médiateurs de l’Atelier Canopé 94 à l’aide du service en ligne rawgraphs.io
Cartographie des lieux de naissance et de décès des poilus campinois : cartographie réalisée par les médiateurs de l’Atelier Canopé 94 à l’aide du service en ligne carto

Le concept de datasprint pédagogique et de Traces de Soldat seront présentés lors des rencontres de l’Orme 2018

--

--