Challenge Data — Une semaine à Sciences Po Saint-Germain pour concevoir des usages autour de données ouvertes !

Timothée GIDOIN
Datactivist
Published in
9 min readMar 13, 2019

Datactivist a organisé, du lundi 25 février au vendredi 1er mars, une semaine intensive d’immersion dans l’open data auprès des 90 étudiants de Master 1 de Sciences Po Saint-Germain-en-Laye. Entre apprentissage et mise en pratique, les étudiants ont pu travailler sur des cas concrets soumis par des organismes partenaires désireux de révéler le potentiel des données ouvertes. Cette première édition, durant laquelle open data et design se sont étroitement mélangés, s’est achevée sur de nombreuses propositions qui ouvrent des perspectives intéressantes et pratiques de réutilisations de données. Un format qui a convaincu à la fois étudiants et partenaires et qui sera donc très probablement renouvelé l’an prochain.

La fine équipe au complet ! (sous un soleil quasi-estival) 😎

5 jours pour apprendre, pratiquer et prototyper

Pour la petite centaine d’étudiants de 4ème année de Sciences Po Saint-Germain en Laye, le Challenge Data c’était l’opportunité d’une immersion totale dans l’univers des données : open data, manipulation et datavisualisation… Ils sont accompagnés tout le long du challenge vers une exploration d’usages.

La semaine a pris la forme d’un séminaire participatif (de type hackathon) de cinq jours en équipe, associée à des ateliers pratiques animés par des experts du milieu de l’open data et du design de services. Les étudiants ont ainsi travaillé sur des problématiques réelles, soumises par 9 acteurs partenaires :

  • Ambassadeur du Numérique (Ministère des Affaires étrangères)
    💡 Challenge : Alimenter un algorithme open-source de détection de faux profils sur les réseaux sociaux
    🎯 Objectif : Lutter contre les fausses informations
  • La Poste
    💡 Challenge : Créer un concept global de service pour les commerces des villes moyennes, à partir de données ouvertes
    🎯 Objectif : Revitaliser le commerce dans le cœur des villes moyennes à partir de demandes locales
  • Pôle Emploi
    💡 Challenge : Faire remonter les freins à la mobilité résidentielle des demandeurs d’emploi et cartographier des données ouvertes pertinentes qui viendraient alimenter un outil cartographique d’aide à la décision
    🎯Objectif : Mieux accompagner la mobilité résidentielle des demandeurs d’emploi
  • Métropole de Nantes et Weka
    💡 Challenge : Modéliser l’expertise métier et le (ou les) processus de sélection de candidats de manière à esquisser un cahier des charges fonctionnel de l’outil d’assistance à la sélection des candidatures
    🎯 Objectif : Allier expertise du recrutement et traitement de données pour estimer le potentiel de l’ouverture des données sur le recrutement dans la fonction publique
  • La Région Occitanie
    💡 Challenge : Lister les données éligibles pour une intégration dans un service existant ou à créer / concevoir un scénario d'usage d'un service utilisant de la donnée culturelle
    🎯Objectif : Imaginer les réutilisations possibles des données culturelles
  • Le CGET
    💡 Challenge : Cerner les usages autour des données relatives à la localisation de l’Etat, des emplois et des points de contacts / Esquisser une stratégie à mener auprès des différents producteurs de données et ministères pour les inviter ainsi à ouvrir des données complémentaires
    🎯Objectif : Objectiver la présence de l’Etat et des services publics dans les territoires comme base d’un dialogue entre l’Etat, les collectivités et les citoyens
  • Le SDES (Ministère de la Transition Écologique et Solidaire)
    💡 Challenge : Concevoir un plan d’action détaillé afin d’améliorer la visibilité des indicateurs par le grand public ainsi que la réutilisation des données
    🎯Objectif : Comment améliorer la visibilité, la compréhension et la réutilisation des données relatives aux Objectifs de développement durable ?
  • La Région Centre
    💡 Challenge : Concevoir des usages autour des données ouvertes du patrimoine et imaginer un processus collaboratif permettant aux citoyens de contribuer à la collecte et classification du patrimoine culturel régional
    🎯Objectif : Faciliter l’appropriation par le plus grand nombre des résultats des études de l’inventaire général du patrimoine culturel
  • Verlingue (courtier en assurances)
    💡 Challenge : Réaliser une cartographie des données ouvertes permettant d’enrichir et de conceptualiser le diagnostic de l’absentéisme
    🎯Objectif : Aider les entreprises à mieux comprendre l’absentéisme au travail et optimiser sa prévention auprès des clients de Verlingue

En parallèle, nous avons également bénéficié du soutien de deux sponsors, Orange et OpenDataSoft, que nous remercions chaleureusement.

Le déroulé du Challenge Data jour par jour

Attention, ça va dépoter

Lundi 25/02 : Kick-off du Challenge Data — Découvrir et explorer
Le lundi a été une journée à la fois dense et propice aux échanges. Après un premier cours introductif aux notions clés de l’open data, chacun des partenaires a présenté son challenge, en détaillant les enjeux et les attendus (livrables).

Lundi: Joseph Macaire, référent du groupe La Poste, présentant aux étudiants les enjeux du challenge proposé

Les étudiants ont ensuite pu bénéficier d’un temps d’échange privilégié avec chacun des référents partenaires, y compris parfois sous la forme de visioconférence, de manière à émettre leurs préférences et constituer les groupes. En fin d’après-midi, chaque groupe a été invité à approfondir leur challenge en se plongeant dans la documentation accessible sur l’espace collaboratif TeamOpenData et en explorant les jeux de données associés.

L’espace collaboratif “Challenge Data” sur TeamOpenData ouvert pour l’événement

Mardi 26/02 : Initiation au design

Après une première découverte théorique et pratique des données, les étudiants ont suivi un cours d’initiation au design de services, par Xavier Figuerola, cofondateur de l’agence de design d’intérêt général VraimentVraiment.

“Mettre de l’information en ligne, ce n’est pas compliqué. Mais si on veut la rendre lisible, accessible, compréhensible, cela demande un effort. Il faut rendre l’information parlante pour tout le monde et ça peut passer par un travail de réécriture de la base de données” Xavier Figuerola

L’objectif : initier les étudiants aux grands principes du design (comprendre les usagers, confronter ses idées avec le terrain, prototyper rapidement…) et les outiller pour commencer à répondre à leur challenge par le prisme des usagers. Parmi les outils abordés : la cartographie des utilisateurs, le persona, le parcours usager.

A retrouver : le live tweet de l’intervention de Xavier à Sciences Po Saint-Germain.

Mardi: intervention de Xavier Figuerola, de VraimentVraiment, pour expliquer aux étudiants l’utilité du design

Mercredi 27/02 : Faire parler des données

Après l’acquisition et la mise en application de notions sur l’open data et le design, les étudiants ont pu apprendre une troisième compétence clé : celle de réaliser des datavisualisations. Grâce à l’intervention de Carole Bodilis d’OpenDataSoft, ils ont appris à manipuler des jeux de données sur une plateforme spécialement ouverte pour le Challenge.

Ils ont ainsi pu découvrir comment passer d’un tableur “aride” à une histoire (datastory) qui permet de rendre accessible et attractif les données au grand public. Cela passe par la création de cartes ou graphiques interactifs, la réalisation de tableaux de bord mais également par des fonctionnalités avancées de personnalisation qui rendent les résultats plus… parlants !

A retrouver : le live-tweet de l’intervention de Carole à Sciences Po Saint-Germain-en-Laye

La cartographie des implantations publiques réalisées par le groupe du challenge CGET

Jeudi 28/02 : Approfondir et formaliser

J-1 avant la restitution, c’est le sprint ! Les étudiants ont eu jusqu’à 20h30 pour approfondir leurs propositions au challenge et les formaliser dans le livrable demandé par le partenaire. Journée intense où il a fallu à la fois coucher sur le papier les principales idées et les structurer pour les restituer dans un format professionnel et, en parallèle, préparer la présentation du lendemain devant l’ensemble des partenaires et étudiants.

Pour cela, ils ont été aidé par trois intervenants aux expertises complémentaires :
- Hélène Pouille, facilitatrice graphique, qui a permis à 5 groupes de synthétiser visuellement les enjeux de leur challenge et les solutions proposées
- Eva Dunoyer, experte en innovation, et dont les talents de consultante ont grandement facilité la formalisation des livrables et des présentations ainsi que la préparation aux pitchs des étudiants
- Xavier Figuerola, qui est revenu le jeudi pour initier les étudiants à un atelier vidéo permettant aux groupes volontaires d’expliciter étape par étape leurs concepts à travers son et image

A retrouver :

La restitution graphique d’Hélène pour le challenge du groupe Verlingue
La vidéo de présentation de l’Occitambule, concept mêlant culture et data, par le groupe Région Occitanie
La vidéo de présentation de la plateforme de suivi de la présence territoriale de l’Etat , par le groupe CGET

Vendredi 1er mars : Restituer et présenter

Et c’est le grand jour ! Il ne reste plus que quelques heures le matin pour finaliser les présentations de l’après-midi. La nervosité — et la fatigue — est palpable mais l’ensemble des groupes réussit à restituer leurs livrables en temps et en heure, ouf ! Maintenant place aux présentations devant l’ensemble des partenaires.

Après un premier mot introductif de Renaud Epstein, maître de conférence à l’IEP, chaque groupe déroule son pitch, explique les réflexions développées au cours de la semaine et les solutions proposées. Un exercice à la fois de synthèse et de charme, qui, si on en croit les interventions enthousiastes des partenaires, est vraiment réussi ! On notera l’intervention surprise d’Henri Verdier, Ambassadeur français du Numérique, qui, depuis ses vacances, a envoyé un message d’encouragement et de félicitations auprès des étudiants.

Vendredi : restitution et présentation des solutions proposées aux challenges. Ici le groupe Pôle Emploi

Après l’effort, le réconfort. La phase de restitution des challenges se termine par un cocktail où intervenants extérieurs, partenaires, étudiants et personnels de Sciences Po Saint-Germain se retrouvent pour échanger — et souffler — de manière conviviale et informelle.

A retrouver:

Le live-tweet des restitutions officielles de chacun des groupes devant l’ensemble des partenaires

Les principaux résultats du Challenge Data

Les challenges peuvent être répartis en 3 catégories :

  1. Valorisation de données ouvertes
  2. Cartographie de données
  3. Exploitation de données
Une des propositions de design d’un indicateur de suivi des ODD par le groupe du SDES/MTES

Valorisation de données ouvertes : on retrouve dans ce groupe la Région Occitanie avec son concept de festival — L’Occitambule — qui propose à partir des huit jeux de données ouverts par la région, d’unir la culture et le numérique en proposant aux festivaliers une expérience inédite. C’est également le cas de la Région Centre-Val-de-Loire dont les étudiants proposent une application collaborative — Cépaloin — permettant à la fois de découvrir l’incroyable patrimoine et de contribuer à sa valorisation en mettant à jour la base de données. C’est aussi le cas du challenge du Service de la donnée et des études statistiques (SDES) pour lequel les étudiants ont imaginé des manières de rendre les données des 17 ODD plus accessibles et attractives auprès du grand public.

Le concept du groupe La Poste autour de la dévitalisation des centres-villes de villes moyennes

Cartographie de données : c’est tout particulièrement le cas du courtier en assurances Verlingue, qui cherche à trouver des sources de données lui permettant d’améliorer le diagnostic de l’absentéisme à proposer à ses clients. C’est également le cas du groupe Pôle Emploi qui, une fois les entretiens qualitatifs effectués auprès d’un panel de demandeurs d’emploi bénévoles, ont dû confronter les idées avec les données accessibles en open data. C’est également le cas du groupe La Poste, qui, après avoir esquissé un concept économique, a dû s’intéresser aux sources de données disponibles permettant de faciliter l’implantation de nouveaux commerces en centre ville (base Sirene, recensement OpenStreetMap…).

TerritorIA, le concept de chasseur de tête semi-automatisé pour la FP Territoriale, par le groupe Nantes x Weka

Exploitation de données : on retrouve dans cette catégorie, le challenge de l’équipe de l’Ambassadeur du Numérique, encadré toute la semaine par Matti Schneider, un développeur et un data scientist. A partir de données Twitter, les étudiants ont pu classifier des tweets russes et alimenter un algorithme de machine learning permettant de détecter de faux comptes, avec une fiabilité estimée à 85%. Sur une toute autre thématique, le groupe CGET, a réussi à créer une carte pour visualiser efficacement le suivi des ouvertures et fermetures de sites de service public sur l’ensemble du territoire français. La plateforme, encore embryonnaire, est déjà ouverte et accessible à tous !
Last but not least, l’équipe de la Métropole de Nantes et Weka ont réalisé un cahier des charges fonctionnel pour concevoir un chasseur de tête semi-automatisé pour la fonction publique territoriale, dénommé TerritorIA.

Et après ?

Effectivement, au-delà de cette première édition, quelles suites donner à ce Challenge Data ?

Si l’on en croit l’enthousiasme des différents acteurs (partenaires, étudiants, intervenants) et la qualité des restitutions, il y a fort à parier que l’événement sera reproduit l’année prochaine à Sciences Po Saint-Germain.
On peut d’ailleurs d’ores et déjà imaginer que d’autres étudiants (développeurs, statisticiens, designers…) pourront également y être associés et faire du Challenge Data un événement incontournable d’idéation et de création, entre data et design.
Et vous, seriez-vous intéressés d’y participer l’année prochaine ? :)

L’équipe projet du Challenge Data : Cécile, Timothée, Arthur et Joël

--

--