La Guilde DATA SCIENCE MAIF

Fédérer autour de bonnes pratiques internes et infuser une culture Data Science

Yann Golhen
MAIF Data Design Tech etc.
8 min readSep 5, 2022

--

Depuis 2017 à la MAIF les acteurs de la data se fédèrent au sein d’une communauté pour partager leurs travaux, bonnes pratiques, cas d’usage et sujets d’innovation : c’est la Guilde Data Science… Au total, cette Guilde DS c’est 30 rendez-vous chaque année, environ 25 collègues présents en moyenne.

Je suis Yann, Data Scientist et Responsable de l’équipage des Data Scientists chez MAIF et j’ai le très grand plaisir d’animer cette Guilde. Cet article est l’occasion d’un partage d’expérience : quelles missions pour cette guilde DS, quels enjeux, quelle animation ?

L’ambition de la Guilde va au-delà du dialogue d’experts sur lequel nous nous focaliserons dans cet article. Nous proposons notamment un certain nombre de conférences à destination de tous les collègues de l’entreprise. Notre objectif : démystifier l’Intelligence Artificielle et la Data et faire que chacun en saisisse les enjeux et les apports qu’elle peut avoir dans son métier… peut-être un sujet pour un prochain article 😉 …

Photo by Kimson Doan on Unsplash

2 mots sur le contexte Data MAIF :

L’intelligence Artificielle, la Data Science connait un fort essor dans tous les secteurs dont celui de l’assurance. L’IA est de plus en plus présente et désormais chaque métier décline ses cas d’usages… La gestion électronique des documents, la téléphonie, la gestion des sinistres, la détection de fraude, la relation client, le digital … tout y passe et la Data Science est partout.

L’IA est un domaine qui gagne rapidement en maturité : l’ère des expérimentations cède désormais sa place à l’ère de l’industrialisation. On se doit d’intégrer plus facilement nos solutions aux systèmes d’information et on les déploie à une échelle bien plus large. A ce titre, le métier le Data Scientist évolue et les compétences de développement sont de plus en plus importantes.

Des métiers historiques de l’assurance tels que Statisticiens, Actuaires, Data Analysts voient leur métier évoluer… Le recours à de nouveaux algorithmes et technologies, la mise en œuvre de certains langages de programmation comme Python offrent de nouvelles perspectives.

Et la MAIF… Entreprise à mission, assureur militant : nous sommes engagés pour le bien commun. Cet engagement se décline dans toute l’entreprise et notamment au sein de la direction Data où nous œuvrons pour une singularité Data : utilisation éthique des données et développement d’une IA maitrisée et responsable. Nous partageons d’ailleurs gratuitement et ouvertement un grand nombre de nos solutions phares, dans une dynamique dite d’”Open Source” : Shapash (pour l’explicabilité des modèles d’IA), Eurybia (pour maitriser la dérive des modèles) ou encore Melusine (pour l’analyse et le routage automatisé de courriels)

Les Missions de La Guilde DS / IA : Partage ! Partage ! Partage !

La Guilde fédère des collaborateurs issus de différentes directions de la MAIF : Datafactory, Marketing, Actuariat, DSI, … où chacun exerce un métier de la Data. Nous nous retrouvons toutes les semaines pour :

  • Avoir une vue 360° des cas d’usage : A la MAIF, Nous avons la chance d’adresser collectivement des cas d’usage métier extrêmement variés, qui mettent en oeuvre de multiples techniques et technologies : parler de nos cas d’usage nous amène ainsi à discuter de Computer Vision, NLP, Vocal, Machine Learning, Times series, Graph, explicabilités …. Nos rendez-vous sont donc une occasion pour valoriser la qualité de nos travaux et de s’inspirer des initiatives portées par nos collègues. Chaque Data Scientist y prend la parole et partage son projet, la stratégie qu’il a mis en œuvre, explique les choix opérés, les difficultés rencontrées… Ces présentations et échanges permettent à chacun d’ élargir son spectre de compétences, de challenger sa pratique, d’apprendre… Cela permet aussi aux data scientists d’identifier les collègues qui ont travaillé sur des cas d’usage connexes et de développer des synergies… voire de développer des services mutualisés.
  • Se fédérer autour de bonnes pratiques … Nous développons des produits d’IA pour passer à l’échelle et rendre service à nos métiers (et au final aux clients sociétaires of course !!). A ce titre, notre exigence vis à vis de la qualité de nos développements internes est croissante. Aussi pour accompagner les data scientists dans cette dynamique, la guilde depuis 2021 multiplient les échanges et prises de paroles autour du développement. Au programme donc, en vrac … : revue de code, tests, lintage, déploiement continu, gitflow, bonnes pratiques de dev, de supervisions, architecture fonctionnelle, template projet, precommit hook, pattern événementiel, sécurité, … Le renfort de collègues Lead Dev est une aide précieuse pour nous animer sur cette dimension. Un dispositif de formation a été mis en place pour rentrer plus en profondeur sur ces sujets et mieux appréhender cette évolution du métier. Les pratiques MLOPS plus spécifiques à nos métiers ne sont pas en reste. Les sujets model serving, versionning, monitoring, serveur d’inférence, features store sont clairement d’actualité.
  • Partager l’actualité de nos socles : les acteurs des Socles Data IA, ceux qui administrent nos serveurs Python, et qui font vivre une multitude d’utilitaires packagés qui nous facilitent la vie, font partie intégrante de la Guilde. Notre proximité et nos échanges nous permettent d’aller plus vite et facilite la vie des projets.
  • Synchroniser nos efforts de veille : nos métiers bougent ! Les technologies aussi ! Avoir une fenêtre grande ouverte sur le monde est essentiel ! Tous les jours on voit passer de l’actualité sur les réseaux sociaux : méthodes, articles de recherche, solutions packagées, … Avoir un collectif est là encore une chance pour en avoir une vision 360°. J’observe que nos data scientists ont des appétences et des attentes très différentes vis à vis de cette veille : certains aiment tout survoler, d’autres préfèrent aller en profondeur sur quelques actualités très en prise avec leurs travaux internes… Nous essayons de mettre à profits ses aspirations diverses pour mieux adresser collectivement cette veille et saisir les bonnes opportunités pour la MAIF. Nous proposons des revues de presse toutes les 2 semaines.
  • Participer à des conférences, meetUp, salons, rencontres et partager des retours d’expérience … Un point très important de notre dispositif consiste en des échanges très réguliers avec d’autres grandes entreprises françaises. Cela permet un benchmark de nos pratiques internes, de challenger nos stratégies Make or Buy, …

Et l’animation dans tout cela … Quelques réflexions…

Qui s’est essayé à l’animation d’un collectif sait ô combien le sujet est délicat … aussi, c’est très modestement que je vous propose de partager quelques idées qui me paraissent fonctionner dans ce contexte de Guilde.

Tout d’abord, la guilde, c’est du bonus pour tous les acteurs : rien d’obligatoire. Les collègues y viennent quand leur agenda le permet et si ça les intéresse.

Tout le monde prend la parole à tour de rôle et y partage des sujets : qu’on soit expérimenté, stagiaire, alternant, Ingénieur ou PhD on a tous des sujets intéressants à partager. Il me parait important de s’assurer que les débats ne soient monopolisés que par quelques-uns. Chacun peut poser des questions à tout moment.

On parle de sujets variés : les algos, les données, leur visualisation, le développement informatique, la sécurité, la stratégie DS mise en œuvre pour traiter des cas d’usages métiers, une librairie Open Source, l’apport de l’open data, des guidelines éthiques, sustainable, … Des partages d’expérience par des acteurs d’autres sociétés, … Le mieux pour moi est d’avoir des séquences qui mixent ces thématiques (et donc les collègues 😉).

Chacun peut proposer son sujet et être acteur de l’ordre du jour, il suffit de poster un message dans le canal dédié à cela.

Inciter à l’échange… C’est bien de ne pas avoir que des restitutions mais d’avoir des sujets ouverts où on essaie de co-construire et de s’aligner collectivement sur nos pratiques. Des thématiques comme le MLOps sont propices à ces séquences plus ouvertes.

Envoyer l’ordre du jour en amont et teaser chaque séquence. Nous veillons à adresser un agenda timé avec les horaires de chaque présentation : l’idée est de permettre à chacun de ne pas manquer les sujets qui l’intéresse. Nous essayons aussi de préciser les compétences et pré-requis pour suivre une présentation ( ex : “tout public”, “acculturation au Deep Learning”, “acculturation au développement Python”). Pour les absents, on propose les replays sur notre stream Dataflix :

Des réunions hybrides distancielles / présentielles : le télétravail se généralise il faut l’inclure dans le dispositif. On donne la possibilité de se réunir en présentiel en réservant un espace

Planifier bien en amont ! Il s’agit pour moi d’un point essentiel pour maintenir des présentations et échanges de qualité : on a tous des contraintes de dernières minutes une présentation Guilde DS/IA sera toujours moins prioritaire qu’une livraison projet. Aussi pour s’assurer de séquences bien préparées et éviter les annulations de dernières minutes, il faut veiller à se coordonner bien en amont avec les différents speaker et les laisser s’organiser pour absorber la charge inhérente à toute présentation. Concrètement, j’essaie de planifier les ordres du jour 2 mois à l’avance. Mais les imprévus de dernières minutes arrivent toujours … même dans ces cas, essayez de maintenir le plus possible les rendez-vous quitte à faire plus court : il est important d’ancrer la guilde par de la récurrence 😌

Glanez du Feedback par des enquêtes de satisfaction. Parce qu’un Data Scientist satisfait est un Data Scientist qui revient 😊. La guilde doit servir les collaborateurs, il faut donc que le modèle leur corresponde.

Les challenges qui nous attendent :

  • Assurer une meilleure gouvernance de nos produits d’IA : s’assurer du respect de bonnes pratiques de développement, de supervision, de documentation, pratiques green et éthiques est aujourd’hui l’un de nos principaux axes de travail. Sur la base d’un reporting régulier, la guilde doit nous permettre de nous coordonner sur la priorisation de nos actions pour faire progresser la qualité de ce patrimoine.
  • Rassembler des profils toujours plus hétérogènes : ceux qui pratiquent la Data Science et industrialisent leurs travaux au quotidien progressent … et dans le même temps la guilde doit onboarder des novices : c’est parfois compliqué d’intéresser tout le monde avec un même sujet → l’effort de vulgarisation est à accentuer pour maintenir cette ouverture.
  • Se challenger autour d’une compétition interne : proposer un cas d’usage utile à l’entreprise sur lequel chaque Data Scientist peut s’exprimer et proposer sa stratégie. C’est un super moyen d’insuffler de la synergie et une saine émulation. Cela fait quelques années que nous n’en avons plus proposé… une prochaine compétition pourrait arriver bientôt !
  • Proposer des formations internes et permettre à tous de relever les challenges de demain, d’onboarder rapidement les nouveaux venus en leur permettant d’appréhender notre stack technologique.

Bref, encore plein de très beaux challenges. J’espère que ce partage a pu intéresser quelques acteurs de la Data. Je serais ravi d’échanger sur cette thématique avec ceux qui le souhaitent : n’hésitez pas à me contacter sur LinkedIN 🤩 !

--

--