Melusine : une nouvelle brique #OSSByMAIF pour (ré)enchanter les emails

Vous qui nous suivez ici régulièrement avez déjà fait connaissance avec Otoroshi et Izanami, dignes — et libres ! — représentants de notre plateforme micro-servicielle. Après ces premiers ambassadeurs, MAIF a souhaité poursuivre sa démarche Open Source sur un sujet plus que nécessaire : les emails. Nous vous présentons aujourd’hui Melusine !

Un acteur tel qu’une mutuelle d’assurance reçoit, quotidiennement et en toutes circonstances, un très grand nombre d’emails de ses clients-sociétaires. Dans cette masse d’emails, on trouve des demandes très variées : de l’email remerciement à l’email de déclaration de sinistre pour lequel une réactivité forte est attendue. C’est pourquoi les équipes du DataLab MAIF ont travaillé, avec leur partenaire Quantmetry, à un projet pour mieux gérer ces flux d’emails.

Pourquoi travailler sur ce sujet ? Parce que mieux appréhender le contenu d’un email à son arrivée permet d’améliorer la qualité des réponses, d’optimiser les délais de réponse, et ainsi diminuer les recours à des canaux de “contournement” tels que le téléphone (ou Twitter :) )

Si ce projet s’est révélé nécessaire côté MAIF, il est également apparu comme utile au plus grand nombre ! Parce que l’Open Source permet la diffusion et le partage des connaissances, facilitant la coopération avec nos partenaires, et selon nos engagements pris il y a un an déjà, les équipes ont donc choisi d’ouvrir ce projet.

Voici Melusine

Melusine est un package constitué de plusieurs modules fonctionnels :

  • Une brique de traitement du texte qui va reconstruire l’historique de la conversation dans le mail, identifier les blocs de signature, de métadonnées …
  • Un bloc de classification qui permet de catégoriser les emails par thèmes prédéfinis.
  • Un module de description qui génère une courte synthèse de l’email (aujourd’hui quelques mots clés et bientôt une synthèse structurée)

Grâce à une utilisation avancée du traitement du langage (modèles de deep learning tels les réseaux de neurones à convolution et récurrents), ces modules permettent d’identifier les blocs de contenus les plus pertinents figurant dans les mails reçus afin d’identifier les compétences requises pour le traitement et ainsi adresser au plus tôt les emails aux destinataires concernés.

C’est une librairie Python spécialisée dans le traitement des textes en français dont l’ambition est de devenir une référence, mais aussi de vivre au sein des communautés du traitement du langage françaises et du libre, en fédérant utilisateurs et contributeurs.

Le projet est aujourd’hui disponible sur notre GitHub. Et vous pourrez aussi, si vous êtes présent au Big Data Paris, assister à un atelier de présentation le 12 mars !

Au-delà du défi technique, ce projet est, une fois de plus, une aventure humaine. En travaillant en équipe avec des cultures différentes, en travaillant pour la mutuelle mais aussi pour d’autres, nombreux ont été les défis, les difficultés mais aussi et surtout, les succès et les projets à venir !

Nous sommes heureux de l’entrée de Melusine dans l’univers #OSSByMAIF et sommes impatients de vous écouter, lire, ou de vous rencontrer à son sujet !