Comment optimiser ses campagnes emailing grâce au Data Science ?

Les professionnels de l’internet, du e-commerçant de notoriété mondiale aux plus modestes professionnels sur la toile, ont tous pour objectif de mieux cibler leur campagne emailing, dans le but de maximiser leur lecture et, dans l’absolu, leur taux de transformation, et d’en réduire leur coût.

Pour optimiser, par exemple, la campagne emailing d’un e-commerçant, nous allons extraire des données existantes recueillies par le professionnel. Notre objectif est d’en maximiser l’impact en ne sélectionnant que 60% des clients, en appliquant une régression logistique aux données pour prédire qui lira le mail (ou toute autre action).

Etape 1 — Dataset

Pour notre exemple nous allons élaborer un modèle à partir d’un fichier type tableur, intégrant les données client.

Les colonnes du tableur nous informent non seulement des caractéristiques du client (âge, sexe, revenu estimé) mais aussi de l’action du client lors d’un précédent envoi d’email. Les données recueillies et à exploiter sont en rapport avec l’activité de l’entreprise concernée et ne sont donc pas extrapolables à d’autres sociétés.

Etape 2 — Code

Dans notre exemple, nous devons récupérer une liste de clients à contacter prioritairement, nous allons procéder à une régression logistique sur les données grâce à un langage de programmation comme Python (ou autre comme R qui est un langage informatique dédié aux statistiques et à la science des données). Pour tester notre régression nous allons utiliser une partie de notre fichier appelé ici « Test set », pour valider nos résultats « Training set ».

En comparant nos modèles on constate qu’ils ont une précision de 89%, soit un fort taux de réussite en terme de prédiction.

Dans un fichier CVS nous allons rapprocher les données réelles des clients avec les probabilités issues du modèle pour les comparer.

A cette étape une liste d’email qualifiée est déjà exploitable pour envoyer une offre commerciale aux clients, mais nous allons maintenant comprendre l’intérêt de cette méthode et démontrer sa pertinence.

Etape 3 — Evaluation du modèle

Nous voyons que notre tableur a 3 colonnes, la première identifie la ligne, la suivante affiche les clients ayant ouvert l’email, et la troisième indique l’hypothèse que les clients ouvrent l’email (ou toute autre action).

On classe ces données puis on les intègre dans un fichier.

Etape 4 — Courbe CAP

Par rapport à un modèle « aléatoire », on remarque la justesse de notre modèle. En effet, on constate sur notre courbe que l’on peut toucher un public plus qualifié, qui va ouvrir l’email, avec moins d’envois. Notre modèle permet donc de cibler uniquement les clients qui serait concernés par cet email.

La régression logistique permet la priorisation des envois, et permet de faire des économies importantes sur son budget communication. Sa mise en œuvre est aisée par un personnel qualifié, et s’adapte à la majorité des entreprises.

Show your support

Clapping shows how much you appreciated Antoine Monchecourt’s story.