Les 5 étapes du Big Data en entreprise

Pierre Paperon
Jul 30, 2017 · 5 min read

“La moyenne des hommes sur terre ont un sein et une c….”. Sous cette citation toute simple d’une grande dirigeante d’un groupe de conseil, se cache un des écueils principaux du Big Data qu’est le manque de discernement ou de simple bon sens dans les démarches suivies et les résultats qui en découlent.

Ces quelques lignes pour partager avec vous le travail fait pour un grand groupe électronique grand public mondial. Tout le monde parlait de Big Data. Quelques uns en faisaient mais peu comprenaient et personne l’utilisait. J’ai rassemblé sur un graphique le chemin possible pour tous en clarifiant le contenu, les compétences nécessaires à chacune des étapes et surtout les produits finis que peu produire chaque étape. En effet rien de plus désolant que de voir un voilier faire sa route toutes voiles dehors mais sans direction aucune … “Pas de vent favorable pour celui qui ne sait pas où aller” a clamé Sénèque en son temps … Et j’ajouterais que “le lancement du spi avant d’avoir établi la grand voile est le plus court chemin pour coucher son voilier”.

Les étapes de l’adoption du Big Data ou Big Analytics dans l’entreprise

Quelques précisions sur ces étapes

1) la “data vizualisation” ou visualisation des données est en effet une très bonne chose avec la multiplicité d’infographies qui sont publiées tous les jours. Cela dit, peu d’entre elles passent le cap de la journée sur les réseaux sociaux. La raison en est simple : elles présentent des données mais en fait ne révèlent pas la structure sous-jacente.

2) la phase de modélisation statique permet à l’entreprise d’apprendre collectivement ce qu’est le Big Data et surtout de commencer à sortir des so-whats des analyses. En effet un des freins principaux dans l’entreprise est le syndrome de la boite noire quant les outils sont trop sophistiqués ou bien les analyses menées beaucoup trop pointues : on ne comprend pas ce qui est fait, tout repose sur la confiance accordées aux “techniciens”, confiance qui n’est pas tout le temps là ou qui peut être perdue rapidement en cas de résultat évident (“tout ça pour ça”) ou de résultat localement inexact mais globalement faux (“les hommes achètent des couches pour bébé — oui mais entre 18h et 19h”)

3) Le “predictive modeling”, comme pour un oignon, est la couche suivante qui peut émerger pendant que la phase de modélisation statique murit et se propage dans l’entreprise. Attention, les modèles deviennent plus sophistiqués, c’est rare que les modèles linéaires suffisent à “sortir” des résultats pertinents

4) Une précision ici sur ce que l’on appelle “prédictif” car le terme a plusieurs sens (“polysémique”). La signification la plus courante est la production et l’utilisation de ces modèles pour faire des prévisions dans le temps. Et cela occulte la force principale d’un modèle prédictif : faire des “what-ifs” ou regarder l’impact de décisions, de choix, d’hypothèses de travail, … Et d’un point de vue business, c’est la hierarchisation des leviers d’action qui est peu exploitée : chaque allocation de ressource a un poids clairement déterminé et on est au coeur du métier pour rééquilibrer les efforts et définir quel est le niveau absolu optimal, au moins à ce moment-là, au moment où l’analyse a été menée.

Les freins et difficultés pour l’adoption du Big Analytics dans l’entreprise

En parallèle à la propagation de l’esprit Big Data, il est important d’être conscient des écueils les plus souvent rencontrer qui peuvent être des freins, des barrières et même des murs mettant en jeu la pérennité de l’entreprise sur le moyen terme au vue de la suprématie de cette compétence d’entreprise dans la lutte concurrentielle quotidienne.

1) Confusion entre corrélation et causalité.

Bien souvent la confusion est totale entre le taux de corrélation et la causalité des deux facteurs mis en perspective l’un avec l’autre. Le plus simple est de faire une démonstration par l’absurde et de donner l’exemple de l’évolution du prix du beurre avec l’âge du président de la république. La corrélation est bien de 90% mais il est évident que l’âge n’a aucune influence sur le prix du beurre, il n’y pas de causalité c’est à dire de relation de cause à effet entre les deux. Le point est fait mais c’est une attention de tous les instants à apporter à chaque graphe exel avec sa belle droite et son joli R2 : la causalité n’est pas là et le tri à plat laisse souvent de côté d’autres facteurs d’importance.

2) L’incompétence ou non-compétence du top management sur ces sujets

En fonction de l’âge des directeurs, de leur parcours, de leurs expériences plus ou moins réussies … les freins à une bonne utilisation du Big Data ou “Big Analytics” sont plus ou moins grands. Les traces négatives laissées par des initiatives prises avec des attentes trop fortes ou trop rapides sont durables. Seule une approche progressive et transparente peut les ramener dans un état d’esprit favorable. Est-il besoin d’ajouter qu’une sensibilité du président ou du DG à ces approches est un must qui fera toute la différence pour l’ensemble de l’entreprise ? Le Big Data est une des valeurs les plus saillantes pour les entreprises du futur … et comme le dit le proverbe chinois “le poisson pourrit par la tête” …

3) Le manque de compétence business des statisticiens

Autre bel écueil vécu dans de multiples entreprises … c’est la pensée que le Big Data est une affaire de spécialistes … Le problème de ces spécialistes est bien souvent leur manque complet de sens des affaires ou d’aller-retour entre ce qu’ils trouvent et ce que l’entreprise peut en faire. De manière plus large, ce qui fait défaut est l’évaluation de la pertinence communiquée spontanément par des modèles qui se retrouvent être “statistiquement juste mais opérationnellement faux”. Sans parler du jargon de genre “T-Stat”, “coéf de colinéarité”, “fonction sigmoïde” …
La solution ? Des équipes mix ou des binômes “expert big data — heures de vol business” que ce soit pour le CRM, les forces de ventes, le merchandising, les prévisions de vente …. et surtout pas de “data scientists” esseulés …

Pour des exemples de big data pratiqué pour des grandes surfaces américaines, pour Danone, pour un grand de l’électronique mondiale et pour un leader de l’industrie pharmaceutique :
http://pierre-paperon.blogspot.fr/2014/01/quel-est-le-potentiel-dun-point-de.html
http://pierre-paperon.blogspot.fr/2014/01/quel-est-le-potentiel-dun-point-de_16.html

Welcome to a place where words matter. On Medium, smart voices and original ideas take center stage - with no ads in sight. Watch
Follow all the topics you care about, and we’ll deliver the best stories for you to your homepage and inbox. Explore
Get unlimited access to the best stories on Medium — and support writers while you’re at it. Just $5/month. Upgrade