BACK TO BASICS : L’art délicat de la typologie…

Comment découper un ensemble d’individus en sous-groupes homogènes ?

Le marketing a toujours eu l’intuition plus ou moins frustrante qu’il lui était impossible de proposer une offre parfaitement conçue pour correspondre aux attentes de chaque client potentiel. Depuis Henry Ford et l’expérience de l’impersonnalisable Ford T, notre métier consiste à concilier les avantages de ces deux conceptions, autrement dit industrialiser au maximum la production tout en minimisant le sentiment de standardisation impersonnelle et donc en maximisant la satisfaction des besoins individuels (cet optimum peut notamment correspondre à la maximisation de la rentabilité des coûts de production). En tant que quantitativistes, nous répondons à cet objectif par le recueil de données quantitatives individuelles, que nous allons sélectionner, synthétiser, partitionner, interpréter et enfin raconter, dans cet ordre, avec parfois quelques retours en arrière afin de tester plusieurs versions. Car là est le problème, si on est un tant soit peu perfectionniste : difficile dans cet exercice d’avoir des certitudes et donc d’être parfaitement satisfait.

Le mythe du Grand Horloger

Sélectionner. Choisir le périmètre de mesures ou dimensions à partir duquel seront rapprochés puis regroupés les individus. Voilà une étape absolument non technique, qui devrait être réalisée aisément par les commanditaires opérationnels.

Image for post
Image for post

La tentation est grande, au sortir d’un terrain intégrant plusieurs dizaines de questions, de tout proposer à l’analyse typologique, afin qu’un algorithme magique synthétise l’ensemble. Malheureusement, plus il y a de données, plus la synthèse est complexe, y compris pour un algorithme, ou, plus exactement, moins il y a de chances que le résultat soit aisément compréhensible et conforme aux attentes. Cela tient au fait que la “synthèse” mathématique s’appuie alors un peu, pour chaque axe, sur chaque variable.

D’autant que ce refus de choix a priori correspond rarement à une incapacité de choix. Il est aisé de s’en rendre compte lors de la livraison du “premier jet” (génération à partir de l’ensemble des réponses) de l’analyse. Les opérationnels avouent souvent alors qu’ils s’attendaient à un poids plus important de telle section… que telle classe soit découpée selon telle variable jusque-là peu décisive… Pourquoi la dimension comportementale du questionnaire est-elle si déterminante dans la distinction des classes ? Pourquoi les classes sont-elles si peu différentes en terme d’âge moyen ?

Oui, mais voilà, toutes ces mesures introduites dans l’analyse ont dilué l’importance des données clés. Au lieu de découper sur un agrégat composite d’une centaine de variables, réduire l’analyse typologique à une vingtaine permet de se focaliser sur des différences essentielles fonctionnellement. Ce travail de sélection préalable est aussi l’occasion d’un passage de témoin plus riche entre opérationnels et data scientists et ainsi éviter que l’étape statistique soit totalement “hors sol”. Cet échange sur un set de données limité est également le moment d’une réflexion sur la forme sous laquelle introduire chacune d’entre elles : regroupement de modalités, exclusion de points extrêmes, construction de ratios…

Exemple : Typologie d’IRIS à partir des caractéristiques socio-économiques des résidents issues de leurs réponses au Recensement de l’INSEE.

Image for post
Image for post
Cartographie d’une typologie des IRIS

Cette version est obtenue à partir d’une poignée de variables. Elle restitue néanmoins des différences entre classes (profils sociodémographiques des résidents) sur de nombreuses variables non introduites dans la typologie, différences difficiles à obtenir dans le cas d’une typologie construite à partir d’un set plus important de critères.

Combien de coudes voyez-vous ?

Synthétiser. Cette étape correspond à un ensemble de méthodes généralement désignées par le terme “analyses factorielles”, en composantes principales, en composantes multiples, canonique et bien d’autres variantes encore. Mais à quel point résumer l’information contenue dans le nuage de données ? La même question se repose lors de la constitution des classes. Faut-il découper la population en 5 classes ? 10 ? 15 ? 50 ? 100 ?

Image for post
Image for post
Graphique des valeurs propres

Les statisticiens se penchent depuis longtemps sur la question du découpage optimal, mais optimal au regard de l’expression mathématique et non sur un plan opérationnel.

D’un point de vue méthodologique, aucun critère objectif ne fait en réalité l’unanimité. L’un des plus employés est le critère du “coude”, argument “visuel” issu de l’observation du graphe associant une quantité d’information initiale contenue dans chaque axe (j’alerte par ailleurs sur le fait que les abscisses étant discrètes, il y a techniquement de multiples “coudes”) Les autres critères classiques (valeurs propres supérieures à 1, parts de variances supérieures à 1/n…) ne résolvent pas davantage le problème. Résumer un peu ou beaucoup devrait avant tout être une décision des opérationnels. Et cela les aiderait certainement à mieux piloter ces analyses et, de projet en projet, développer des compétences contre-balançant leurs a priori méthodologiques : pourquoi introduire une centaine de variables et ne retenir que trois axes ? L’étude serait infiniment riche mais un algorithme inconnu parviendrait à en extraire l’essentiel en trois mystérieuses dimensions…

La primauté du fonctionnel sur le nombre de segments retenu est aisément compréhensible pour un professionnel du marketing. Le découpage idéal correspond approximativement au nombre d’offres qu’il pourra adresser. A quoi bon retenir cinq classes si chaque chargé de clientèle affecte intuitivement les clients de son portefeuille à dix groupes ? A quoi bon a contrario proposer vingt segments si l’entreprise sait qu’elle ne pourra pas répondre à plus de cinq ou six comportements-types ?

Le choix des opérationnels peut d’ailleurs être plus fin qu’un nombre de classes global. Il peut ainsi souhaiter découper bien plus l’urbain que le rural, ou inversement, selon l’intérêt de ces zones pour son activité. Il n’y a là aucun scrupule méthodologique à avoir. Surtout si ses définitions de rural et urbain sont issues d’une analyse statistique du processus typologique.

LA typologie ou NOTRE typologie : une retenue parmi d’innombrables

Découper. Interpréter les classes. Revenir en arrière. Essayer autre chose. Redécouper. Ré-interpréter. Et ainsi de suite… Processus itératif qui permet de construire progressivement la segmentation et accepter les compromis qu’elle propose. Quelques astuces et une idée claire de la démarche.

Image for post
Image for post
Heatmap (partiel) Classes-Attributs — (avec un algorithme de tris conjoint des lignes et des colonnes)

Lors de cette étape, il faut être capable de raccourcir le temps d’interprétation. Pour cela, nous recommandons de commencer par les classes extrêmes, plus faciles à identifier, et leur donner un nom. Notre conseil est de s’appuyer avant tout sur un tableau descriptif de l’ensemble des classes, type heatmap (ou un graphe en coordonnées parallèles), afin de se concentrer visuellement sur la signature de chaque classe, comparativement à toutes les autres. En ne retenant à nouveau que les données les plus importantes. Il sera toujours temps, ultérieurement, si cette version s’avère prometteuse, de décliner l’analyse sur davantage de variables.

Une fois les premiers segments nommés, concentrez-vous sur ceux qui leur ressemblent et mettent en danger cette version de la typologie. Essayez alors de les qualifier. Si possible sans multiplier les recours au dictionnaire des synonymes, afin de privilégier une interprétation opérationnelle.

Enfin, le cas malheureusement courant de la classe centrale du nuage : “les moyens”, “les autres”. Si une telle classe est inacceptable opérationnellement, il est essentiel de l’identifier dès que possible et ne pas travailler sur des versions de segmentation inadéquates. Le cas de retouches a posteriori consistant à masquer le problème et supprimer ledit segment et réaffecter ses individus aux autres doit absolument être évité.

En tout état de cause, tester dix ou mille segmentations ne vous épargnera pas l’ultime étape : celle du renoncement et de la validation d’un découpage. Autant y être prêt dès le départ ! Seuls ceux qui n’ont jamais réalisé de typologie disent aisément “LA typologie obtenue”.

Chacun de nous appartient un peu à chaque classe

Interpréter. Quels éléments distinguent chaque classe des autres, dont sa voisine la plus proche ?

Les classes issues de tels algorithmes ne sont pas pures, quelle que soit la variable considérée. D’où le langage souvent utilisé de sur- ou sous- représentations. Autrement dit, lorsqu’une classe est intitulée “Jeunes cadres hyperconnectés”, cela signifie qu’on y trouve davantage que dans les autres classes ces profils. Les autres segments peuvent en contenir également. Et ce segment contenir d’autres profils, potentiellement très différents.

Ces classes “impures” peuvent être un problème dans certains cas. Il est néanmoins possible de contourner ce problème. La constitution des classes lors des étapes décrites précédemment a permis d’identifier les principales combinaisons d’attributs qu’il était souhaitable de distinguer. Une fois les classes construites, elles peuvent être “caricaturées”, autrement dit transformées de descriptions par des sur-représentations en des critères. Une classe intitulée “Jeunes cadres hyperconnectés” ne contiendrait que ce profil, qui ne se retrouverait dans aucun autre segment.

Si l’objet de ces segments est descriptif, les sur-représentations peuvent être parfaites. Si il s’agit de qualifier un prospect lors d’un premier rendez-vous pour adapter discours et offres prioritaires, des classes “caricaturées” sont souvent plus simples à prendre en main et utiliser. En revanche, lorsque l’actionnabilité de la segmentation n’est pas compromise, pourquoi se priver de la finesse multidimensionnelle ?

Dans tous les cas, nous recommandons à nos clients de ne pas considérer la segmentation comme la fin d’un process mais un début. Ils doivent alors se demander comment passer le témoin aux équipes en aval, comment retrouver chaque classe en base, dans une autre étude ou bien à la sortie des caisses du supermarché…

Résumer une histoire ne dispense pas d’en raconter une

Raconter. Chaque classe doit désormais raconter un comportement et donc une histoire ou une famille d’histoires proches. Autrement dit, l’exercice de restitution d’une typologie doit profiter de l’ensemble de la démarche et des étapes décrites précédemment, afin de susciter l’adhésion de publics n’ayant pas participé au processus de construction, ayant leurs propres attentes et devant, à partir de celles-ci arriver au compromis proposé.

L’objectif d’une segmentation est de regrouper des profils proches, tout en éloignant le plus possible ceux distincts. Une fois les segments constitués, comment profiter de cette synthèse au sein d’une classe, sans masquer la richesse et la diversité des profils ainsi réunis ? L’analyse typologique n’a pas pour but d’effacer cette richesse mais en proposer une synthèse “optimale”. La restitution doit donc le plus possible être l’occasion de partager à la fois sur les segments produits mais également sur les “sacrifices” que ce niveau de résumé sous-tendent. Cet échange est souvent un moyen de faire basculer cette présentation vers l’intégration de la typologie proposée à l’ensemble des process potentiellement impactés ou pouvant en profiter.

L’hétérogénéité d’une classe sur un indicateur est aisée à mesurer et visualiser. Elle correspond à la variance intraclasse dudit indicateur. Mais l’hétérogénéité des profils, en tenant compte de différents critères, ne se résume pas aux variances considérées variable par variable.

Une démarche intéressante pour rendre compte de cette hétérogénéité est de sous-segmenter chaque classe. Il est alors intéressant de décrire chaque sous-classe afin de qualifier les sous-profils réunis derrière le profil de classe générique. Il est également possible de produire un indicateur de “dissemblance” (par exemple un test statistique de structure) des sous-classes afin de quantifier leur “variété de profils”,.

Cette approche peut même être simplifiée, en terme de rendus. En présentant par exemple le parangon (individu caractéristique, autrement dit le plus proche du profil-type) de chaque sous-classe. Ceci permet d’avoir un profil moyen et quelques exemples réels et distincts regroupés et donc dissimulés derrière cette moyenne. Cet artifice permet souvent de dynamiser le rendu et raconter une histoire dépassant les variables de départ, en observant le parcours, l’attitude, la signalétique des individus choisis.

Dans le cas de segmentations construites sur des données issues d’enquêtes, nous recommandons également de ne pas oublier l’exploitation des questions ouvertes, souvent parfaites pour restituer la richesse des réponses et individus affectés à un segment.

Mapping extrait de notre article sur le “Grand Débat”

Des outils sans échec et pourtant…

Il existe malgré tout des cas où le processus ne parvient pas à atteindre ses objectifs. L’un des exemples que nous rencontrons fréquemment consiste en la recherche inconsciente d’une segmentation par-delà les variables introduites : une segmentation des liens entre une ou quelques variable(s) d’intérêt et des variables qui peuvent les influencer.

Exemple : Quels segments construire pour augmenter la satisfaction de mes clients ?

Répondre à cette question à partir du profil signalétique, du comportement, de la note de satisfaction globale et de celles par dimension de l’expérience client (accueil, amabilité, qualité de service, rapidité de prise en charge…) de mon activité est une tâche complexe.

Réponse classique : La pratique usuelle est de construire une segmentation des individus à partir de leurs satisfactions par dimension de l’expérience client et espérer que les classes ainsi construites regroupent des individus, ayant non seulement des notes de satisfaction proches mais des leviers (dimensions de l’expérience client sur lesquelles il est possible d’agir, porter un effort) pouvant augmenter leur satisfaction globale similaires. Auquel cas il “suffit” d’estimer un modèle statistique de la satisfaction globale par classe… Mais l’hypothèse préalable est souvent loin d’être validée. Et les leviers ainsi produits ne sont pas satisfaisants. Rien de surprenant à cela. Pourquoi les segments obtenus rendraient-ils compte de leviers non pris en compte dans la construction de la typologie ?

Toutes les segmentations réalisées ayant pour objectif de proposer des leviers d’action différenciés segment par segment, permettant d’augmenter la performance sur un indicateur ou quelques-uns sont à ranger dans le cas décrit plus haut. k-mino propose pour résoudre ce problème beaucoup plus fréquent qu’il n’y paraît une solution innovante appelée “Cibles et Leviers”.

Notre prochain article abordera justement en détail cette problématique ainsi que les solutions que propose k-mino à cet effet.

Références :

Written by

L’IA au service de l’expertise métier.

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store