Rebond mou pour Macron et Mélenchon à J-8 semaines selon GoogleTrends
1. Les volumes totaux de recherche sur les candidats à nouveau en hausse grâce à l’alliance Bayrou-Macron et à l’Emission Politique de Mélenchon
La décrue des volumes de recherche à la suite de la conclusion du buzz lié au Penelope Gate depuis le 6 février est maintenant stoppée.

La hausse moyenne hebdomadaire du trafic touche son plus bas depuis le début de l’année en chutant en deux semaines de 30% à 12%.
2. Les tendances cusum — analyse purement quantitative
Le message général des courbes Cusum est que les évenements de cette semaine, tels
- l’alliance Bayrou-Macron,
- la visite à Beyrouth et le passage au 20 heures de TF1 de Marine Le Pen
- l’Emission Politique de France 2 pour Jean-Luc Mélenchon
- dans une moindre mesure en raison du caractère très récent de l’annonce, l’ouverture d’informations judiciaires pour François Fillon
confirment les profils des candidats décrits dans notre post précédent. Un post que je vous conseille de lire pour bien comprendre l’update de cette semaine. Vous retrouverez en fin de ce post aussi un rappel sur la méthode du modèle Google Trends.
Aussi peut-on vraissemblablement conclure que même si Emmanuel Macron et Jean-Luc Mélenchon obtiennent des inversements de tendance, ceux-ci ne sont pas assez prononcés pour améliorer leurs catégorisations de “bon troisième”.
Observez sur les courbes de cette semaine combien Marine Le Pen profite plus de son voyage à Beyrouth et de son journal télévisé que Jean-Luc Mélenchon et Emmanuel Macron profitent de leurs propres événements pourtant percus à la lumière du narratif médiatique comme peut-être plus importants.
2.1. Fillon et Hamon en tendance négative
Observez la pente négative des courbes sur la droite.
Pour Benoît Hamon, c’est la continuation de la pente savonneuse. François Fillon,lui, voit son socle de résonance essentiellement mobilisé par les nouvelles autour du Penelope Gate commencer à s’éroder. L’érosion est très claire depuis l’alliance Bayrou-Macron où ce dernier vient dépasser François Fillon en tête des recherches pour 24 heures. Néanmoins la pente de la courbe négative est faible si bien que ce n’est pas un effondrement pour François Fillon.
Notons que l’ouverture des informations judiciaires est un événement trop récent pour être pleinement transformé en résonance Google. Nous en verrons l’effet complet la semaine prochaine, possiblement avec un retour à une tendance stable pour François Fillon.

2.2 Mélenchon et Macron redressent un peu la barre — tendance positive
Les deux font la paire en terme de résonance GoogleTrends. La colline redevient une vallée. Mélenchon et Macron profitent de leurs événements, passent en tendance positive mais il n’y a là encore aucune rupture ou décollage.
En particulier, comparez pour Jean-Luc Mélenchon combien la pente de sa courbe est bien moins forte que celle de Marine Le Pen au 9 février (voir la courbe au §2.3) pour leurs passages respectifs à l’Emission Politique de France 2 — événement médiatique phare de la campagne présidentielle.
Le rebond de Jean-Luc Mélenchon et Emmanuel Macron est donc plutôt mou et pourrait être éphémère.

2.3 La dynamique bleue marine se confirme
Observez combien Marine Le Pen parvient à capitaliser sa résonance en plaçant sa performance passée toujours plus dans la zone négative pendant que la droite de la courbe est constituée de pentes positives fortes ou moyennes suivies d’horizontales. Ce phénomène est observable depuis son passage à l’Emission Politique sur France 2 le 9 février.
La dynamique est pour la deuxième semaine consécutive du côté du Front National. Sa visite au Liban et son passage au 20 Heures de TF1 ont largement profité à Marine Le Pen. Elle confirme donc son profil de gagnante, dans la définition de notre post précédent.

3. les projections si le vote avait lieu demain
In fine, peu de changement depuis notre post d’il y a deux semaines. Juste Benoît Hamon confirme son effondrement, illustré par des probabilités divisées par trois d’accéder au deuxième tour. Marine Le Pen confirme sa force et augmente sa probabilité maximum d’accéder au deuxième tour de 50% à 56%.
Voici les niveaux de confiance pour les scénarios de deuxième tour dans notre échiquier des simulations :

Voici les moyennes des scores dans les deux scénarios les plus probables Fillon-Le Pen et Fillon devant Macron dans nos deux configurations sur l’échiquier des simulations.

Suivons un instant le narratif médiatique selon lequel au deuxième tour Emmanuel Macron l’emporterait contre tous les candidats; et de même pour François Fillon à l’exception d’Emmanuel Macron.
Alors le modèle voit des probabilités quasi-égales entre François Fillon et Emmanuel Macron de devenir le prochain Président de la République entre grosso-modo 30% et 70% sur deux configurations dont nous ne pouvons dire laquelle sera la bonne le jour du scrutin.

Rappel sur la méthode Cusum
J’utilise la méthode dite de “cusum” que j’ai apprise et utilisée à outrance dans l’industrie aéronautique. Ce n’est pas une méthode de puriste statisticien mais plutôt de praticien opérationnel. Dans l’industrie il s’agit de se donner les moyens de réagir immédiatement à toute dérive des procédés industriels afin de protéger le client, en termes de qualité et de cadence de production. Le “cusum” est une méthode extrêmement simple qui amplifie les dérives afin de les rendre visibles à l’oeil avant que la statistique ne puisse les constater.
Ici, j’analyse l’intensité Google Trends relative de recherche sur les candidats principaux de la présidentielle. La valeur cible individuelle dite de contrôle de la fonction “cusum” est l’intensité relative totale de recherche Google Trends du candidat donné. Je normalise la valeur à un index 100 au début de l’analyse. C’est ainsi que ce faisant, je fournis un graphe qui indique la tendance individuelle dans l’opinion pour la présidentielle dans son ensemble pour autant que l’on s’accorde sur la valeur prédictive des recherches sur Google. Techniquement, une pente positive de la courbe indique une tendance positive, ergo un trafic relatif à l’instant t supérieur au trafic total et vice-versa. La droite du graphique indique logiquement la tendance actuelle.
Mon hypothèse majeure est que les recherches Google sur les candidats de la présidentielle illustrent la curiosité vis à vis de ceux-ci mais sont aussi un précurseur de la formation de l’opinion. Dans l’analyse “cusum” des tendances, aucun facteur de correction du buzz n’est employé par soucis de simplicité et je me penche plutôt sur la décomposition dans le temps pour chaque candidat de son intensité relative de recherche et non sur le mix entre candidats. Je corrige les données dans d’autres posts tels celui-ci, afin de prédire les résultats avec des facteurs de correction liés à l’écart sociologique entre population internaute et l’électorat ainsi qu’un facteur qualitatif de polarisation individuel à chaque candidat.
La simplicité de la méthode purement quantitative est aussi sa faiblesse : je ne donne aucune considération de la qualité du buzz dans la courbe cusum. Cette hypothèse forte est une épée de Damoclès sur la qualité prédictive des affirmations, tout particulièrement pour le cas François Fillon depuis le Penelope Gate. Aussi le retour de la réalité le soir du 23 avril nous donnera une indication si plus de programmation pour nettoyer le buzz sera nécessaire dans l’analyse des tendances.
Rappel méthodique sur le modèle pour les projections :
Je suis convaincu que les données brutes GoogleTrends cumulées sur une période de deux mois ne représentent qu’approximativement la réalité de l’opinion :
Si bien que j’ai développé ma “Data Driven Story” pour corriger le tir en suivant les enseignements de Nate Silver dans son livre “the signal and the noise”. Celle-ci est basée essentiellement sur trois éléments :
- la sociologie des internautes est présumée autour des 18–24 ans. Je clusterise les candidats dans une catégorie de positionnement pour établir une équivalence avec l’étalon de correction, le premier tour de la présidentielle de 2012. Puis je corrige les données Google Trends en fonction d’études sociologiques IFOP-IPSOS du vote de 2012.
- De plus, chaque candidat possède un potentiel de polarisation individuel. La sociologie n’arrive pas à expliquer à elle seule l’écart de Google Trends en 2012. Je présume d’une capacité des candidats à susciter du trafic “touristique” au delà de l’expression d’un interêt et support authentique dans les recherches Google. Pensez par exemple à l’histoire des pains au chocolat de Jean-François Copé. J’ai donc catégorisé les candidats dans des potentiels étalonnés à 2012 entre “très négatif”, “négatif”, “légérement négatif”, “fort” et “très fort”.
- Je considère la possibilité d’erreurs significatives sur les corrections et la valeur Google Trends elles-même. Ainsi j’étends le modèle et opère 21 000 simulations dites de “Monte-Carlo” en introduisant des erreurs aléatoires sur les facteurs. Ceci me permet de nommer un niveau de confiance en comptant le nombre de simulations autour d’une affirmation et donc aussi de parler de robustesse du modèle lorsqu’une affirmation est visible dans plus de 80% des simulations. De plus je développe un échiquier des simulations avec plusieurs configurations plausibles des facteurs identifiés plus hauts (vote “anti-système”, “Macron-Mania”).
- vous trouverez dans ces posts sur Jean-Luc Mélenchon et Emmanuel Macron plus de chiffres sur le modèle.
- Finalement ajoutons, que cette méthode m’a permis de prévoir la victoire de type “landslide” et le score de François Fillon au premier tour de sa primaire.
Voici le résumé de mes paramètres pour les deux configurations “anti-système” et “Macron-Mania”.

Notons une interprétation supplémentaire de mon facteur de polarisation médiatique. Le dernier sondage IFOP du 6 février donne des indications sur la diversité de la sureté de choix de l’électorat entre les candidats. Je n’ai pas utilisé cette information pour décider de mes facteurs jusqu’à aujourd’hui, mais je note une corrélation négative intéressante entre ce facteur et mon facteur de polarisation : celui-ci peut donc être au mieux interprété comme une combinaison de potentiel de curiosité, d’un vote utile et en négatif de sureté de choix.
Pour refléter au mieux la force de Marine Le Pen dans toutes les enquêtes d’opinion, et en cohérence avec un taux de sureté de choix de plus de 80% de son électorat, je déplace le curseur pour Marine Le Pen de potentiel légèrement négatif à très négatif; ce qui enfle son intensité relative GoogleTrends au maximum de mon étalon du scrutin de 2012.
Pour Jean-Luc Mélenchon nous testons le risque d’être, dans son électorat progressiste jeune, victime d’un leger vote utile au profit d’Emmanuel Macron (configuration Macron-Mania). Nous modélisons aussi l’incertitude quant à la catégorie d’Emmanuel Macron. Nos analyses précédentes corroborent au minimum un potentiel de polarisation fort. Je lis dans le sondage que son électorat est très fluide et peu sûr de son choix. Je teste ainsi la configuration “anti-système” où il subit un facteur de polarisation très fort ou au contraire transforme résonance en vote dans la configuration “Macron-Mania” avec un potentiel légèrement négatif.
Quant à Benoit Hamon, seulement 40% de son électorat est sûr de son choix, nous le plaçons en potentiel fort, en cohérence aussi avec son status de représentant du Parti Socialiste, pouvoir sortant et donc à même de subir les conséquences d’un désir d’alternance. Finalement depuis le Penelope Gate et le choix d’un frondeur comme candidat du PS, j’élimine les configurations avec vote utile pour la droite et gauche classique. Rappelons que François Fillon est maintenant en facteur de polarisation très fort, ce qui en gros au total élimine la moitié de son trafic. Ceci a le but de déduire le “mauvais cholestérol”, curiosité & Co dans le trafic.
